martes, 24 de mayo de 2016

Que aprenda la máquina, mi pueblo me necesita

El otro día encontré un supuesto argumento en contra de las instituciones de educación superiores.  Un supuesto rastro histórico en el que se pretende optimizar recursos. Tratando de pasar de una escala lineal a un polinómica.  En teoría, si quiero ser panadero, debo pedir a un maestro panadero (maitre pannisiere) que me reciba como su acólito.  Supongo que basado en el dicho popular "si quieres saber bailar, entonces baila", "si quieres poder nadar, entonces tienes que hecharte al agua y practicar".  El problema en realidad sería la escalabilidad.
Una solución era poner a un maestro y a 30,40, 60, etc., personas para ocupar mejor los recursos. Los posibles problemas son que al finalizar las formaciones muchas veces se tiene personas con buena memoria pero con muy poco de práctica.
El artículo explicaba el porqué del fracaso de los MOCs (masive open courses), o cursos abiertos masivos.
Bueno, resulta que al momento estoy enlistado en unos cuantos cursos en línea, con la historia de tener experiencia en al menos uno de estos MOCs.
En Edx estoy siguiendo 3 cursos, que no he tocado en varios meses.
ESRI me propuso otro pero nunca me contactaron (eso creo).
También existe Cursera y muchos otros sitios.
Por ejemplo, es posible acceder a los cursos del MIT mediante su plataforma OCW. Sin ninguna duda una interesante apuesta por la humanidad.
Es como si el conocimiento esta allí, pero tienes que ir por él.

En este momento me encuentro leyendo el material de uno de los cursos en aprendizaje de máquinas y la tarea es leer el artículo del Señor Pedro Domingos sobre "Algunas cosas que saber sobre el aprendizaje de máquinas" con DOI: doi:10.1145/ 2347736.2347755

Aprendizaje = representación + Evaluación + Optimización

Cada una de la fases tiene muchos métodos y en algunas ocasiones los unos dependen de los otros. Es decir un método de representación solo puede ser usado o hacer sentido con algunos de los métodos de evaluación.
- La generalización es lo que importa. Lograr  que nuestra configuración funcione bien con datos que no se utilizaron en el entrenamiento. Y que los resultados sean mejores que una elección al hazar.
- Los datos solos no bastan. Los aprendices son más como el cultivo. Se deja que la naturaleza haga el trabajo, los aprendices combinan conocimiento con datos para cultivar o hacer crecer programas.
- Sobreencajar tiene muchas caras. La computadora puede ver muchas relaciones que no son existentes basandose en los datos, el resultado es alucinaciones. Se puede expresar en forma de "prejuicio y varianza". Prejuicio(Bias) es aprender sistemáticamente la misma cosa incorrecta. y Varianza es aprender cosas al hazar sin respetar la señal de base.
- No intuición en multidimencional.

No hay comentarios:

Publicar un comentario