martes, 24 de mayo de 2016

Que aprenda la máquina, mi pueblo me necesita

El otro día encontré un supuesto argumento en contra de las instituciones de educación superiores.  Un supuesto rastro histórico en el que se pretende optimizar recursos. Tratando de pasar de una escala lineal a un polinómica.  En teoría, si quiero ser panadero, debo pedir a un maestro panadero (maitre pannisiere) que me reciba como su acólito.  Supongo que basado en el dicho popular "si quieres saber bailar, entonces baila", "si quieres poder nadar, entonces tienes que hecharte al agua y practicar".  El problema en realidad sería la escalabilidad.
Una solución era poner a un maestro y a 30,40, 60, etc., personas para ocupar mejor los recursos. Los posibles problemas son que al finalizar las formaciones muchas veces se tiene personas con buena memoria pero con muy poco de práctica.
El artículo explicaba el porqué del fracaso de los MOCs (masive open courses), o cursos abiertos masivos.
Bueno, resulta que al momento estoy enlistado en unos cuantos cursos en línea, con la historia de tener experiencia en al menos uno de estos MOCs.
En Edx estoy siguiendo 3 cursos, que no he tocado en varios meses.
ESRI me propuso otro pero nunca me contactaron (eso creo).
También existe Cursera y muchos otros sitios.
Por ejemplo, es posible acceder a los cursos del MIT mediante su plataforma OCW. Sin ninguna duda una interesante apuesta por la humanidad.
Es como si el conocimiento esta allí, pero tienes que ir por él.

En este momento me encuentro leyendo el material de uno de los cursos en aprendizaje de máquinas y la tarea es leer el artículo del Señor Pedro Domingos sobre "Algunas cosas que saber sobre el aprendizaje de máquinas" con DOI: doi:10.1145/ 2347736.2347755

Aprendizaje = representación + Evaluación + Optimización

Cada una de la fases tiene muchos métodos y en algunas ocasiones los unos dependen de los otros. Es decir un método de representación solo puede ser usado o hacer sentido con algunos de los métodos de evaluación.
- La generalización es lo que importa. Lograr  que nuestra configuración funcione bien con datos que no se utilizaron en el entrenamiento. Y que los resultados sean mejores que una elección al hazar.
- Los datos solos no bastan. Los aprendices son más como el cultivo. Se deja que la naturaleza haga el trabajo, los aprendices combinan conocimiento con datos para cultivar o hacer crecer programas.
- Sobreencajar tiene muchas caras. La computadora puede ver muchas relaciones que no son existentes basandose en los datos, el resultado es alucinaciones. Se puede expresar en forma de "prejuicio y varianza". Prejuicio(Bias) es aprender sistemáticamente la misma cosa incorrecta. y Varianza es aprender cosas al hazar sin respetar la señal de base.
- No intuición en multidimencional.

Estadías de investigación en Alemania

Desea hacer una estadía de investigación en algún laboratorio o Universidad en Alemania?

http://www.research-explorer.de/research_explorer.en.html


viernes, 13 de mayo de 2016

crowdsourcing data, el poder de la gente

Hace tiempo tengo esta idea de que los smartphones deberían ser utilizados para algo más que compartir fotos de personas deseosas de llamar la atención.

He pensado y trabajado en un prototipo para recolectar la información.
De cualquier forma como indica dilbert cada vez habrá más personas con las mismas ideas y muchas de ellas efectivamente realizaran lo que esta en su mente.

Hoy encontré mi idea implementada por uno ingleses. El enlace es:

http://weathersignal.com/about/

Pero no existe información sobre mi tierra. Debería hacer campaña para utilizar lo que ya existe con sus respectivos problemas, o mejor luchar por tener una plataforma nacional?  ¿Qué es mejor en términos de rendimiento?