martes, 20 de junio de 2017

En búsqueda de los datos abiertos

En alguna ocasión hablé con mi amigo Razvan sobre su pasantía en informática en una empresa de bici pública. Su trabajo consistía en encontrar métodos para depurar la información almacenada por los sensores de la bicicleta.  De hecho las bicicletas tenían una batería y algo de memoria y procesamiento para registrar los valores de velocidad, distancia, en algunos casos posición? Y luego con los datos depurados se procedía a analizar y encontrar información importante sobre el uso del sistema.
Un ejemplo de error sería: uno de los sensores indica un viaje de 100 km en el tiempo de una hora.
Hace poco, me encontré con alguien de Guadalajara México y me comentaba sobre su trabajo a cargo de la empresa que brinda el servicio de bici pública en esa ciudad. Según me explicó, en 2010 el censo indicó que la población es de al rededor de 6 millones de personas en su ciudad.
El sitio web para obtener más información sobre la bici pública es:

https://www.mibici.net/es/

236 estaciones y 2000 bicicletas.

El punto interesante fue mi sorpresa al preguntar sobre la información del uso con respecto al tiempo. Al parecer la información está disponible en el sitio web para que los curiosos como yo la puedan descargar y ver si pueden hacer cosas interesantes con ella. A continuación la dirección:

https://www.mibici.net/es/datos-abiertos/

20 500 personas registradas y 2.5 millones de viajes.

Además me contaron que también han realizado algunos hackatrones para ver con qué salen las personas al darles tal cantidad de datos para jugar. Talvez mapas de calor o algún otro tipo de comportamiento desde la extracción de datos.  Un hackatron, es una especie de festival en dónde se trata de manipular o explotar nuestro cococimiento de un algo  o un sistema para que haga algo completamente nuevo o diferente, es este caso es encontrar datos curiosos sobre el uso del sistema de bici pública en la ciudad.
 Al parecer las personas sacan la bicicleta para realizar vueltas cortas de al rededor de 15 minutos y por lo general vuelven a dejar la bicicleta en la misma estación.
Quién sabe y se trata de datos valiosos para realizar ejercicios de minería de datos (data mining) o algo más. Un caso interesante sin duda para ser examinado desde un punto de vista histórico; pasando por el desarrollo inicial (homemade) del sistema, hasta llegar a niveles de carga y de rendimiento que justifiquen el uso de infraestructura Canadiense de hardware y de software. Un caso de estudio para la ingeniería.
Es también un caso de estudio interesante cuando estamos a la puerta de la implementación de un sistema parecido en Cuenca-Ecuador y nos interesa la replicabilidad de los resultados.

No hay comentarios:

Publicar un comentario