Mostrando entradas con la etiqueta estadística. Mostrar todas las entradas
Mostrando entradas con la etiqueta estadística. Mostrar todas las entradas

viernes, 16 de febrero de 2018

EPOMM modal split y los datos ocultos.

Siempre los datos son un gran misterio. De hecho es por esa razón que es un tema recurrente en este blog. ¿Qué pasaría si hubiera acceso abierto, libre y gratuito a los datos?

Es así que encontré la herramienta

http://epomm.eu/tems/index.phtml

La cual refiere a un proyecto europeo (.eu) para el manejo de la movilidad EPOMM.
El sitio web presenta la separación modal o "modal split". Esto significa que se indica como se distribuye la movilidad en la ciudad.
Por ejemplo, los datos que conocemos sobre la movilidad están en el archivo publicado en:

http://www.cuenca.gob.ec/?q=system/files/PMEP_CUENCA_2015_tomo_I.pdf
Que refieren al plan de movilidad y espacios públicos para Cuenca (ver pag. 78).

Esta información, junto con el tamaño de la ciudad expresado en número de habitantes permite realizar comparaciones entre ciudades de igual "tamaño".

http://www.eltiempo.com.ec/noticias/cuenca/2/346342/este-ano-habra-580-000-habitantes-en-cuenca
Por lo pronto, en pleno año 2018 solo conocemos cual era la división modal para el año 2015.

Con lo que vuelvo al inicio de este post. Dónde está la información para el año 2016 y 2017? Un gran misterio.
Les recomiendo comparar ciudades de los Países Bajos con respecto a otras ciudades de igual tamaño. Y si hubieran datos de Cuenca, también los podríamos comparar.

 

viernes, 6 de octubre de 2017

Sobre la biomecánica y otras curiosidades

Siempre me ha parecido interesante el estudio de la biomecánica y sus implicaciones en otras ciencias. Lo más interesante era encontrar escritos publicados en los años 60 y 70 basados en el conocimiento adquirido en las repúblicas socialistas o soviéticas sobre esos temas. Inmediatamente me invadía la curiosidad sobre los métodos utilizados en esas épocas para poder capturar la información, pues, en los actuales momentos cada vez es más barato encontrar dispositivos que permiten registrar datos o valores relacionados con el deporte y se piensa que con el tiempo el análisis de grandes datos podrá permitir tener un plan de entrenamiento a medida según el estado actual de cada individuo.
Por ejemplo en el libro de Chris Carmichael y Jim Rutberg "the time-crunched triathlete" se especifican técnicas para obtener valores y rangos de carga para los sistemas corporales. En este caso, el entrenamiento consiste en cargar con actividad física al cuerpo y dejarle un tiempo de descanso para la adaptación. Como el cuerpo funciona con mecanismos evolutivos del menor esfuerzo la carga permite mejorar el rendimiento. Siendo uno de los principales problemas medir efectivamente cuánto se cargó a los sistemas corporales y cuándo y cuánto reposo es necesario para no sobrecargar los sistemas ni vagar demasiado como para perder la condición ganada. Es decir, entrar en otro campo que emociona a los humanos, el análisis de datos e información. En este libro se recomienda abiertamente el uso de medidores de potencia para el entrenamiento del ciclismo, ya que es una de las formas más seguras de medir las mejoras en los sistemas corporales. Todo indica que los medidores de potencia para ciclismo están bajando de precio y en el futuro quizás existan algunos al alcance de los deportistas amateur. 
De la misma manera, empresas como Garmin y Suunto ofrecen productos que se pueden utilizar en conjunto con planes de entrenamiento basados en frecuencia cardíaca. Esto debido a que el corazón y sus variaciones de frecuencia en los latidos sirve para evitar entrenamientos en fatiga. Si el cuerpo está cansado ningún entrenamiento será mejor que un buen reposo. Además de conocer que si un atleta se sobreentrena el proceso de recuperación será más largo de lo normal. Es decir se trata casi de un problema de investigación de operaciones dónde se pretende obtener el mejor entrenamiento basado en las restricciones de tiempo de reposo y condición corporal actual (frecuencia cardíaca).
Hace poco me enteré de la asociación de una empresa de rendimiento deportivo con grandes marcas de productos que incluyen varios tipos de sensores (GPS y frecuencia cardíaca), el producto resultante proviene del análisis de la frecuencia cardíaca y de la distancia y tiempo de la actividad física para estimar de mejor manera el estado de fatiga de los deportistas, algo no tan posible de realizar hasta hace poco.  Ver  por ejemplo: https://www.firstbeat.com/
Para posibles usos de los datos así como de una empresa que se dedica al análisis de los mismos en varios deportes.

martes, 20 de junio de 2017

En búsqueda de los datos abiertos

En alguna ocasión hablé con mi amigo Razvan sobre su pasantía en informática en una empresa de bici pública. Su trabajo consistía en encontrar métodos para depurar la información almacenada por los sensores de la bicicleta.  De hecho las bicicletas tenían una batería y algo de memoria y procesamiento para registrar los valores de velocidad, distancia, en algunos casos posición? Y luego con los datos depurados se procedía a analizar y encontrar información importante sobre el uso del sistema.
Un ejemplo de error sería: uno de los sensores indica un viaje de 100 km en el tiempo de una hora.
Hace poco, me encontré con alguien de Guadalajara México y me comentaba sobre su trabajo a cargo de la empresa que brinda el servicio de bici pública en esa ciudad. Según me explicó, en 2010 el censo indicó que la población es de al rededor de 6 millones de personas en su ciudad.
El sitio web para obtener más información sobre la bici pública es:

https://www.mibici.net/es/

236 estaciones y 2000 bicicletas.

El punto interesante fue mi sorpresa al preguntar sobre la información del uso con respecto al tiempo. Al parecer la información está disponible en el sitio web para que los curiosos como yo la puedan descargar y ver si pueden hacer cosas interesantes con ella. A continuación la dirección:

https://www.mibici.net/es/datos-abiertos/

20 500 personas registradas y 2.5 millones de viajes.

Además me contaron que también han realizado algunos hackatrones para ver con qué salen las personas al darles tal cantidad de datos para jugar. Talvez mapas de calor o algún otro tipo de comportamiento desde la extracción de datos.  Un hackatron, es una especie de festival en dónde se trata de manipular o explotar nuestro cococimiento de un algo  o un sistema para que haga algo completamente nuevo o diferente, es este caso es encontrar datos curiosos sobre el uso del sistema de bici pública en la ciudad.
 Al parecer las personas sacan la bicicleta para realizar vueltas cortas de al rededor de 15 minutos y por lo general vuelven a dejar la bicicleta en la misma estación.
Quién sabe y se trata de datos valiosos para realizar ejercicios de minería de datos (data mining) o algo más. Un caso interesante sin duda para ser examinado desde un punto de vista histórico; pasando por el desarrollo inicial (homemade) del sistema, hasta llegar a niveles de carga y de rendimiento que justifiquen el uso de infraestructura Canadiense de hardware y de software. Un caso de estudio para la ingeniería.
Es también un caso de estudio interesante cuando estamos a la puerta de la implementación de un sistema parecido en Cuenca-Ecuador y nos interesa la replicabilidad de los resultados.

jueves, 18 de julio de 2013

Mapa del autismo

El otro día me levanté y leí un artículo del times que hablaba de una posible relación entre las personas con carreras a fines a ingeniería e informática.
Obviamente el artículo no estaba disponible gratuitamente, pero alguna alma generosa la pirateó para nosotros.
Estadîsticamente hay una relación de personas del MIT y sus hijos con un tipo de autismo (si entendí bien el artículo).  Y más evidencia en Holanda en su Silicon Valley.  Se puede atribuir también a mejor infraestructura para albergar a personas con este estado. (es enfermedad??).
Y la curiosidad me viene nuevamente: Cual es el mapa del autismo en el Ecuador?
Es verdad que los ñoños somos más propensos a tener hijos con este tipo de condiciôn?
La verdad es que no sabemos el porque del aumento del autismo en el mundo.
No lo entendemos todavîa.
Un vídeo que habla de esto es presentado en TED, en el siguiente enlace:
http://www.ted.com/talks/juan_enriquez_will_our_kids_be_a_different_species.html

Y la verdad es que establecer las relaciones de causa y efecto no son tan sencillas.
Puede estar relacionados con factores extra, por ejemplo, si los padres realizan estudios universitarios largos sus edades son superiores a la media de la edad a la que otras personas se casan. Entonces podría no estar ligado a realizar o no estudios de ingeniería y o informática, sino a la edad de los progenitores.
Volviendo al Ecuador, cómo hacemos un plan del autismo?

1) ir al sitio del INEC y descargar la información que ellos me propusieron por twitter.
http://www.inec.gob.ec/estadisticas_sociales/Cam_Egre_Hos_2011/anuario.pdf 

Los datos están tabulados según el "CIE-10, Clasificación Estadística Internacional de Enfermedades y Problemas Relacionados con la Salud, Décima Revisión, Volumen 3, Índice alfabético"
2) Buscar como esta clasificado el autismo en esta lista:
Autismo – – autismo – ver Categorías F84.0–F84.1
Autismo, autista (infantil) (niñez) F84.0 – atípico F84.1
3) Ver que bajo el mismo grupo hay otras enfermedades como:
Trastorno autístico F84.0
Psicosis infantil F84.0
Psicosis infantil atípico F84.1
Retraso mental con rasgos autísticos F84.1
Enfermedad de Rett F84.2
Enfermedad de Heller F84.3
Psicosis desintegrativa (niñez) F84.3
Psicosis simbiótica (niñez) F84.3
Esquizofrenia  infantil F84.5
síndrome de la infancia NCOP
Kanner, enfermedad o síndrome de F84.0
Psicopatía  autística F84.5
Síndrome (de) Asperger F84.5
Síndrome esquizofrénico de la niñez NCOP F84.5

4) las tablas también muestran la morbilidad según las 298 causas  
Encontramos que la causa que nos interesa es:
Causa 119 : Otros trastornos mentales y del comportamiento: F04-F09, F50-F69, F80-F99
5) Todos los casos están registrados bajo la categoría siguiente:
Trastornos generalizados del desarrollo F84 p.177(cuadro 13), pag. 224(cuadro 14), pag. 270(cuadro 15).


6) Ver que la información es muy general y que basados en le punto 3, no se puede diferenciar solo los casos de autismo, sino todos bajo la categoría F84. Ademas, la información no se puede encontrar por provincia y/o cantón.


7) ni el el Consejo Nacional de Discapacidades (Conadis) ni la Asociación de Padres y Amigos para el Apoyo y la Defensa de los Derechos de las Personas con Autismo del Ecuador (APADA del Ecuador), muestran datos al respecto.

Si alguien sabe donde se puede encontrar más información seria muy bueno. 

Datos extras
Proporción Mundial 21:10 000
Proporción Ecuador  (estimado) 15 000: 15 000 000 o 1:1000 
2 de abril, Día del Autismo.