Mostrando entradas con la etiqueta bases de datos. Mostrar todas las entradas
Mostrando entradas con la etiqueta bases de datos. Mostrar todas las entradas

miércoles, 26 de abril de 2023

grafiquitos y plataformas con datos abiertos NOAA y UMaine

 Estaba leyendo la noticia del guardian (https://www.theguardian.com/environment/2023/apr/26/accelerating-ocean-warming-earth-temperatures-climate-crisis) y obviamente encontré los datos históricos de temperatura del océano.

Siendo las referencias más interesantes las siguientes:

- Datos interpolados del NOAA https://www.ncei.noaa.gov/products/optimum-interpolation-sst  

- Una visualización https://www.ncei.noaa.gov/products/climate-data-records/sea-surface-temperature-optimum-interpolation


- otro sitio con las series de tiempo y figuras por parte de la universidad de Maine https://climatereanalyzer.org/clim/sst_daily/


Recomendadísima la comparativa de temperatura anual y sus valores fuera de serie para este mes. 



lunes, 29 de agosto de 2022

deporte y datos anuales

 Hace poco me enteré de una base de datos sobre las lesiones de los triatletas, bueno con datos de estados unidos me parece. 

Quizás algún día tengamos una base de datos mundial con datos de ecuatorianos.

la dirección es:

https://globaltrisafety.org/


Iniciativa de la universidad de Washington

jueves, 20 de enero de 2022

Datos abiertos Ecuador 2022, reinventando la rueda

 En 2022 el gobierno lanzó un nuevo portal para centralizar los esfuerzos por ofrecer datos abiertos sobre temas que cada institución pública posea. 

El enlace al portal actual  es:

https://datosabiertos.planificacion.gob.ec/


Al momento están listadas como 50 instituciones con datos, al parecer, recientes. Vale la pena hechar un ojo por si hay información interesante. 

viernes, 4 de junio de 2021

BORIS y otros aparecidos: Replicabilidad

 El morbo o morbosidad parece algo intrínseco de los animales que somos. Y cada persona decide sobre qué temas ser morbosa. La vida privada de mis vecinos (el chisme), la muerte de los ecuatorianos que viven en la pobreza (crónica roja). Con el tiempo he desarrollado un gusto morboso por la replicabilidad (reproducción) de ciencia. 

Hace pocos meses al revisar un artículo de divulgación sobre lo lenta que se estaría poniendo la AMOC (vaya a buscar!) , fue posible encontrar el artículo científico sobre el tema. 

Una característica de las revistas "buenas" es la posibilidad de encontrar datos relacionados a los artículos. De la misma forma, github permitió encontrar el código usado para el estudio. Todo esto con el fin de poder replicar los estudios publicados.

Además de los repositorios de datos o conjuntos de datos (data set) privados / comerciales, existe la intención de las universidades de generar estos almacenes de datos. 

Hace poco como parte de un estudio en un proyecto de educación, los datos generados se colocaron en el sitio del socio localizado en Finlandia. El enlace es el siguiente:

https://etsin.fairdata.fi/datasets

Ayer revisaba unas publicaciones en la renombrada revista "Science" sobre un estudio de los últimos 5000 años en los sedimentos de un lago en Ecuador, en la amazonía.  Al revisar sobre los datos usados, encontré el siguiente repositorio localizado en Suiza. Su nombre: BORIS (Bern Open Repository and Information System), y la dirección es la siguiente.

https://boris.unibe.ch/cgi/stats/report 

Todo esto para decir que cada vez que puedo, solicito a los responsables de repositorios de mi universidad o consorcios (CEDIA) que se considere la generación de estos repositorios de conjuntos de datos con los datos generados por las universidades ecuatorianas.  Sin embargo, salvo error de mi parte, no he encontrado ninguna universidad con algo semejante. A seguir solicitando!!


jueves, 14 de mayo de 2020

la vida en tiempos del COVID19

Hablando de la importancia de los datos abiertos para mejorar la colaboración a nivel mundial, existen varias fuentes de información.
Ver por ejemplo:

https://artic.network/ncov-2019

que presenta manuales para usar las herramientas para utilizar los datos obtenidos luego de la secuenciación de ADN.

https://artic.network/ncov-2019/ncov2019-bioinformatics-sop.html 

La información gráfica siempre es interesante. ver por ejemplo los gráficos presentados en:
https://www.ncbi.nlm.nih.gov/nuccore/MN908947.3?report=graph


De la misma manera, existen alternativas para la visualización de los datos. Ver pro ejemplo
https://nextstrain.org/ncov/global


En fin, algo más de información para aprender usando la tecnología actual.

domingo, 23 de febrero de 2020

Rutas ceca de Cuenca, trail y caminata


¿Cómo puedo compartir información sobre rutas de diferentes actividades al aire libre que he realizado?
Bueno en realidad existen varias alternativas, quizás la más sencilla es usar un servicio como https://OpenStreetMap.org  para crear las rutas en caso de que no existan. Además se pueden compartir archivos gpx desde un dispositivo gpx y compartirlo con el mundo.

Una segunda alternativa es usar un servicio como wikiloc https://www.wikiloc.com/, el cual permite estructurar las rutas según el archivo de trazas o gpx.

Hace poco en Cuenca se desarrolló un sitio web con rutas para trail y para caminatas con rutas que quizás no son conocidas por la gran mayoría del público, el enlace es:
http://caminantescuenca.org/
Las rutas están disponibles en formato gpx, pdf, y otros formatos compatibles con algunos dispositivos.

En mi caso, un archivo Fit o un archivo gpx pueden ser enviados a un reloj con GPS y de esta forma un celular o reloj nos pueden ayudar a seguir el camino.

8nteresante información para los que  gustande actividades al aire libre o si se encuentran de turistas en la ciudad. Buen paseo.


domingo, 13 de octubre de 2019

datos abiertos Copernicus Sentinel 1 2 3


open.esa.int
En la nota del 4 de mayo de 2017 (http://open.esa.int/copernicus-sentinel-satellite-imagery-under-open-licence/) se indica sobre el acceso abierto a los datos de las misiones  Copernicus Sentinel Satellite data


https://scihub.copernicus.eu/

buscador de datos para descarga

https://scihub.copernicus.eu/dhus/#/home

jueves, 10 de enero de 2019

Hey kids do you want some ... data?

Hablando de plataformas para compartir datos georeferenciados, siento que existe una creciente demanda por acceso a servidores dispuestos a recibir nuevos datos.

Es común encontrar este tipo de plataformas cuando se realizan proyectos de investigación sobre diferentes temas. Ver por ejemplo la plataforma para presentación de información geo referenciada en temas de movilidad https://barrosjuan.blogspot.com/2018/02/epomm-modal-split-y-los-datos-ocultos.html   , siendo siempre importante incluir la fuente de la información.

El día de hoy les quiero contar sobre la plataforma https://www.isoarch.eu/ , la misma, que como su nombre lo indica se trata de isotopos y de arqueología en europa. Quizás al tratarse de isotopos lo más relevante sea la bio arqueología. La plataforma se presenta como una base de datos colaborativa de información geográfica y específica de los isotopos encontrados en cada lugar. El artículo que habla de la implementación es alcanzable en http://urlz.fr/5Msb

Una plataforma como esta permitiría encontrar las publicaciones que se han realizado sobre los diferentes lugares de un país. Este problema fue tratado en la entrada https://barrosjuan.blogspot.com/2018/03/chobshi-y-la-datacion.html 
Sin embargo, no creo que se hayan realizado estudios sobre isotopos sobre objetos encontrados en lugares arqueológicos, pero nunca se sabe.

Será acaso que en realidad somos una especie social y que nos gusta colaborar? Siendo estas plataformas tecnológicas una herramienta más para poder trabajar en conjunto, o al menos de consumir información que nos parece importante? ver por ejemplo lo expuesto en la entrada https://barrosjuan.blogspot.com/2018/10/del-co-voiturage-y-co-jardinage-y-los.html

martes, 20 de junio de 2017

En búsqueda de los datos abiertos

En alguna ocasión hablé con mi amigo Razvan sobre su pasantía en informática en una empresa de bici pública. Su trabajo consistía en encontrar métodos para depurar la información almacenada por los sensores de la bicicleta.  De hecho las bicicletas tenían una batería y algo de memoria y procesamiento para registrar los valores de velocidad, distancia, en algunos casos posición? Y luego con los datos depurados se procedía a analizar y encontrar información importante sobre el uso del sistema.
Un ejemplo de error sería: uno de los sensores indica un viaje de 100 km en el tiempo de una hora.
Hace poco, me encontré con alguien de Guadalajara México y me comentaba sobre su trabajo a cargo de la empresa que brinda el servicio de bici pública en esa ciudad. Según me explicó, en 2010 el censo indicó que la población es de al rededor de 6 millones de personas en su ciudad.
El sitio web para obtener más información sobre la bici pública es:

https://www.mibici.net/es/

236 estaciones y 2000 bicicletas.

El punto interesante fue mi sorpresa al preguntar sobre la información del uso con respecto al tiempo. Al parecer la información está disponible en el sitio web para que los curiosos como yo la puedan descargar y ver si pueden hacer cosas interesantes con ella. A continuación la dirección:

https://www.mibici.net/es/datos-abiertos/

20 500 personas registradas y 2.5 millones de viajes.

Además me contaron que también han realizado algunos hackatrones para ver con qué salen las personas al darles tal cantidad de datos para jugar. Talvez mapas de calor o algún otro tipo de comportamiento desde la extracción de datos.  Un hackatron, es una especie de festival en dónde se trata de manipular o explotar nuestro cococimiento de un algo  o un sistema para que haga algo completamente nuevo o diferente, es este caso es encontrar datos curiosos sobre el uso del sistema de bici pública en la ciudad.
 Al parecer las personas sacan la bicicleta para realizar vueltas cortas de al rededor de 15 minutos y por lo general vuelven a dejar la bicicleta en la misma estación.
Quién sabe y se trata de datos valiosos para realizar ejercicios de minería de datos (data mining) o algo más. Un caso interesante sin duda para ser examinado desde un punto de vista histórico; pasando por el desarrollo inicial (homemade) del sistema, hasta llegar a niveles de carga y de rendimiento que justifiquen el uso de infraestructura Canadiense de hardware y de software. Un caso de estudio para la ingeniería.
Es también un caso de estudio interesante cuando estamos a la puerta de la implementación de un sistema parecido en Cuenca-Ecuador y nos interesa la replicabilidad de los resultados.

miércoles, 17 de febrero de 2016

Tasa de retención estudiantil para el CEAACES

Se parte de dos listas con varios campos. la calve principal será la cedula .
Se requiere obtener:
Los estudiantes que se matricularon hace 2 años y que continuan matriculados.

Para resolver esta consulta vamos a ejecutar la siguiente consulta:

SELECT * FROM TMPU10 a INNER JOIN TMPU4 b ON (a.CEDULA=b.CEDULA) ORDER BY b.CARRERA;


Donde TMPU10 es la lista más actual y TMPU4 es la lista más antigua.

Los estudiantes admitidos hace 2 años del periodo de estudio (primera matrícula y en primer nivel) que continuen en la lista más reciente.

En este caso vamos a usar la misma consulta pero se agregaran más condiciones de restricción.

SELECT a.CEDULA, b.CEDULA, a.APELLIDOS, a.PERIODO_ADMITE_MATRICULA, b.PERIODO_ADMITE_MATRICULA, a.NUMERO_MATRICULA,b.NUMERO_MATRICULA,
a.NIVEL, b.NIVEL, a.CARRERA, b.CARRERA, a.ANULADO, b.ANULADO
FROM TMPU10 a INNER JOIN TMPU4 b ON (a.CEDULA=b.CEDULA)
WHERE  cast(b.NIVEL as int) = 1 AND
cast(b.NUMERO_MATRICULA as int) = 1 AND
cast(a.NIVEL as int) <= 5
ORDER BY b.CARRERA

Debido al sistema del instituto de lenguas, cuando un estudiante se inscribe en clases de cualquier lengua por alguna razón sus valores de nivel cambian y vuelve a estar con primera matrícula y en primer nivel. Por esta razón se procede a filtrar los estudiantes que en la lista más reciente se encuentran en un nivel superior al 5.