martes, 25 de julio de 2017

radeval

Hace algún tiempo tuve la oportunidad de conocer algo de un proyecto sobre evaluación de infraestructura para bicicletas para los municipios. En general las preguntas que el nuevo enfoque sistemático ofrece podrían ser:
 
¿Qué efecto tiene el nuevo carril bici en el número de Bicicleta?

Ha realizado campaña de marketing para una actitud más positiva para el ciclismo?

El nombre del proyecto es radeval y como algunos se deben estar imaginando se trata de un proyecto alemán realizado en la Universidad Técnica de Dresden. TU Dresden. Rad es el nombre familiar que se le da a las bicicletas en el lenguaje alemán. Rad = Fahrad; como bici = bicicleta. Y eval por evaluación.

La primera ocasión pude conseguir un panfleto (flyer, para los gringos wannabe) en inglés, pero el papel se me perdió. De cualquier forma el proyecto se encuentra en internet. Bueno, los enlaces se muestran a continuación.

https://tu-dresden.de/bu/verkehr/ivs/voeko/forschung/forschungsprojekte/radeval

https://tu-dresden.de/bu/verkehr/ivs/voeko/die-professur/news/online-befragung-im-forschungsprojekt-radeval-gestartet

 Formulario
https://tu-dresden.de/bu/verkehr/ivs/voeko/ressourcen/dateien/forschungsprojekte/2016_nrvp_radeval/Radeval_erhebung_fragebogen.pdf?lang=en

https://nationaler-radverkehrsplan.de/de/praxis/erarbeitung-eines-leitfadens-fuer-kommunen


El email de contacto es Julia.Gerlach [at] tu-dresden.de
Los siguientes pasos implican revisar la viabilidad de la encuesta para los municipios de Ecuador o de Cuenca, y quién sabe utilizar o encuestar a las personas sobre el mismo tema.
Una buena idea para continuar.

jueves, 20 de julio de 2017

Lista de películas

Hace ya un año con algunos amigos planteamos la proyección de un documental sobre el uso de la bicicleta en diferentes ciudades al rededor del mundo.  El film se llama bikes vs cars y es de Fredrik Gertten. El enlace al sitio web del productor es:

bikes-vs-cars.com/thefilm

Además publicamos una encuesta sobre las impresiones de las personas que assititeron a las proyecciones.

https://goo.gl/forms/vxyac62PP5hwb8QU2

Bueno el tiempo pasa muy rápido, ahora las películas a ver o proyectar podrían ser:
Power to change
http://powertochange-film.de/ de Carl Fechner de Alemania

Solidream
https://solidream.net/le-film/ 

Veamos si se materializan las proyecciones.

lunes, 17 de julio de 2017

Crowd sourced data

La idea de dar representatividad al ciudadano común y silvestre es uno de los propósitos de lo que yo traduzco como Monitoreo Colectivo o "Collective Sensing". En algunos otros sitios se conoce o se peude interpretar como datos generados por las muchedumbres/masas (Crowd sourced data).

Existen muchos proyectos con ideas al respecto, y hoy encontré una referencia más al tema, un proyecto que utiliza celulares antiguos para grabar el zumbido de un mosquito y por su firma sonora específica en un servidor remoto se puede realizar la clasificación del mismo. El objetivo es poder tener elementos de juicio para discriminar entre un zancudo normal y otro que lleva chicungunya o dengue. Interesante idea realizada en la universidad de Stanford.

El proyecto se llama abuzz, y la URL o dirección del proyecto es:

http://abuzz.stanford.edu/

La charla por la que encontré este proyecto se encuentra en:
https://www.ted.com/talks/manu_prakash_lifesaving_scientific_tools_made_of_paper

Y el documento de investigación para las personas que realmente estén interesadas en conocer más sobre los pormenores de este interesante trabajo.


http://web.stanford.edu/group/prakash-lab/cgi-bin/mosquitofreq/wp-content/uploads/2017/03/MosquitoAcoustics_V10.pdf

He encontrado otro proyecto que utiliza teléfonos celulares antiguos para monitorear la selva tropical en Costa Rica, espero encontrar la dirección y la estaré colocando en este blog.

Twitter y el semáforo.

La idea de dar el poder a las personas sobre los problemas del día a día parece un tipo de sueño utópico, y es casi imposible quitarse de encima a los "iluminados" elegidos por el pueblo para "salvarnos" y encontrar la mejor solución a nuestros problemas.  Un caso concreto es el que se vive en Ecuador desde hace mucho tiempo, donde los ricos han estado en el poder desde el inicio de la república hace casi ya 200 años.
Hace poco se presentó un caso curioso, el alcalde de Cuenca instaló un semáforo en la intersección de la avenida Fray Solano y Remigio Crespo. Un semáforo para permitir a los peatones atravezar la avenida de una forma segura debído al creciente número de automotores. Cabe recalcar que las familias ricas son las que se pueden permitir gestionar las franquicias y derechos de las grandes marcas de coche en la ciudad. Como resultado? Una intervención, a mi criterio mal hecha, donde el semáforo se colocaba en rojo para los coches aún si no hubieran peatones yendo a cruzar.  Y es alli que ví el poder de las redes sociales.
Las personas de los coches, parece que tienen más dinero que los peatones; es por eso que pueden constear un coche. Y en ocasiones también pueden pagar un smartphone de alta gama con funciones de whatsapp y twitter. Bueno, entonces resulta que los usuarios de carros en la ciudad comenzaron a hacer una campaña contra el alcalde por interrumpir el tráfico, sin darse cuenta que el problema tiene mas relación con el número de coches que con el uso o no de un semáforo.
Pasó lo que tenía que pasar, el alcalde con miedo a perder puntos de popularidad procedió a apagar el semáforo para siempre. Cabe indicar que no sé qué es peor, no ocupar una obra que requirió de obra pública para ser instalada, o la solución propuesta por el alcalde. La solución incluía pagar a un par de agentes de tránsito en la misma intersección para dar paso a los peatones. No sé que es peor, no ocupar una infraestructura que permite automatizar la respuesta al problema o es peor ver a los agentes de transito estar respirando el smog de la cantidad de automotores que transitasn la ciudad cada día por esa intersección. Y cómo es de esperar a las personas ricas no les interesa en lo mínimo la salud de los agentes de tránsito.
Tal vez un semáforo con pulsante sería suficiente, pero quizás es una tecnología inalcanzable para los líderes actuales. Además de no olvidar para futuros experimentos que solo algunas personas "pudientes" logran tener al smartphone de alta gama para quejarse en twitter y hacer perder algunos puntos a los pobres alcaldes.














jueves, 6 de julio de 2017

pdftk y su pandilla pdftops ps2pdf pdfinfo pdfimages

Existe una discusión entre los ñoños sobre el presente y futuro de los datos. Cómo se debe estructurar desde el punto de vista informático un documento portable (PDF)? La tendencia es tratar de separar el contenido del documento de su presentación. Los datos y su presentación podría estar unidos mediante algún tipo de metadato o alguna técnica de hipertexto (alguien dijo XML?).

Lo importante es que al común de los mortales no le interesa perder su tiempo en una discusión tan vanal como esa y prefiere estar de fisgón sobre la vida de sus amigos, utilizando fb por ejemplo.

En algunas ocasiones el problema no es trivial.  Por ejemplo, hoy debía preparar un documento en formato PDF para poder ser enviado e imprimido en algún otro lugar distante. Y es que el código abierto brinda herramientas para por ejemplo:
- obtener las imágenes de un pdf: pdfimages
- obtener el tamaño en puntos de cada una de las páginas: pdfinfo
- realizar cortes o integraciones, separar solo algunas páginas, en general manipulación: pdftk.
- convertir archivos de imagen en otros de tipo pdf: convert

De hecho, pdftk significa ToolKit PDF. Un conjunto  de herramientas para manipular varios aspectos de un pdf.

El problema que se me presentó hoy fue que tenía imágenes escaneadas y las convertí a archivos pdf. Y mediente pdftk pretendía generar un archivo con todos los subdocumentos seleccionados. Pero luego de realizar la integración, al revisar el documento observé que el tamaño de algunas páginas era mayor con respecto  a otras páginas.  Recuerden, en teoría Internet es su amigo. y tras buscar un poco encontré algunas posibles soluciones, algunas no funcionaron.

La solución que funcionó hoy fue convertir el pdf al formato postScript o ps.

pdftops -paper A4 PagsGrandes.pdf nuevoArchivoA4.ps

y luego

ps2pdf nuevoArchivoA4.ps archivoRegulado.pdf

para comprobar el tamaño de las páginas utilizamos, el viejo conocido:

pdfinfo archivoRegulado.pdf

Ahora podemos unir sin ningún problema los archivos con pdftk.

Espero recordar esta nota la próxima vez que tenga este problema.



Un buen Sandwich

Algunas instituciones de mi país tienen procedimientos muy rigurosos para publicar información. Es así que algunas veces la secretaria redacta un reglamento basándose en alguno anterior. Luego de trabajar durante algún tiempo corrigiendo el texto para capturar lo que el abogado secretario desea plasmar, se obtiene un archivo de texto con la versión final.
Cabe recordar que para poder realizar búsquedas desde una computadora, es este el formato necesario para colgar en un sitio WEB. Pero un reglamento sin firma de responsabilidad no es válido en realidad, bueno entonces se procede a imprimir el reglamento o documento legal, se le coloca la firma de responsabilidad por todos los implicados en este documentosidio y se procede a escanear el documento para esta vez si, poder colgarlo "como debe de ser".  El problema es que ahora en lugar de tener texto buscable con el poder la computación, se tiene una foto en la que no se pueden realizar busquedas sin realizar algún procesamiento previo, pero nadie quiere saltarse los pasos de ley, no es verdad??

Hoy por n-sima vez utilicé linux y programas con licencia GNU para poder pasar de fotos que provienen de un escaner a un texto buscable. Al tratarse del mundo Open-Source, el camino no es sencillo.  De cualquier manera, llevo utilizando para  esta tarea el script llamado pdfsandwich; mismo que solo ejecuta un script de enlace con varias herramientas que hacen la dificil tarea de reconocer el texto (tesseract), previo el uso de una conversión de color a escala de grises, a veces se corrige las inclinaciones del texto, y se coloca el texto por debajo de la imagen del texto (gs o ghostScript), para finalmente obtener una nueva versión del documento pero con texto buscable. Una opción "razonable" cuando nuestra conexión a internet de subida impide enviar los grandes archivos a un servicio en la nube, bueno, y por los problemas de seguridad ue ello implica.

El comando típico que utilizamos sería:

pdfsandwich -lang spa -layout single -o texto  -debug -verbose archivo.pdf

Lang es de language y spa es de spanish
layout es por si se trata de una columna o 2 columnas
-o es de output o salida, para indicar el nombre del archivo de salida
-debug para guardar todos los archivos intermedios por cada página.
-verbose para leer los mensajes y poder saber en qué página se encuentra.
y obvio, el archivo con las fotos a procesar.

La herramienta no es perfecta, pero es gratis y abierta. Entonces si deseas mejorarla solo cierra la boca y dedicate a programar :)