Acerca de este trabajo

Martin Virtel

Las autoridades de Barcelona se han inventado algunos trucos para hacer la ciudad más atractiva para todo el mundo, a veces pasando por encima de los intereses de los barceloneses. Uno de esos trucos, totalmente inofensivo comparado con, por ejemplo, tres terminales de cruceros, es regalar al mundo un gran número de datos sobre la ciudad. No atrae millones de turistas pero sirve como cebo para los que comemos, bebemos, inhalamos y transpiramos números. Un pequeño grupo que juega su papel en preparar grandes decisiones: planificadores urbanos, inversores, diseñadores, visualizadores, data scientists y periodistas. Una tribu que vive de acuerdo al lema «sin datos, no es usted más que otra persona con una opinión», del estadístico estadounidense Edwards Deming.

Pues aquí estamos. Ricos en datos y con opiniones por formar. Desde hace casi una década, el ajuntament se ha dedicado a publicar interesantes datos abiertos. Un ejemplo que nos ha llamado especialmente la atención es la lista de accidentes gestionados por la Guardia Urbana de Barcelona: alrededor de 10.000 cada año. Este número viene con todos los detalles que se pueda imaginar: edad de personas afectadas, coordenadas geográficas, hora del día – todo un festín para un grupo de periodistas en formación. Una montaña de números que incluye pequeños detalles como «tipo de día» (en términos de accidentes, es siempre «laborable», no importan domingos ni Semana Santa), o la proliferación de los “Ginys con Motor,” artilugios parecidos a los patinetes pero con un asiento incorporado. Widgets que parecen estar involucrados en accidentes desde que las estadísticas mencionan esta nueva peste en las aceras.

Así es el trabajo con datos. Al contrario de lo que uno piensa, éstos no son productos de máquinas sin alma sino de seres humanos meticulosamente operando máquinas sin alma. Así, en el 2015, en un caso único de error entre los 45 archivos que hemos mirado, se ha escapado el punto y coma («;», en vez de la coma) para formatear las tablas. Es algo que une a los alemanes con los españoles y muchos otros europeos: Microsoft Excel piensa que «Comma Separated Value» se traduce como «Valore separados por punto y coma» y se olvida completamente de su origen anglosajón. Obstáculos menores.

Juntamos todos los datos de los años, nos deshicimos de extrañas vocales con acentos que ya ningún algoritmo sabe interpretar y nos lanzamos al análisis. Para los que quieran seguirnos el paso, publicaremos los datos consolidados, limpiados y muy elaborados de 2010 a 2018 en Github en breve. Para los otros, preparamos algunos análisis en este sitio. Y les recomendamos dos trabajos que nos han inspirado, de Amanda Iglesias Moreno (Analysis of Car Accidents in Barclona) y Paulino Vallejo (Accidentes gestionados por la Guardia Urbana en la ciudad de Barcelona en 2017 según tipología) que analizan con otro enfoque los datos del año 2017.

Autor: Martin Virtel

Perfil