En 2016 la mexicana halló que miles de sentencias en Massachusetts tenían un sesgo racial, y su descubrimiento evitó que los sentenciados fueran a la cárcel sin motivo. Se trata de un trabajo que demuestra la importancia que tiene la ciencia de datos para lograr un mundo más justo
En los años ochenta del siglo XX se consideraban como de ciencia ficción las series televisadas en las que un grupo de adolescentes detectaba fraudes y hasta resolvía crímenes mayores gracias al conocimiento, adquirido por sí mismos, que tenían de los sistemas de las computadoras.
Para quienes éramos adolescentes en México, esas historias parecían extrañas y lejanas. Bien futuristas.
Para colmo, las mamás y tías de la época nos convencían de que jamás iba a ser posible tener una computadora personal —las que había ocupaban habitaciones enteras—, y mucho menos conectarla al sistema de una institución de gobierno o a una bancaria. “¿A quién se le ocurre?”, reclamaban.
La mexicana Paola Villarreal nació a mediados de los años ochenta, justo cuando una de esas series, Whiz Kids o Los chicos computarizados, salió del aire, luego de apenas un año de transmisiones.
Programadora y científica de datos, encarna la metáfora de quien llegó preparada para el futuro, como algunas personas le dicen al conocimiento y al uso de la informática. Autodidacta, al igual que los Whiz Kids, sus conocimientos y trabajo sobre intersección de datos han sido reconocidos por el Berkman Klein Center for International Society de la Universidad de Harvard, una red de académicos, estudiantes y profesionales de varias disciplinas, de la que Paola fue becaria; también ha colaborado con el Open Documentary Lab, del Massachusetts Institute of Technology (el prestigioso MIT) y con la American Civil Liberties Union of Massachusetts (ACLUM), una organización centenaria que a lo largo de su historia ha protegido los derechos de las poblaciones migrantes, de la diversidad sexual y las no anglosajonas; a esta organización llegó Villareal gracias a una beca de las fundaciones Mozilla y Ford.
Pudo haber elegido ser una magnate de la informática. Ahí están Bill Gates, Paul Allen, Sergey Brin, Michael Dell, Mark Zuckerberg…
Pero el asunto es que Paola ha tomado otro camino, el de la ciencia de datos, para contribuir a un mundo más justo.
En los primeros días de la ACLU, las sucursales de California ayudaron a mantener el radicalismo de la organización a medida que ésta se volvió cada vez más común a nivel nacional. Foto: ACLU
¿Ciencia de datos? La disciplina trabaja en la “descompresión” o separación de capas de información, con el fin de obtener información concreta. A decir de la revista de divulgación DCiencia (dciencia.es), se basa en “la programación; las matemáticas y estadística, y la experiencia en el campo de estudio” y requiere una condición, quizá lo más importante: la capacidad de las personas de hacer las preguntas correctas a las bases de datos.
En estos momentos, Paola Villarreal colabora en el Consejo Nacional para la Ciencia y la Tecnología (Conacyt), en proyectos de ciencia de datos con impacto social. Para ella, la colaboración en la ACLUM, en 2016, fue decisiva, según describió en su blog (paw.mx) ese año. “Por decir lo menos, éste ha sido un momento increíblemente interesante […] he aprendido mucho (y continuaré haciéndolo por el resto de mi vida, estoy segura) sobre temas de justicia social. He programado mucho […] y analicé gigabytes de datos para tratar de comprender mejor esos problemas (y creé el Proyecto Data for Justice) […] Me he dado cuenta de que la desigualdad y la inequidad son procesos y no un punto fijo en el tiempo. Para ser más precisos, son procesos en bucle que se alimentan de sesgos y prejuicios y su único resultado es cada vez más desigualdad e inequidad...”.
Se refiere al trabajo en el que ella cruzó datos del censo con los de las detenciones que realizaba la policía de Massachusetts.
Su creación, Data for Justice, revirtió la sentencia de 20 mil presos en Boston —sí, 20 mil—, pues, además de descubrir que en estas detenciones habrían influido el color de piel y el lugar de residencia de los afectados, también comprobó que los abogados del Estado se basaron en análisis inexistentes o falsos de laboratorio, en cuyos resultados privó un sesgo racial.
Por ese proyecto fue reconocida en 2018 por la mit Review en español como una de las innovadoras de América Latina menores de 35 años.
Algunas reseñas en internet afirman que fue suficiente que tu papá te regalara una computadora, cuando tenías 12 años, para que te volvieras una genia. ¿Es cierto?
Es cierto. En 1997, mi papá me compró una computadora; una Acer Aspire 100. Se me hizo muy fácil manejar sus cablecitos; me pareció muy lógico. La conectamos a internet y de inmediato empecé a hablar con gente que era mucho más experta que yo. A través de chats les comencé a hacer preguntas y me empezaron a guiar. Eran especialistas de todo el mundo, algunos mexicanos; gente random.
Era una internet completamente distinta a la que existe hoy. ¿En qué? En el volumen de personas que la consultaban. Era una internet mucho más pequeña. Ni siquiera existía Google. En general, no había buscadores, sino directorios de páginas.
Edificio del MIT Media Lab, en Massachusetts
¿Cómo nos explicas la ciencia de datos a los dummies?
Todo lo que hacemos como individuos en una sociedad genera información. Muchas veces esa información está en sistemas computarizados. Un ejemplo son las farmacias; las compras que hacemos en ellas se registran en sistemas, primero muy locales y después más grandes. Con esa información de compras, las farmacias pueden saber cuántas personas consumen medicamentos para la diabetes, para programar con tiempo el abastecimiento de manera periódica. Muchas acciones en nuestras sociedades provienen de la información que se genera por medio de nuestra interacción y se registra en bases de datos.
¿Somos buenos en México para la informática y los datos?
En México hay mucho potencial; hay gente con mucho talento, pero muchas veces no se atreve a explotarlo lo antes posible y se espera a tener una formación tradicional. Eso puede retrasar que la gente tenga más experiencia y aprenda a aprender.
Abundan los ejemplos de personas que se hicieron millonarias gracias a sus conocimientos de informática. Tú has decidido tomar otro camino. ¿Por qué?
Una de mis motivaciones es el interés público. Me di cuenta de que yo no habría podido aprender lo que sé, ni practicar lo que he practicado, sin tener las oportunidades que he tenido; sin la presencia de otras personas que vieron por el bien público y, por ejemplo, liberaron su código para que todos pudiéramos entender, estudiar, analizar, probar, modificar. Sin ese tipo de pensamiento colectivo yo no habría podido. Ahora me toca trabajar por el bien de la comunidad y probar que es factible impactar la vida de las personas a través de la ciencia de datos.
Pertenezco a una corriente de tecnólogos por el interés público. En México somos cada vez más. Muchos estamos en gobierno, algunos trabajan en las organizaciones de la sociedad civil, hay otros en la academia. Es cuestión de articular nuestra comunidad para generar un impacto mayor.
Uno de tus proyectos más importantes es Data for Justice. ¿Cómo llegaste a él?
La Mozilla Foundation y la Ford Foundation me dieron una beca para colaborar en la American Civil Liberties Union [nacida en 1920] que tiene muchos años trabajando en muchos frentes, desde los derechos de los migrantes hasta el matrimonio igualitario pasando por la defensa de la unión entre personas de razas distintas, en los años sesenta del siglo pasado. Hay quienes dicen que Estados Unidos no sería igual sin esta organización.
En su centro de Massachusetts, mi proyecto consistió en hacer la recolección, el cruce y el análisis de datos relacionados con el debido proceso en la detención de miles de personas.
Sonja Farak (izq.), durante su lectura de cargos en el Tribunal de Distrito del Este de Hampshire en Belchertown, Massachusetts. El 30 de noviembre de 2017 los fiscales anunciaron que serían descartadas más de seis mil condenas relacionadas con la exquímica, que trabajó en un laboratorio estatal durante ocho años. Farak se declaró culpable de alterar pruebas en 2014. Foto: AP
A través de varias demandas, los abogados de la ACLUM obtuvieron información del sistema de justicia penal sobre un caso de falsificación de evidencias que hicieron dos mujeres químicas. Ambas trabajaban en el laboratorio que hacía las pruebas de peso y la clasificación de las sustancias que las policías le habían decomisado a personas a las que arrestaron.
Sin hacer las pruebas, durante más de ocho años, y en algunos casos coludidas con las policías, estas químicas certificaron la presencia y el peso de algunas sustancias ilegales, con lo cual falsificaron las evidencias. Esto perjudicó mucho a las personas detenidas.
Con el análisis de datos que hice gracias a la ayuda activa de los abogados de la ACLUM, logramos identificar los casos y ponerles nombre y apellido a las sentencias, algunas de las cuales tenían varios años en curso.
¿Cómo fue que la informática y los datos ayudaron en este caso?
Hubo un trabajo arduo de recolección, procesamiento y análisis de datos. El simple hecho de obtenerlos me llevó un poco más de un mes y medio porque no existía una base unificada. Cada una de las fuentes [los departamentos de policía de siete condados] tenía criterios distintos sobre las personas detenidas. Nosotros generamos la base de datos unificada, que terminó siendo la lista definitiva de las detenciones en las que hubo personas afectadas. Se trataba de 60 mil casos que habían dado pie a 24 mil sentencias condenatorias.
Luego fue necesario trabajar con los abogados de la American Civil Liberties Union, plantearles preguntas y responderlas con datos.
Hallamos algunos patrones. Uno de ellos fue que, por los apellidos de los detenidos, nos dimos cuenta de que entre los sentenciados había muchos latinoamericanos y personas de color.
También descubrimos que los abogados del Estado les decían a las personas detenidas que, por las características del tipo y peso de las sustancias que la policía les había decomisado, tendrían que pasar 12 años en prisión. Estos mismos abogados les ofrecían a los detenidos olvidarse de algunos cargos si se declaraban culpables [incluso aunque no lo fueran]. Así, al enfrentarse con que el Estado tenía evidencias falsas, los detenidos preferían declararse culpables.
Ese análisis se convirtió en un testimonio que metí a la Corte Suprema Judicial de Massachusetts y que orientó a los magistrados para que obligaran a los abogados del Estado de Massachusetts a revertir la mayoría de las sentencias.
El argumento de la ACLUM era que, al falsificar las evidencias, se faltó al debido proceso y, por lo tanto, esas condenas tenían que revocarse.
Annie Dookhan, química de un laboratorio de drogas, fue sentenciada en 2013 a al menos tres años de prisión después de admitir que falsificó los resultados de las pruebas mientras trabajaba en un laboratorio estatal. Foto: Reuters
Desde tu perspectiva, ¿existen muchas diferencias entre este caso y los que ocurren en México?
El problema es siempre el acceso a los datos. Lo que vi en el sistema de justicia de Massachusetts es que no existe un sistema informático central. Fue un relajo obtener la información de los siete condados involucrados en este caso. Cada uno tenía un sistema distinto, que en algunas ocasiones era un archivo de Excel muy mal hecho. Al principio pensé que en Estados Unidos iban a tener mejores sistemas, pero pronto me di cuenta de que no es así.
¿Tenemos bases de datos confiables en el país?
Depende del tema, pero en general sí, el potencial existe. Tenemos una buena base para generar nuevas buenas bases de datos: es cuestión de comenzar a usarlas, de plantearnos preguntas, de responderlas con datos. Por supuesto, hay algunas que es posible mejorar. Quizás haya datos que faltan u otros que están duplicados, pero no creo que estemos tan lejos de bases más confiables. Como comenté antes, el movimiento al que pertenezco es cada vez más grande y debemos trabajar en articular esta comunidad.
También es cierto que no todas las personas tienen acceso a las computadoras y eso genera importantes brechas de conocimiento y posibilidades entre los mexicanos…
Es cierto, aunque creo que poco a poco las brechas se van a ir haciendo más cortas. Mientras eso no suceda, no podemos dejar de hacer ciencia de datos, pero tampoco dejar a nadie atrás.
Un ejemplo interesante es el voto electrónico. Como ciudadanos tenemos el derecho de auditar las elecciones. Pero parece que los sistemas electrónicos, que son operados por los especialistas, nos dejan fuera y podrían reducir esa posibilidad. Hay que encontrar los equilibrios, porque, en la espera de que las brechas se cierren, no podemos admitir que las personas no accedan a sus derechos.
Conversaciones es una narrativa interactiva que reinventa la ciudad de Delhi tal como la ven las trabajadoras domésticas y las amas de casa. Aquí, lo cotidiano se convierte en un lugar para experimentar la vida y la movilidad de las mujeres. Como cocreadoras, llevan la historia en varias direcciones: celebrando la independencia económica, contemplando estrategias para la supervivencia en la ciudad, la política del trabajo doméstico e incluso el placer de cantar. Las mujeres "invisibles" de Delhi crean narrativas de compasión y resistencia, codo a codo. Foto: Open DocLab
Si hubiera tres cosas de la realidad nacional que pudieras cambiar con ciencia de datos, ¿cuáles elegirías?
Me interesa mucho tener impacto con datos en fenómenos como la desaparición de personas, el medio ambiente y la salud pública.
Creo que hace mucha falta mejorar los sistemas de información geográfica, con bases estandarizadas y abiertas para todos los que quieran consultarlas. La información sobre la calidad del aire, del agua y las dinámicas que suceden en el territorio es vital, y la ciencia de datos puede aportar mucho conocimiento al respecto. El tema de la salud pública me interesa mucho; creo que hace falta, por ejemplo, buscar la correlación entre algunos contaminantes y algunas enfermedades.
Todas éstas son realidades en las que existe mucha necesidad y en las cuales la ciencia de datos puede impactar de manera positiva.
Paola Villarreal y otros de sus colegas especialistas en ciencia de datos coinciden en que a los ciudadanos que tenemos la posibilidad, nos falta lo más importante: hacer las preguntas correctas. ¿Y si empezamos a ensayarlas?