El uso de datos en gran volumen está permitiendo la generación de nuevas fuentes para los estudios urbanos y para los de desigualdades múltiples: se han diseñado nuevos indicadores de desigualdad basadas en el cálculo de métricas de accesibilidad a centros de salud, educativos, a núcleos de servicios y a grandes centros urbanos. La detección de asentamientos informales en base a imágenes satelitales, también es una nueva herramienta.
Finalmente, Big Data y machine learning impactan también en las etapas de preprocesamiento y limpieza de los datos. Es posible utilizar estas técnicas para imputar datos perdidos en encuestas e incluso para generar codificaciones automáticas de fuentes hemerográficas.
Parte fundamental de la tarea de factor~data se centra en la identificación de problemas de investigación (nuevos y clásicos) abordables mediante estas técnicas y fuentes de datos. Se llevan adelante investigaciones originales que permitan la producción de conocimiento sobre las estructuras sociales y sus dinámicas
En este sentido, desarrollamos investigación en las siguientes líneas básicas de trabajo.
Procesamiento de lenguaje natural (NLP) aplicado a las ciencias sociales
Nos proponemos explorar la viabilidad de diferentes técnicas de natural language processing -modelado de tópicos, word embeddings, etc.- para su aplicación en problemas de las ciencias sociales. ¿Cómo pueden enriquecerse y escalarse los análisis de discurso tradicionales con nuevas técnicas computacionales? ¿Qué nuevas preguntas pueden plantearse? ¿De qué forma es posible complementar técnicas analíticas tradicionales (como la grounded theory o el análisis cuantitativo de contenido) con herramientas como el modelado de tópicos o los embeddings de palabras? Existen tres proyectos en esta línea:
- Análisis de comentarios de lectores en noticias de COVID-19
- Los temas de la música popular argentina
- Divergentes y polarizados. Un estudio computacional sobre la esfera pública Argentina (2022-2025)
Territorio, espacio y desigualdad
¿Cómo se expresan las desigualdades en el territorio? ¿Cuáles son las marcas antrópicas sobre los sistemas de bosques nativos? ¿Cómo medirlas? El uso de datos espaciales provenientes de diferentes fuentes (oficiales, de aplicaciones de ruteo, de imágenes satelitales y sus derivados) y su análisis mediante herramientas vinculadas al aprendizaje automático pueden ayudar a abordar este tipo de preguntas. En esta línea de indagación se inscriben los siguientes proyectos.
- Mapa de accesibilidad a Servicios Básicos
- Mapeo de desmontes en bosques nativos de Argentina. Propuesta de mejoras en el Sistema de Alerta Temprana de Deforestación
- Detección de zonas de avance y retroceso de la frontera agraria argentina. Deforestación y expansión agrícola en el territorio nacional.

