El movimiento del 15M o la Primavera Árabe se podían haber predicho con solo haber prestando suficiente atención a las noticias. Esa es la afirmación de un nuevo estudio, que muestra cómo la minería de datos, mediante el estudio de las fuentes de información, puede revelar la posibilidad de futuras crisis antes de que ocurran.
La puesta en común, junto al tono global de todas las noticias y menciones de un país a través del tiempo, parece revelar con exactitud su estabilidad a corto plazo, esto incluiría la predicción de las revoluciones de Egipto, Túnez y Libia, el conflicto de la antigua Yugoslavia, o por ejemplo la estabilidad de Arabia Saudi. Si bien el análisis se realizó de manera retrospectiva, el director del proyecto Kalev H. Leetaru dice que los mismos procesos se podrían utilizar para anticipar conflictos futuros.
El estudio de de fuentes de información incluye archivos públicos, prensa escrita, noticias y redes sociales vía internet (en total mas de 100 millones de artículos) y se basa en dos técnicas: la primera sería la detección y cuantificación del factor anímico de un país mediante palabras clave clasificadas como positivas o negativas como «horrible», «malo» «bueno» «agradable» y lo segunda técnica llamada «full-text geocoding» que facilita convertir las referencias de texto a coordenadas dando lugar a gráficos sobre los sentimientos predominantes en una región en un momento concreto (Egypt por ej.)
Como podéis suponer el procesamiento de semejante cantidad de información, necesita de un equipo realmente muy potente, para ello utilizaron una supercomputadora conocida como Nautilus, con base en la Universidad de Tennessee: es un sistema SGI Altix UV 1000, tiene 1.024 núcleos (Intel Nehalem EX), 4 terabytes de memoria global compartida, 8 procesadores gráficos y como la inmensa mayoría de las supercomputadoras utiliza sistema operativo Linux (SUSE v11).
Vía | Singularity Hub