Recientemente leí una publicación del CNBC con el siguiente titular "Trump will win the election and is more popular than Obama in 2008, AI system finds", que traducido al español vendría a decir algo como "Trump ganará las elecciones y es más popular que Obama en 2008, según una inteligencia artificial".
Estas herramientas de inteligencia artificial tan de moda últimamente, acertaron. Una herramienta desarrollada por la empresa Genic.AI, denominada MogIA, y que se fundamenta en unos algoritmos de inteligencia artificial, que dijeron que sería Donald Trump el ganador.
Pero no venía yo hoy a introducir más ruido en unas elecciones ya de por sí bastante “movidas”. Lo interesante de la predicción de resultados electorales no es tanto quién gana (que también, claro), sino cómo funcionan. Vengo a hablar de este tipo de herramientas de predicción, que tantos titulares están generando en los últimos tiempos. En este caso, la herramienta MogIA, se alimenta de 20 millones de puntos de datos de plataformas “públicas” (entiéndase en el contexto de datos) como Google, Facebook, Twitter y Youtube. Una vez con los datos en la mano, crea modelos para predecir resultados.
La herramienta fue creada allá por 2004. Desde entonces, no ha fallado. Siento introducir más pesimismo en el ambiente, pero los datos y los algoritmos son así. Es más, tengo aún peores noticias; este tipo de sistemas, cuyo funcionamiento paso a explicar enseguida, son cada vez más precisos: cuantos más datos reciben, más aciertan.
La hipótesis del autor del modelo de predicción es sencilla: aquellos candidatos que más “engagement” generan entre los usuarios en redes sociales, son los preferidos. Justo hace un par de días nos recordaba el bueno de Nate Silver (otro de los que está mucho en este tipo de modelos predictivos), que todos los modelos hacen suposiciones: Es decir, que todos los modelos suponen hechos que luego debemos hacer que la evidencia contraste. No son suposiciones basadas en cuestiones subjetivas, sino en datos. El propio Nate Silver no para de publicar sobre la evidencia de las mismas, como una forma de hacer público su modelo y someterlo al escrutinio público.
¿Y qué hace MogIA para que hasta en los telediarios haya salido? Pues bueno, lo primero de todo, se trata de un modelo muy preciso, como decía. Ha acertado todas las últimas elecciones (incluyendo las primarias, donde nadie daba un duro por Trump). En este caso, ha sido más noticia que en anteriores ocasiones, porque estuvo contradiciendo la gran mayoría de las encuestas tradicionales. Y ahí es donde precisamente veo el punto de interés para este blog: ¿Datos de redes sociales y su sentimiento o métodos de encuesta tradicional?
No deja de ser cierta una cosa que nunca debemos olvidar: la ambigüedad de los comentarios en redes sociales es importante. Que los tweets y comentarios de Donald Trump hayan generado más reacción que con anteriores candidatos, puede deberse a las barbaridades que ha comentado. Esto, todavía los algoritmos de Inteligencia Artificial, no han conseguido arreglar. Además, también hay otro elemento importante: ahora mismo hay más usuarios en redes sociales de los que había en elecciones anteriores. Por lo tanto, si el motivo de reaccionar tanto a los comentarios de Trump es su “provocación”, que haya más personas que reaccionen, solo amplificaría el problema de raíz. Pero quizás, quién sabe, esto forme parte de la propia estrategia de Donald Trump.
Esto creo que tendría que destacarse más cuando se habla de este tipo de algoritmos. Pero esto no quita que montar modelos predictivos basados en datos de redes sociales y datos públicos esté siendo cada vez más popular. El pasado Septiembre, Nick Beauchamp, profesor de la Northeastern University, publicó un artículo donde demostraba cómo había una similitud muy alta entre los 100 millones de tweets publicados sobre las elecciones de 2012 y los resultados electorales de los estados.
Esta precisión en los resultados se debe a la nueva era de los algoritmos. Y esto, de nuevo, es lo que a mí más me llama la atención. Si bien con anterioridad, como decía el bueno de Nate Silver, los modelos muchas veces reflejaban los sesgos de su desarrollador, los algoritmos de aprendizaje (Machine Learning, vaya), van aprendiendo de su entorno. Es decir, son piezas de software que han sido enseñadas a aprender. Y por lo tanto, evitamos tener que decirles nosotros qué tienen que hacer. Y esto es lo interesante; y lo que los hace más objetivos. Y lo que provoca más miedo en este caso que pudiera estar dando como ganador a Trump.
Y es que estamos entrando en una era en la que no solo los resultados electorales son objeto de predicción. Muchas otras cosas. Y es que el software se está volviendo más inteligente según puede ir creando sus propias reglas a partir de los datos que va observando.