El 20 de diciembre hay elecciones generales en España. Aunque los resultados finales no los conoceremos hasta el recuento de votos, las diferentes encuestas dejan tras de sí algunos hipotéticos resultados, en los que siempre se trabaja con un cierto margen de error. No todas las encuestas dan los mismos resultados, por lo que hay expertos, como Kiko Llaneras, editor de Politikon, que están combinando todos estos resultados para hacer predicciones de qué resultados se podrían dar en las próximas elecciones en nuestro país.
¿Pueden las redes sociales ser un buen termómetro político? ¿Puede la tecnología (el Big Data, la analítica) sobre redes sociales predecir mejor el resultado de unas elecciones?
Podemos: lo que el CIS no vio pero Internet sí
Es una pregunta que muchos se plantean cuando, por ejemplo, en las pasadas elecciones europeas de 2014 el CIS apenas contempló el voto de Podemos y resultó ser la cuarta fuerza más votada. Teniendo en cuenta, además, que las redes sociales fueron parte del éxito de Podemos (que en apenas tres meses logró casi el 8% de los votos) la pregunta es si Internet en general, y las redes sociales en particular, pueden afinar en este cálculo electoral.
Las encuestas por Internet son una opción que, aunque no sin problemas, parece que gana adeptos en el mundo anglosajón
La Universidad de Valencia ha llevado a cabo un experimento precisamente en redes sociales, con el fin de utilizar su vitalidad para conseguir un efecto bola de nieve a la hora de conseguir la muestra en encuesta sobre intención de votos. Los resultados conseguidos evidenciaban que la mayoría las personas que habían contestado esta encuesta eran mayoritariamente jóvenes, por lo que los resultados que arrojaba esta encuesta estaban claramente descompensados.
En este experimento, los investigadores de la Universidad de Valencia han “cocinado” los datos, de manera que se ha dado más peso a las respuestas de las personas de determinada edad, con el fin de que los resultados sí puedan ser un reflejo real de la sociedad (en la que, según la pirámide generacional, hay más número de personas mayores que de jóvenes). Pero, como decimos, los resultados tiene que ser vistos desde el punto de vista de un experimento.
Experimento que, no obstante, sí puede ser una de las bases para la aplicación futura de técnicas de Big Data al pronóstico electoral y que sirva como histórico para futuras elecciones.
Comprando expectativas
Quizá la primera pregunta a plantearse es si realmente fallan las encuestas. Según Kiko Llaneras, el principal problema con las encuestas es que se juega con las expectativas y no se tiene en cuenta la precisión que se les exige (el margen de error no suele superar el 3%) y pone un ejemplo real: si en las próximas elecciones Podemos saca un 12 % de los votos, muchos entenderán este dato como un fracaso "porque se está midiendo el resultado de las elecciones conforme a las encuestas, que les dan cerca de un 15%. Nadie va a ver ese 12% como algo superior al resultado que tuvieron en las últimas elecciones. En el fondo, todos hemos comprado un poco ese retrato que nos dan las encuestas".
Josu Mezo, profesor de sociología de la Universidad de Castilla La Mancha y autor de Malaprensa, opina parecido. "Si las encuestas dan un 18% al partido X y un 19,5% al partido Y, la diferencia real es de tan solo un 1,5 puntos. Pero si en las elecciones el voto da los resultados al reves (19,5% al partido X y un 18% al partido Y), la opinión pública lo considerará un fracaso, cuando en realidad es un error mínimo, del 1,5 %. Y es una situación tan ajustada como la que dan las encuestas y lo que puede pasar el 20D".
A ello habría que añadir que en las generales no tenemos unas únicas elecciones, sino casi una por provincia. Una pequeña variación en una de las demarcaciones puede determinar que se consigan más o menos escaños y, por tanto, que se logre una mayoría o no. "Es muy difícil hacer la conversión de votos a escaños - explica Llaneras- precisamente por este reparto provincial del número de escaños. Además, hay muchas provincias en las que no se pulsa la opinión. Es, por tanto, un sitio en el que quizá el Big Data también tendrá un espacio, para poder afinar mejor este tipo de resultados".
Un problema de muestra
Las búsquedas en Google pueden determinar, de alguna manera, la popularidad de los diferentes partidos políticos y de sus principales líderes en un momento dado. Pero no podemos hacer una correlación directa entre las búsquedas en Internet (ni con el número de seguidores en Twitter o en Facebook) y las posibilidades de ganar unas elecciones.
Aunque todos estos datos pueden ser un buen termómetro social y una información valiosa, su principal problema es de muestra, según Kiko Llaneras, ya que en muchos casos puede no ser representativa del conjunto de la población. Dicho de otro modo: las dinámicas que podemos observar una red social como Twitter no tienen porqué reflejar fielmente el comportamiento de todo el conjunto de la población.
Aunque prácticamente todo el electorado está en Internet, las dinámicas que observamos en las redes sociales no tienen porqué reflejar fielmente el comportamiento de todo el conjunto de la población
"En primer lugar porque son personas distintas, ya que el usuario medio de Twitter es más joven y con un perfil demográfico diferente al del cómputo general. Además, el nivel de implicación es distinto: los que son afines a lo que se viene a denominar nueva política (es decir, Ciudadanos y Podemos) pueden ser mucho más activos que los seguidores de la vieja política o de los partidos más tradicionales. Los primeros suelen ser gente muy ilusionada, muy motivada y muy predispuesta hacer visible sus siglas y sus opiniones, mientras que los votantes de los partidos tradicionales no son tan expresivos, aunque vayan a votar igual".
El problema de las redes sociales es, una vez más, de muestra, ya que las que se obtienen de este medio no son representativas de toda la sociedad. Los usuarios de redes sociales tienen, según Mezo, un nivel socio económico y cultural generalmente más alto, y responden a un perfil más joven y tecnófilo.
Big Data: ¿más datos igual a mejores resultados?
Aunque la promesa del Big Data es poder utilizar un volumen inmenso de datos como fuente de información para su análisis, Mezo explica que más datos no tiene porqué, necesariamente, implicar mejor resultado y pone como ejemplo la anécdota de Gallup con, precisamente, encuestas electorales a la presidencia de Estados Unidos. Gallup demostró, frente a su adversario, que una pequeña muestra bien trabajada es mucho más válida para hacer pronósticos que una más numerosa pero menos representativa. “Aplicar tecnologías como Big Data para el pronóstico electoral es algo que todavía está muy verde”, sentencia este experto, quien también considera que sí puede ofrecer pistas sobre sesgos de voto o cambio de interés del electorado. “Veo muy complicado que se pueda hacer un promedio electoral basándonos en redes sociales”.
Las redes sociales tienen la ventaja de proporcionar datos en tiempo real y, aunque existen bastantes papers que reclaman haber predicho los resultados electorales usando Twitter (o que estudian esas conexiones, como éste o éste de este mismo año), según Gonzalo Rivero, científico social y estadístico especializado en política, los resultados distan de ser convincentes. Además de aludir a los problemas de muestra ("lo que ocurra en las redes sociales no puede extrapolarse sin más al electorado"), explica que tampoco conocemos los atributos sociodemográficos de cada usuario en redes sociales, por lo que "no hay muchas esperanzas para hacer ponderación como haríamos con cualquier otra encuesta", además de una serie de problemas técnicos sobre estimar voto mirando al sentimiento de los tweets o predecir resultados electorales.
Según Kiko Llaneras, especialista en este tipo de cuestiones, el voto es binario: es decir, o votas o no votas, mientras que en la red social puedes ser muy activo o poco activo en cuanto a expresar tus opiniones políticas. "Que seas muy activo o menos activo no tiene una implicación y un reflejo real en el voto".
No obstante, está convencido de que tarde o temprano, el análisis de Big Data aplicado a redes sociales funcionará y será una estimación válida para intentar averiguar quién va a ganar las elecciones, aunque a día de hoy siga teniendo muchas limitaciones.
La opción de encuestar por Internet
Teniendo en cuenta, pues, que ninguna de las dos opciones es a día de hoy perfecta, puede haber una tercera vía: la opción híbrida. Frente a las tradicionales encuestas telefónicas o domiciliarias, preguntando por la intención de voto, está surgiendo ahora un tipo de movimiento híbrido que intenta combinar Internet (en el que somos quizá más activos políticamente hablando) y estas encuestas más a pie de campo. Son las encuestas por Internet. Un ejemplo de ello sería YouGov.
En Estados Unidos son una opción que cada día gana más adeptos, aunque también se enfrenta con la algunos problemas. Y, como toda encuesta, volvemos a referirnos a la muestra. Hay algunas empresas que deciden tener un panel de usuarios muy representativo del cómputo global y con una base de datos muy bien trabajada y estructurada, lo que implica un alto coste. Otros prefieren hacer preguntas a mucha gente de manera aleatoria y, después, hacer ese trabajo de campo para seleccionar y tener una muestra representativa del cómputo global. Aunque es una opción en principio menos costosa, conlleva mucho trabajo final. "Aunque hace unos años había cierto escepticismo acerca de este tipo de encuestas, lo cierto es que en Estados Unidos ha ganado mucha credibilidad y se discute si realmente es tipo de encuestas son más fiables que las vías telefónica o domiciliarias", explica Llaneras.
El espejo de Estados Unidos
Por los contratos de confidencialidad que se firman, poco o nada se sabe sobre si los partidos políticos españoles están interesados (o utilizando incluso) estas tecnologías en sus campañas electorales. Donde sí hay más literatura al respecto es en Estados Unidos.
Según Enrique Serrano, director general de Tinámica y experto en Big Data, en dicho país "tanto el partido demócrata como el republicano utilizan tecnología de Big Data Discovery para analizar los impactos que tienen los mensajes de campaña en los ciudadanos con sentiment analysis en redes sociales, de tal forma que pueden prever de antemano los efectos de los mensajes y calibrar cuales son los que tienen mejor efecto. Con potentes modelos algorítmicos y con detección temprana se pueden peinar aquellas áreas geográficas en las que hay más reticencias a un determinado partido con los mensajes más sensibles de acuerdo a las necesidades de población".
Los usuarios que hablan de política en las redes sociales suelen ser gente en los extremos de la distribución ideológica y gente que está muy motivada políticamente
Durante el año y medio anterior a la reelección de Obama, su comité de campaña realizaba, todas las noches, 66.000 simulaciones por ordenador para hacer su campaña. Quizá ése fue la primera vez que alguien, públicamente, reconocía utilizar el Big Data para su estrategia electoral, lo que abrió también el análisis del impacto de las redes sociales. Estudios como éste de la Universidad de Massachusetts, o éste de la Universidad de Nueva York son algunos de ellos.
Ahora, muchas miradas están puestos también en Ted Cruz, quien también estaría utilizando estas herramientas no tanto para saber quién va a ganar las elecciones, sino para ajustar cada uno de sus mensajes al público al que va destinado.
La llave está en los indecisos
Según la ley electoral española, no se pueden publicar resultados de encuestas desde una semana antes de que se celebren las elecciones. Sin embargo, Kiko Llaneras asegura que entre 20 y 25% del los votantes se declaran indecisos y suelen decidir su voto en esos últimos días de campaña. Así pues, existe un margen de error para todo este tipo de encuestas. "En esta última semana estamos a ciegas y es ahí donde creo que este tipo de herramientas que beben de información que proviene Internet pueden tener su utilidad. Se pueden detectar cambios de última hora en el comportamiento de la gente, puedes detectar que determinados partidos tienen en redes sociales mucho más apoyo que la semana anterior u observar determinadas acciones que sí que pueden servir de termómetro sobre la opinión pública del último día".
Gonzalo Rivero también explica que los usuarios que hablan de política en las redes sociales suelen ser gente en los extremos de la distribución ideológica y gente que está muy motivada políticamente. "Esa falta de moderados es muy problemática porque los usuarios que hablan de política tenderán a ser gente que ya tiene decidido su voto y, por tanto, no serán los que suelen ser de interés para predecir las elecciones". Porque, además, "la metodología tradicional de asignación de voto a indecisos es la pieza más complicada y la de más interés para hacer predicción electoral".
Ponderando las redes sociales
En este objetivo de utilizar las redes sociales como una nueva vía de información para intentar predecir un comportamiento electoral nos encontramos con otro problema. ¿Cómo cuantificamos los resultados que nos arrojan cada una de las redes sociales? ¿A cuál damos más importancia? ¿A Twitter por ser más activa? ¿A Facebook por ser más numerosa? "Es difícil calibrar la importancia de cada red social. En España aún no tenemos un histórico en el que basarnos y establecer comparaciones. A partir de estas elecciones sí que podremos tener más histórico sobre redes sociales y observar las tendencias y comparar los resultados que se observan", sentencia Llaneras.
Gonzalo Rivero va más allá y, cuando se le pregunta que cómo deben interpretarse los datos que provienen de redes sociales y Google en términos políticos, concluye que "como una curiosidad. Aunque hay investigación muy prometedora sobre cómo recuperar información política y demográfica a través de las redes sociales y estrategias experimentales para producir muestras casi representativas, estamos todavía lejos de poder usarlas en un contexto real. Así pues, por ahora lo que vemos en las redes sociales es el producto casi siempre de gente muy motivada políticamente y que, por lo tanto, no tiene por qué reflejar el estado de la opinión general".
Aunque este experto sí que considera que sería posible utilizar información de redes sociales para complementar los datos de las encuestas y para cubrir los huecos entre diferentes encuestas, el problema estriba en que "eso asume que sabemos cómo utilizar la información de las redes sociales para extraer opinión pública y, por desgracia, a pesar de la multitud de herramientas existentes en el mercado que prometen información en tiempo real sobre la intención de voto o sobre el estado de la opinión sobre un partido o candidato, todavía estamos muy lejos de llegar a ese punto".
No obstante, cada red social aporta su valiosa información. "Twitter es ahora mismo la que más atención recibe en la investigación y por buenos motivos: la información es en tiempo real, casi toda está disponible públicamente y el volumen de la conversación política es muy considerable, mientras que Facebook es más cerrado y el tipo de discusión es diferente. Por otra parte, en Facebook tenemos mucha más información sobre las características de los usuarios (podemos saber su edad, su género, muchas veces su educación) mientras que en Twitter tenemos que “predecir” esa información. Además, ahora Instagram o Snapchat están siendo cada vez más usadas por los partidos y ofrecen otras pequeñas piezas del puzzle. Con todo eso, uno esperaría que se pudiesen combinar de algún modo para corregir los diferentes sesgos que cada una tiene por separado. Sin embargo, yo no conozco ninguna investigación que intente hacerlo –imagino que, en gran medida, porque el acceso a los datos es muy complicado para las redes que no son Twitter".
Pero, ¿se puede predecir el voto?
Con todos los datos que estamos compartiendo en Internet, se puede saber muy bien qué tipo de usuario eres e intentar adivinar cuáles son tus próximas compras, pero Kiko Llaneras no tiene tan claro que eso sirva para predecir tu voto, aunque sí puede ser interesante para ver caladeros de voto, para estudiar las características de un electorado, para saber qué mensajes son los interesantes para una terminal población, para conocer las características de tu población...
El Big Data promete poder analizar muchos datos, pero eso no conlleva obligatoriamente un mejor pronóstico. Gallup demostró que una pequeña muestra bien trabajada puede ser mucho más útil que una muy grande no representativa.
Igualmente, ante imprevistos de o sucesos última hora (como los atentados en Madrid de 2004 o la reciente agresión a Rajoy) las redes sociales "quizá no sean más valiosas pero sí que aportan algo más de luz a las encuestas, que se quedan ciegas al no poder recoger estos cambios de opinión y su reflejo en los votos". Es decir, que tienen la oportunidad de capturar esos imprevistos.
"A medio plazo las encuestas van a ir yendo hacia Internet. Es algo que va ir muy lento, porque tenemos mucha experiencia de cómo se hace en las encuestas domiciliarias y telefónicas -porque las llevamos haciendo décadas- pero todo el electorado está prácticamente ya en Internet, por lo que tenemos una muestra potencialmente no sesgada, aunque luego habrá que hacer ajustes", señala Llaneras.
Basta mirar, quizá, lo que ha ocurrido en países anglosajones, como Reino Unido y Estados Unidos, donde las encuestas por Internet han funcionado muy bien en los últimos años. "Tienen todavía numerosos inconvenientes técnicos y hay mucha controversia alrededor de la metodología para ponderar muestras no probabilísticas, pero en las últimas elecciones han dado resultados muy similares a los de las casas más tradicionales –y eso ha sido así tanto cuando las casas tradicionales aciertan como cuando fallan. Además, tienen dos ventajas que son muy difíciles de trasladar a fuera de Internet. Por un lado, el hecho de que por lo general es posible observar las respuestas de un mismo individuo a lo largo del tiempo, lo cual facilita aprender cosas sobre su comportamiento esperado, detectar respuestas fraudulentas o utilizar información auxiliar para ayudar a la predicción electoral. Por otra, que las entrevistas por Internet suelen estar asociadas a menos distorsión y “efecto de aceptabilidad/deseabilidad” en el sentido de que los entrevistados suelen ser más proclives a declarar opiniones impopulares en Internet que cuando lo hacen delante de un entrevistador", explica Rivero.
"Está la tentación de que esto pueda romper el mercado, especialmente en Estados Unidos. Si alguien da con la fórmula para que funcione pronto y sea competitivo, seguramente romperá el mercado y se hará con la clave", considera Llaneras.
Las oportunidades son obvias. "Las encuestas por Internet son más ágiles, permiten obtener más información longitudinal, son mucho más baratas, facilitan el uso de experimentos (que son cada vez más relevantes) y ofrecen muchas veces información más creíble cuando se trata de opiniones que pueden ser impopulares", relata Rivero. Pero, como vemos, no están tampoco exentas de problemas. Quizá el tiempo acabe determinando si el Big Data aplicado a redes sociales afina más en sus pronósticos o si únicamente serán un complemento más para dibujar estos escenarios de previsión del voto.
Ver 8 comentarios