Tiro al blanco con sesgo

La discusión sobre las encuestas y las encuestadoras que se disparó después del 26 de octubre tiene un tronco argumental que no se condice con la realidad. Los discursos a favor y en contra, los argumentos politológicos y sociológicos, así como las disculpas y autocríticas, incluyen de forma implícita o explícita dos afirmaciones que contradicen a todas luces los datos.

La primera es que en esta elección los pronósticos no fueron felices, pero que la historia muestra una sucesión de aciertos. La segunda es que las tres empresas que hace muchos años trabajan para los respectivos canales de televisión son las más afiatadas en sus pronósticos.

No hay que trabajar mucho para darse cuenta de que ninguna de las dos afirmaciones son ciertas, y si bien podemos pensar que algunos las hacen por desconocimiento hay actores para los que es imposible asumir que no conocen la historia de su trabajo en detalle.

Las encuestas de verdad

Si bien nos quieren hacer creer que una encuesta es una herramienta que puede predecir al electorado con precisión de decimales, la realidad es que una encuesta bien hecha solo puede dar una idea del valor con +/-5 puntos que concentran el error estadístico y los sesgos inevitables de la muestra.

Al combinar varias encuestas con diferentes métodos de muestreo, lo esperable es que los pronósticos se abran de forma amplia en rangos de aproximadamente diez puntos. Y luego la elección muestra que el valor real cae dentro del rango pronosticado.

Desde 1999 a la fecha, la única vez que se dio una distribución asimilable a este tipo fue en las elecciones internas de 2009:

En todas las demás elecciones, aparece un hecho que aleja significativamente los pronósticos de lo que debería pasar: los pronósticos se juntan muy pegados en un intervalo pequeño, de 4 o 5 puntos, y el valor real está fuera del rango.

Por ejemplo, en las internas de 1999 los 5 pronósticos de votos para Hierro López (PC) caen en un apretado rango que va de 47% a 51%. La votación real fue 43%. Todos los pronósticos quedaron muy lejos por arriba del valor real. En las encuestas de verdad, estas cosas tienen probabilidad de uno en millones, o lo que es lo mismo, prácticamente no suceden.

Una historia de correlación

En estadística se dice que dos variables A y B están correlacionadas si al aumentar el valor de A también lo hace el valor de B y viceversa. Podemos decir que de alguna forma los cambios en una de las variables influyen en los cambios de la otra.

La explicación del párrafo anterior aporta una forma efectiva de saber si los pronósticos de las encuestadoras están correlacionados: cuando suceden cosas muy poco probables, con todos los pronósticos por arriba o por abajo del valor real, se puede comenzar a sospechar que hay correlación. Y en Uruguay esto sucede siempre, una y otra vez, sin excepciones.

Los datos históricos respaldan esta afirmación. Si tomamos todos los actos electorales de 1999 a la fecha, las encuestadoras tuvieron que realizar 41 pronósticos. En 22 de los 41 casos quedaron todos los pronósticos por arriba o por abajo. Si que esto suceda una vez es muy raro, que suceda la mitad de las veces es absolutamente imposible. Podemos estimar su probabilidad en un número que tiene cien ceros después de la coma decimal, antes de la primer cifra significativa.

Si los pronósticos de las elecciones son una montaña difícil de escalar, no hay duda alguna de que las encuestadoras son un grupo de escaladores atados firmemente unos a otros.

The big three

Contrariamente a lo que se afirma una y otra vez, las encuestadoras que trabajan para la televisión no tienen registros mejores sino peores.

Si consideramos los 41 pronósticos para Cifra, Equipos y Factum, son 33 las veces que quedan todos pegados y lejos del valor real. Para las encuestadoras de la tele, dar resultados razonables es una excepción y no la norma.

Hay algunas consideraciones relevantes:

  • No hay ninguna elección que no tenga al menos un valor correlacionado.
  • Si tomamos exclusivamente las elecciones obligatorias (nacionales y balotage) la mayor diferencia para el ganador es de 3.6 puntos porcentuales.
  • Hay varias elecciones en la que todos los valores están por arriba o por abajo del valor real: nacionales 1999, internas 2004, nacionales 2004, nacionales 2009, balotaje 2009, nacionales 2014.

Perlas

Algunos pronósticos califican sin duda alguna para perla:

  • En las internas 2014 los pronósticos para Lacalle Pou están todos en un rango de un solo punto, a 10 puntos del valor real.
  • En las elecciones nacionales 2009, para el PC pronosticaron 26%, 26% y 26.9% para un valor real de 31.9% y un mes después 46%, 45%, 46% para un valor real de 51.6%
  • El balotaje 2009 los tres pronósticos para Mujica tienen apenas 0.2% de apertura y los de Lacalle tienen 0.1%.

¿Cómo esconden esta realidad delante de nuestros ojos? ¿Por qué afirman una y otra vez que siempre aciertan? ¿Creen sinceramente que sus resultados son independientes, o nos están mintiendo sin más trámite? Son todas preguntas que se irán devanando con el paso del tiempo.
Lo que cabe duda es que el error de las elecciones nacionales no es novedad, sino la repetición de un patrón constante que tienen como causa una fortísima correlación en los pronósticos.