Por qué las encuestas electorales se equivocan … y aún seguimos creyéndoles

El 31 de mayo de 2026, 8 de cada 9 encuestadoras colombianas daban como
ganador absoluto en la primera vuelta presidencial a Iván Cepeda, el candidato del oficialismo con todo a su
favor. Todas se equivocaron. No fue un accidente ni un fraude: fue la
demostración de algo que académicos han explicado desde distintos ángulos
durante décadas. Las encuestas no fallan solo por errores técnicos. Fallan
porque el número ya viene “distorsionado” desde su construcción y, porque el
cerebro humano, es incapaz de leerlo sin convertirlo en una certeza que nunca
fue.

La última encuesta de INVAMER,
la consultora nacional de opinión pública más reputada, publicada antes de la
primera vuelta presidencial colombiana, mostraba a Iván Cepeda con un 44,6% de
intención de voto. Abelardo de la Espriella, el outsider de derecha, aparecía
en segundo lugar con 31,6%, trece puntos por debajo. Los analistas la repetían,
los titulares la confirmaban. El resultado real fue el opuesto: De la Espriella
ganó con 43,7% y Cepeda quedó segundo con 40,9%. La firma Guarumo, también local, fue aún más lejos en su error: le asignaba a
De la Espriella apenas 27,5%, cuando obtuvo 16 puntos más de lo proyectado, la
mayor diferencia registrada entre un sondeo y el resultado definitivo en una
elección colombiana reciente. Solo la firma brasileña AtlasIntel se aproximó a
la realidad con apenas 1,4 puntos de diferencia. Aun así, tampoco logró prever
el desenlace. Ninguna encuesta anticipó que el abogado barranquillero
terminaría encabezando la primera vuelta.

Aunque la reacción generalizada fue de asombro, ya
habíamos tenido un par de antecedentes sólidos en la votación a la presidencia
de los EE.UU. en 2016 (Trump vs. Clinton) y en el Brexit de 2019. Pero la
pregunta correcta no era cómo fallaron las encuestas, sino por qué creímos tan
ciegamente en ellas.

Un promedio “bien elegido” y el tras(fondo)

En 1954, el periodista Darrell Huff publicó How to Lie
with Statistics, un libro delgado pero persuasivo que explicaba cómo una
estadística puede ser técnicamente correcta y, al mismo tiempo, profundamente
engañosa. Siete décadas después, sus advertencias describen con precisión
quirúrgica lo ocurrido en Colombia.

El primer problema es la muestra. Huff dedicó su capítulo inaugural a lo
que llamó «la muestra con sesgo integrado»: una muestra puede seguir
todos los protocolos de aleatorización y aun así reflejar sistemáticamente a un
subgrupo de la población. En las encuestas electorales, esto se traduce en un
fenómeno bien documentado: las personas que contestan encuestas no son las
mismas que van a votar.
Los votantes ocasionales, los descontentos que cambian de opinión en la cabina,
y quienes mienten al encuestador — el llamado «voto tímido» o shy voter effect,
documentado desde las elecciones británicas de 1992 — nunca aparecen
correctamente representados en los modelos. En Colombia, ese efecto tiene una
capa adicional: la desconfianza estructural en la relación entre el encuestador
y el encuestado. En un país tan profundamente polarizado, declarar una
preferencia electoral ante un extraño no es un acto neutro. El temor a ser
estigmatizado, a ser perfilado ideológicamente o a perder el acceso a un
beneficio social lleva a muchos votantes a dar respuestas ambiguas, socialmente
aceptables o deliberadamente falsas. No es ignorancia estadística: es una forma
racional de autoprotección; un silencio calculado era precisamente el dato que
ningún modelo capturaba.

El segundo problema es más sutil. Cuando una encuestadora
reporta «La opción X tiene 44,6%», ese número único colapsa una
distribución estadística compleja en una cifra que parece sólida y definitiva.
Huff lo llamó el problema del «promedio bien elegido»: la media, la
mediana y la moda son tres formas matemáticamente válidas de resumir los mismos
datos, pero producen números muy distintos — y quien presenta la estadística
elige, casi siempre, la que mejor sirve a su narrativa. Una encuesta puerta a
puerta en barrios populares puede reportar que «el candidato X tiene 68%
de intención de voto» cuando el 80% de las visitas se hicieron un lunes
por la mañana — el único momento en que los encuestados de la muestra están en
casa — sin advertir que ese perfil de disponibilidad horaria ya es, en sí
mismo, una muestra sesgada. En las encuestas, el mecanismo es el mismo: un solo
porcentaje borra toda la incertidumbre que había debajo, y el decimal — ese
44,6% — refuerza psicológicamente una ilusión de exactitud que los datos
originales no tenían. En Colombia, con cuatro firmas que registraban rangos del
33% al 44% para el mismo candidato, esa dispersión era, en sí misma, la noticia,
no los promedios.

El efecto manada que nadie menciona

Nassim Nicholas Taleb advirtió en El Cisne Negro (2007)
algo que las elecciones colombianas ejemplifican con claridad: las
encuestadoras se comportan como ganado. Si no se leyeran unas a otras, las
diferencias entre sus predicciones deberían ser tan grandes como la distancia
que separa a cada una de la realidad. Pero como sí se leen — y como todas temen
ser la única firma que se equivoca en solitario —, sus números convergen
artificialmente, creando una ilusión de consenso que no refleja incertidumbre
real, sino la presión social entre profesionales.

En Colombia, ocho de cada nueve firmas colocaban a Cepeda
en primer lugar y a De la Espriella en segundo. Esa uniformidad no era
evidencia de solidez metodológica: era el efecto manada en acción. La
excepción — Atlas Intel— fue precisamente la que más se acercó a la realidad.
Taleb también señaló algo que incomoda al gremio: en campos como la política,
los expertos no saben más que la población en general sobre lo que ocurrirá.
Solo saben contarlo mejor y aturdirnos con sus modelos.

Si el problema fuera solo técnico, bastaría con mejorar
las metodologías. Pero hay un manto de complejidad más profundo que el
psicólogo Daniel Kahneman describió en Pensar rápido, pensar despacio
(2011): el cerebro humano está estructuralmente mal equipado para procesar
información estadística. Kahneman distingue dos sistemas de pensamiento. El
Sistema 1 es rápido, automático y narrativo: convierte cualquier dato en una
historia coherente. El Sistema 2 es lento, deliberativo y estadístico: puede
calcular probabilidades, pero es perezoso y se activa poco. El problema con las
encuestas es que todo su ecosistema de comunicación — titulares, gráficos de
barras, analistas en televisión — está diseñado para alimentar al Sistema 1.

Cuando un medio publica «X lidera con 13 puntos
sobre Y», el Sistema 1 no lee «hay una enorme dispersión entre las
firmas y el resultado es incierto». Lee: «X va ganando». Es la
misma diferencia que hay entre decir que un medicamento funciona en el 30% de
los casos y decir que «uno de cada tres pacientes mejora»: los
números son idénticos, pero la reacción emocional es completamente distinta.

La ilusión de validez y el analista que siempre tiene
razón

El problema no termina con el lector. También afecta a
quien realiza el análisis.

Kahneman identificó lo que llamó «la ilusión de
validez»: la tendencia de los expertos a confiar en exceso en sus
predicciones, incluso cuando la evidencia muestra que su tasa de acierto no
supera la del azar. Lo descubrió en carne propia cuando, siendo joven psicólogo
del ejército israelí, evaluó a reclutas y predijo con gran seguridad su
desempeño como oficiales. Años después, los datos mostraron que sus
predicciones carecían de valor predictivo real. La confianza había sobrevivido
al fracaso.

Los analistas electorales operan en el mismo entorno. Su trabajo requiere
procesar enormes cantidades de información (datos demográficos, tendencias
históricas, estados de ánimo colectivos) y esa complejidad les genera una
sensación muy poderosa: “Yo entiendo esto”. Pero entender el pasado no
garantiza ver el futuro. Burton Malkiel lo expuso en A Random Walk Down Wall
Street (1974), con un hallazgo tan simpático como preocupante: los
corredores de bolsa, con acceso a toda la información del mercado, no logran
superar sistemáticamente a un portafolio elegido al azar. En entornos
impredecibles como la política, un modelo simple no tiene ego ni favoritos
(solo procesa números) y, por eso, a veces acierta más que quien lo sabe todo.
El experto construye una narrativa coherente en la que el conocimiento se
confunde con la capacidad predictiva. Es revelador que la firma que más se
acercó a la realidad en Colombia llegara de afuera, sin el bagaje previo de un
encuestador local — y que, precisamente por eso, midiera mejor.

Las causas que triunfan sobre la
estadística

Hay un capítulo de Kahneman cuyo título debería estar
enmarcado en cada redacción periodística: «Las causas triunfan sobre la
estadística». Cuando una persona recibe simultáneamente una explicación
causal y un dato estadístico, siempre privilegia la explicación causal, aunque esta
sea más informativa.

Incluso
Taleb llama a este fenómeno la «falacia narrativa»: la tendencia
humana a construir historias coherentes a partir de eventos pasados para darles
un sentido que en realidad no tenían antes de que ocurrieran. “Ah, ¡claro…! A
paso porque sucedió B.” Pero lo inquietante no es la historia en sí, sino lo
que esa historia oculta: no fue una sola causa la que definió el resultado,
sino una suma silenciosa de pequeños eventos dispersos que nadie registró,
nadie modeló y nadie vio venir. Esas historias son plausibles y satisfactorias.
También son, en su mayoría, racionalizaciones post hoc de un resultado que las propias
encuestas no lograron captar. Lo paradójico, no es la magnitud del error de
predicción sino la falta de conciencia que tenemos de él.

¿Qué hacer con las encuestas?

Nada de lo anterior implica que las encuestas sean
inútiles. Significan que debemos leerlas de manera radicalmente distinta. Huff
propuso cinco preguntas que todo lector debería hacerle a una estadística:
¿Quién la financia? ¿Cómo se construyó la muestra? ¿Cuál es el margen de error
real? ¿Qué información no se está reportando? ¿Tiene sentido con los demás
datos disponibles? Aplicadas al caso colombiano, habrían revelado que la
dispersión entre firmas — de hasta 11 puntos para el mismo candidato — ya era
una señal de alarma que ningún medio destacó. Kahneman sugería desconfiar
sistemáticamente de quien habla con demasiada certeza en dominios
impredecibles. Y Taleb añade una regla más radical: si todos los expertos
coinciden, eso no es garantía de acierto — puede ser garantía de que el error
será compartido y, por tanto, nadie rendirá cuentas por él.

Hay fenómenos que, lejos de ser técnicos, son estructuralmente imposibles
de corregir mediante mejores algoritmos. Una encuesta, por más rigurosa que
sea, le pide a una persona que revele ante un extraño una decisión que en
realidad tomará en silencio, ante una urna. Ese momento es íntimo — cargado de
dudas de último minuto, de emociones que no se verbalizan, de un estado de
ánimo que puede haber cambiado esa misma mañana. La privacidad y el anonimato
no son detalles logísticos del voto: son condiciones esenciales del acto mismo
de decidir. Al pedirle al votante que anticipe esa decisión en un contexto
social, la encuesta altera inevitablemente aquello que pretende medir. La
recomendación no es entonces solo mejorar la muestra o ajustar los márgenes: es
diseñar metodologías que recreen, en la medida de lo posible, las condiciones
emocionales y de privacidad del entorno real en el que el votante finalmente se
enfrenta a sí mismo. Colombia lo acaba de demostrar
con diferencias abismales entre la proyección y la realidad. Las encuestas no
mienten en su construcción. Pero mienten con facilidad en sus predicciones, y
el cerebro, la manada y la falacia narrativa las ayudan.

Entender por qué fallan las encuestas no es un ejercicio académico aislado: es, en esencia, un problema de análisis de riesgo. Los mismos sesgos —la muestra distorsionada, el efecto manada, la ilusión de certeza— aparecen una y otra vez en la forma en que individuos, empresas y gobiernos evalúan escenarios futuros, mucho más allá de la política electoral.

Si este tema le interesa y quiere profundizar en cómo estos marcos se aplican al análisis de riesgo en otros contextos, escríbame directamente (m.zorrilla@real-oneamerica.org). También puede conocer el trabajo de nuestra red en https://real-oneamerica.org/.

Compartir publicación:

Martin Zorrilla

Entradas del autor

Ciencia Política, Democracia, Seguridad nacional