Vacíos de Datos
The Bias
- Sesgo: Los vacíos informacionales (Data Voids) son lagunas en la cobertura de búsqueda y en los datos disponibles, donde la información ausente o de baja calidad se explota sistemáticamente para difundir desinformación (S011).
- Qué rompe: El pensamiento crítico, la capacidad de evaluar la veracidad de la información, la confianza en los motores de búsqueda y asistentes de IA, la seguridad informativa de las comunidades marginadas.
- Nivel de evidencia: L1 — alto nivel de consenso académico con múltiples estudios empíricos (84 citas de trabajos clave), respaldado por instituciones líderes (Microsoft Research, Stanford FSI, Harvard Misinformation Review).
- Cómo detectarlo en 30 segundos: La consulta de búsqueda devuelve un número limitado de resultados de baja calidad; un consenso inusual entre fuentes sobre un tema controvertido; banners de advertencia de los motores de búsqueda sobre la insuficiencia de datos.
Cuando los vacíos informacionales se convierten en arma
Los vacíos informacionales constituyen una amenaza crítica para los ecosistemas de información contemporáneos. La noción, sistematizada por primera vez por los investigadores Golebiewski y Boyd en 2019, describe espacios informacionales donde la ausencia, limitación o baja calidad de los datos genera oportunidades para manipular los resultados de búsqueda (S011, S013). No se trata simplemente de espacios vacíos en internet, sino de vulnerabilidades de seguridad activas que requieren una gestión sistemática.
El fenómeno de los vacíos informacionales ha captado una considerable atención académica, con trabajos clave que han recibido entre 28 y 84 citas (S002, S010). Los manipuladores explotan activamente los vacíos informacionales para exponer a los usuarios a contenido problemático a través de los resultados de los motores de búsqueda. Resulta especialmente alarmante que los usuarios que buscan información en línea para verificar desinformación corran el riesgo de aterrizar precisamente en esos espacios informacionales donde falta contenido de calidad (S003).
Tres tipos de vacíos informacionales
- Vacíos de resultados de baja calidad — los resultados de búsqueda disponibles se consideran inadecuados o poco fiables.
- Vacíos de baja relevancia — los resultados de búsqueda no se alinean con la intención del usuario.
- Lagunas en la cobertura — temas con una escasez de contenido autoritativo.
Google Search y otras plataformas intentan ayudar a los usuarios a navegar estos tipos de vacíos, pero las intervenciones a menudo se basan en procesamiento heurístico en lugar de un trabajo sistemático (S005, S014).
La inteligencia artificial hereda el problema
El problema de los vacíos informacionales se agrava con el desarrollo de la inteligencia artificial. Los grandes modelos de lenguaje (LLM) y otras sistemas de IA heredan vulnerabilidades de los vacíos informacionales presentes en sus datos de entrenamiento, lo que conduce a lagunas, sesgos y alucinaciones (S004, S008). Los datos utilizados para entrenar los LLM están afectados por limitaciones como lagunas, sesgos que reflejan la desigualdad social y distorsiones sistémicas. Esto genera una nueva categoría de amenazas — el “LLM Grooming”, una amenaza cognitiva para los sistemas generativos de IA que explota los vacíos informacionales en los datos de entrenamiento (S006).
Las comunidades marginadas sufren más
Los vacíos informacionales afectan desproporcionadamente a las comunidades marginadas y subrepresentadas, creando vacíos informacionales políticos que reflejan dinámicas de exclusión y desigualdad estructural (S009, S007). La investigación reveló contornos de vacíos informacionales en las consultas de Google que reflejan la explotación por parte de fuerzas de extrema derecha. Sin la generación de nuevo contenido verificado, ciertos vacíos informacionales no pueden ser llenados rápida y fácilmente (S001), lo que hace que el problema sea particularmente complejo de abordar y lo vincula a cuestiones más amplias como el sesgo de confirmación y la heurística de disponibilidad.
Mechanism
Arquitectura cognitiva de los vacíos informacionales: cómo los algoritmos y el cerebro crean la ilusión del conocimiento
Los vacíos informacionales operan en la intersección de tres sistemas: las limitaciones algorítmicas de los motores de búsqueda, los sesgos cognitivos de los usuarios y el comportamiento estratégico de los atacantes. Cuando un usuario introduce una consulta en un área con contenido de calidad limitado, los algoritmos se ven obligados a devolver lo que está disponible, incluso si se trata de fuentes de baja calidad, sesgadas o manipuladoras (S010). Esta situación genera la ilusión de plenitud informativa donde, en realidad, no la hay.
Heurística de disponibilidad y confianza en las plataformas
La heurística de disponibilidad es el primer mecanismo cognitivo que vuelve peligrosos los vacíos informacionales. Sobrevaloramos la importancia y la fiabilidad de la información que nos viene fácilmente a la mente, y los resultados de búsqueda en la primera página de Google son precisamente eso. La investigación muestra que los rankings sesgados de los resultados de búsqueda influyen en la actitud de los usuarios hacia temas controvertidos mediante mecanismos de procesamiento de la información (S010).
El segundo mecanismo es el efecto halo de las plataformas autoritarias. Confiamos en Google, Bing y otros motores de búsqueda como mediadores fiables de la información, interpretando automáticamente los resultados de búsqueda como “esto es lo que se sabe sobre el tema”, y no como “esto es lo que está disponible en el índice”. Este error intuitivo se ve reforzado porque las intervenciones de las plataformas, como los banners de advertencia, a menudo se basan en un procesamiento heurístico en lugar de un análisis sistemático (S005). Incluso cuando los usuarios son advertidos sobre un posible problema, pueden no procesar esa información con suficiente profundidad para modificar su comportamiento.
Confirmación de creencias en condiciones de incertidumbre
El sesgo de confirmación amplifica el efecto de los vacíos informacionales. Si un usuario ya tiende a una determinada postura, el vacío informacional rellenado con contenido que respalda esa postura será percibido como una confirmación de la validez de sus creencias. Esto genera un círculo vicioso: cuanto más dependen los usuarios de los motores de búsqueda para verificar la información, más vulnerables se vuelven a la explotación de los vacíos.
El estudio de Draws y colegas (2021) de la Universidad Técnica de Delft demostró que cuando los resultados de búsqueda están sistemáticamente sesgados hacia un lado del debate, los usuarios adoptan esa postura con mucha mayor frecuencia, incluso si inicialmente sostenían la opinión contraria (S010). Esto confirma que los vacíos informacionales no son simples lagunas pasivas, sino formadores activos de la opinión pública.
Escala del problema: de la búsqueda a la inteligencia artificial
La investigación del Stanford FSI mostró que los modelos de aprendizaje profundo pueden identificar entre 29 y 58 veces más vacíos informacionales de baja calidad que los métodos tradicionales, lo que indica la magnitud del problema, invisible para los usuarios comunes. El trabajo de Lewandowsky y colegas (2023) analizó el problema de la “confusión entre humano y algoritmo” en el contexto de los vacíos informacionales, demostrando que las lagunas en la cobertura de búsqueda pueden ser explotadas por atacantes y que los usuarios a menudo no perciben cuándo están interactuando con contenido manipulador (S002).
Los datos más alarmantes provienen de estudios sobre vacíos informacionales políticos. Flores‑Saviaga y colegas (2022) desarrollaron un sistema de IA para detectar vacíos informacionales políticos en comunidades subrepresentadas, mostrando que los grupos marginados se enfrentan sistemáticamente a vacíos más graves, lo que agrava la desigualdad en el acceso a información de calidad. El estudio de Norocel (2023) demostró cómo fuerzas de extrema derecha explotan estratégicamente los vacíos informacionales en Google para promover una política de exclusión.
Vacíos informacionales en la era de los grandes modelos de lenguaje
Investigaciones recientes de 2024‑2025 ampliaron la comprensión del problema. El trabajo de Shao y colegas (2025) sobre las alucinaciones de la IA mostró que los datos de entrenamiento de los LLM contienen lagunas, sesgos sistémicos y reflejan la desigualdad social (S004). Los vacíos informacionales se integran en la nueva generación de herramientas de IA, potencialmente intensificando el problema.
| Mecanismo cognitivo | Cómo funciona en los vacíos informacionales | Resultado para el usuario |
|---|---|---|
| Heurística de disponibilidad | Los primeros resultados de búsqueda se perciben como los más relevantes y fiables | Sobrevaloración de la importancia del contenido manipulador |
| Efecto halo | La confianza en la autoridad de la plataforma se transfiere a la calidad de los resultados | Aceptación ciega de fuentes sesgadas como objetivas |
| Sesgo de confirmación | Los vacíos se rellenan con contenido que respalda las creencias existentes | Fortalecimiento de opiniones erróneas en lugar de su corrección |
| Punto ciego del sesgo | Los usuarios no se dan cuenta de que su opinión está moldeada por el algoritmo | Falsa sensación de independencia del juicio |
El estudio mostró que el sistema de IA Perplexity, en general, funcionó mejor que Google en los vacíos informacionales, aunque todavía a veces reforzaba la creencia en información falsa. Esto indica que el problema de los vacíos informacionales no es meramente técnico, sino fundamental para cualquier sistema que deba proporcionar información en condiciones de escasez.
Domain
Example
Ejemplos de vacíos informacionales en situaciones reales
Escenario 1: Búsqueda de información sobre salud en el contexto de una pandemia
Al inicio de una nueva oleada de la enfermedad, el usuario busca información sobre los síntomas y los métodos de tratamiento. Dado que la enfermedad es nueva, las fuentes médicas autorizadas aún no han publicado guías detalladas y las investigaciones científicas se encuentran en etapas tempranas. Esto genera un vacío informacional clásico: una laguna en la cobertura de un tema de vital importancia (S001).
En esta situación, los motores de búsqueda devuelven lo que está disponible: blogs de calidad dudosa, publicaciones en redes sociales, “remedios caseros” no verificados y contenido deliberadamente desinformativo. Los atacantes, al reconocer la existencia del vacío informacional, crean estratégicamente contenido optimizado para los motores de búsqueda, promoviendo métodos de tratamiento ineficaces o peligrosos.
El usuario, confiando en los resultados de la búsqueda y sin percatarse de que se encuentra en un vacío informacional, puede tomar decisiones de salud basadas en información no fiable. Sin la generación de nuevo contenido verificado, dichos vacíos no pueden llenarse rápidamente, lo que convierte las etapas iniciales de crisis sanitarias en periodos especialmente vulnerables.
Qué podría ayudar: El usuario podría verificar la fecha de publicación de las fuentes, consultar los sitios oficiales de salud (OMS, ministerios nacionales) y esperar la aparición de estudios revisados por pares en lugar de basarse en los primeros resultados de la búsqueda.
Escenario 2: Vacíos informacionales políticos y comunidades marginadas
Un representante de una comunidad étnica o social subrepresentada busca información sobre los candidatos en elecciones locales o sobre iniciativas políticas que afectan a su grupo. Las fuentes autorizadas pueden simplemente no cubrir los temas relevantes para esas comunidades, creando un vacío informacional.
Ese vacío es llenado ya sea por fuentes de baja calidad o por contenido creado deliberadamente para manipular a los electores. Las investigaciones demuestran que fuerzas de extrema derecha explotan estratégicamente los vacíos informacionales en los motores de búsqueda para promover políticas de exclusión. Un usuario de una comunidad marginada que busca información sobre sus derechos políticos puede encontrarse con resultados que o bien ignoran sus intereses o bien promueven activamente una agenda contraria a su bienestar.
Qué podría ayudar: Recurrir a organizaciones locales, comunicarse directamente con los representantes de los candidatos y contrastar la información a través de varias fuentes independientes ayudaría a evitar la manipulación y a obtener una visión más completa.
Escenario 3: Asistentes de IA y alucinaciones en vacíos informacionales
El usuario contemporáneo recurre cada vez más a asistentes de IA basados en grandes modelos de lenguaje en lugar de los motores de búsqueda tradicionales. Sin embargo, estos sistemas heredan y potencialmente amplifican el problema de los vacíos informacionales, ya que sus datos de entrenamiento contienen lagunas, sesgos sistémicos y reflejan desigualdades sociales.
Un estudiante utiliza un asistente de IA para redactar un ensayo sobre un tema histórico poco investigado. Si en los datos de entrenamiento del modelo existe un vacío informacional sobre ese tema, la IA puede “alucinar”, generando información que suena plausible pero que es factualmente incorrecta. Las nuevas fuentes de inexactitud en los sistemas de IA a menudo están vinculadas precisamente a lagunas en los datos y a vacíos informacionales.
Resulta especialmente preocupante el fenómeno del “grooming LLM”, una nueva amenaza cognitiva para la IA generativa que explota los vacíos informacionales en los datos de entrenamiento. Los atacantes pueden crear deliberadamente contenido destinado a llenar esos vacíos en futuros conjuntos de datos, “entrenando” efectivamente a los sistemas de IA para difundir desinformación.
Qué podría ayudar: El estudiante debería contrastar la información proporcionada por el asistente de IA en bases de datos académicas, utilizar múltiples fuentes y evaluar críticamente la plausibilidad del contenido generado, sobre todo en temas poco investigados.
Escenario 4: Manipulación de la opinión pública mediante la creación estratégica de vacíos informacionales
La forma más sofisticada de explotar los vacíos informacionales implica su creación deliberada y su posterior llenado con contenido manipulador. Ante un evento político importante o una votación, los atacantes identifican temas que cuentan con una cobertura limitada en fuentes autorizadas.
Luego crean una red de sitios interconectados, blogs y publicaciones en redes sociales, optimizados para los motores de búsqueda, que promueven una línea narrativa específica. Cuando los usuarios habituales buscan información sobre esos temas, se encuentran con un ecosistema informacional cuidadosamente construido que parece diverso, pero que en realidad impulsa de forma coordinada una única perspectiva.
Los manipuladores aprovechan el conocimiento de que los rankings sesgados de los resultados de búsqueda influyen significativamente en la percepción de los usuarios sobre temas controvertidos. Llenan estratégicamente los vacíos informacionales con contenido que moldea la opinión pública en la dirección deseada. Los modelos de aprendizaje profundo pueden identificar entre 29 y 58 veces más vacíos informacionales de baja calidad que los métodos tradicionales, lo que indica la magnitud de una explotación potencial invisible para los usuarios comunes.
Qué podría ayudar: El usuario debería verificar las fuentes de información, prestar atención a narrativas repetidas en diferentes fuentes, consultar a expertos independientes y ser consciente de que sesgo de confirmación puede hacerle creer en contenido que coincide con sus creencias, aun cuando haya sido creado de forma manipuladora.
Red Flags
- •El motor de búsqueda devuelve resultados contradictorios sobre un mismo tema, y el usuario confía en la primera fuente encontrada.
- •La persona saca conclusiones sobre un fenómeno basándose en un solo artículo o fuente sin consultar otras.
- •Ante la falta de información oficial, la persona llena el vacío con sus propias suposiciones presentándolas como hechos.
- •El usuario difunde información no verificada porque no encontró refutaciones en los buscadores.
- •La persona confía en los primeros resultados de búsqueda sin darse cuenta de que pueden ser incompletos o sesgados.
- •Al buscar un tema marginal, la persona considera fuentes de baja calidad como autoritativas por falta de alternativas.
- •El usuario está seguro de su comprensión del tema, aunque buscó información en un conjunto limitado de fuentes.
Countermeasures
- ✓Verifique la información a través de varias fuentes independientes y bases de datos, especialmente sobre temas poco estudiados, para identificar lagunas en la cobertura.
- ✓Utilice bases de datos académicas especializadas y archivos, como Scopus, Web of Science, Redalyc o Dialnet, en lugar de depender únicamente de motores de búsqueda para indagar cuestiones de nicho.
- ✓Monitoree qué temas aparecen raramente en los resultados de búsqueda y busque deliberadamente fuentes alternativas de información sobre esos asuntos.
- ✓Entrénese en el análisis crítico de fuentes: evalúe la metodología de los estudios y compruebe la existencia de puntos de vista contrapuestos en temas controvertidos.
- ✓Participe en comunidades de expertos y especialistas, como redes de investigadores o foros académicos, donde se discutan las lagunas de conocimiento y se ofrezcan datos más completos en áreas específicas.
- ✓Documente las lagunas informativas detectadas y comparta esa información con investigadores y organizaciones dedicadas a la verificación de datos.
- ✓Emplee herramientas de análisis de tendencias de búsqueda y redes sociales, como Google Trends o herramientas de escucha social, para identificar qué preguntas quedan sin respuesta en el discurso público.
- ✓Desarrolle la habilidad de reconocer narrativas manipuladoras que rellenan los vacíos informativos, estudiando ejemplos de campañas de desinformación.
Sources
- /sources/10-33774-apsa-2020-f3rnf
- /sources/10-18653-v1-2023-acl-long-656
- /sources/10-1038-s41598-017-09084-6
- /sources/10-5194-essd-10-1807-2018
- /sources/10-1080-08120091003677553
- /sources/10-7551-mitpress-11805-001-0001
- /sources/10-1175-1520-0493-2001-129-2884-aeakff-2-0-co-2
- /sources/10-1175-1520-0493-1998-126-0796-dauaek-2-0-co-2