¿Qué tipos de alucinaciones existen y cuáles son más frecuentes en marketing?
Las alucinaciones de IA pueden clasificarse en cuatro tipos según la naturaleza del error, con implicaciones diferentes para los equipos de marketing.
Tipo 1 — Alucinación factual:
El modelo afirma como cierto un hecho que es objetivamente falso o que nunca ocurrió. En marketing: estadísticas inventadas ("el 73% de las empresas B2B reportaron un incremento del 40% en leads tras implementar AEO", sin que ningún estudio haya publicado esos datos), citas atribuidas incorrectamente, descripciones de características de productos que no son reales. Es el tipo más peligroso para la credibilidad editorial de la empresa si se publica sin verificación.
Tipo 2 — Alucinación de fuente:
El modelo cita una fuente que no existe o que existe pero no contiene la afirmación citada. Es el tipo más documentado. Un LLM puede generar un título de artículo plausible, un nombre de autor creíble, un año de publicación coherente y un nombre de revista reconocida — todo inventado — porque ha aprendido los patrones de cómo se citan fuentes académicas y los aplica aunque esas referencias no existan. La regla práctica: nunca incluir en contenido publicado ninguna referencia generada por un LLM sin haberla verificado manualmente en la fuente original.
Tipo 3 — Alucinación de entidad:
El modelo confunde, mezcla o inventa información sobre personas, empresas, productos o eventos específicos. Puede atribuir a una empresa un lanzamiento de producto que no ocurrió, mezclar información de dos empresas con nombres similares, o describir a un ejecutivo con datos de otra persona. Son más frecuentes cuanto menor es la presencia de la entidad en el corpus de entrenamiento.
Tipo 4 — Alucinación de síntesis:
El modelo produce una afirmación que es incorrecta no porque ninguno de sus componentes sea falso, sino porque su combinación produce una conclusión que ninguna de las fuentes subyacentes sostiene. Este tipo es el más sutil y difícil de detectar porque cada afirmación individual puede ser verificable, pero su integración en una síntesis produce algo que no existe como conclusión en ninguna fuente. En el contexto de los Answer Engines, puede ocurrir cuando el sistema RAG recupera fragmentos de múltiples fuentes que el LLM sintetiza de forma incorrecta — produciendo una respuesta citada con fuentes reales pero cuya conclusión ninguna de esas fuentes sostiene individualmente.