Logo - Full (Color)

Datos Estructurados (Structured Data / Schema Markup): qué son

Los datos estructurados son fragmentos de código añadidos al HTML de una página web para proporcionar a los motores de búsqueda y a los sistemas de IA información explícita y semánticamente precisa sobre el contenido de esa página, sin depender de que el sistema infiera esa información a partir del texto en lenguaje natural. Schema Markup es el vocabulario estandarizado más extendido para implementar datos estructurados en la web, mantenido por Schema.org y soportado por Google, Bing y otros motores de búsqueda. 

AEO Glossary
Structured Data / Schema Markup (Datos Estructurados) — Glosario AEO de HubSpot

¿Qué son los Datos Estructurados y para qué sirven en SEO y AEO?

Los Datos Estructurados (Structured Data) son un formato estandarizado de código que permite a los propietarios de sitios web comunicar información sobre sus páginas a los motores de búsqueda de forma inequívoca y procesable. En lugar de depender de que Google infiera el significado del contenido a partir del texto HTML, los Datos Estructurados declaran explícitamente qué tipo de entidad es la página (un artículo, un producto, una persona, una organización, un evento, una guía), qué atributos tiene esa entidad y cómo se relaciona con otras entidades. Schema Markup es el vocabulario más utilizado para implementar Datos Estructurados, basado en el estándar abierto de Schema.org que Google, Bing, Yahoo y Yandex desarrollaron conjuntamente para crear un lenguaje común de descripción de entidades en la web.

En el contexto del SEO, los Datos Estructurados tienen dos funciones principales. La primera es facilitar la comprensión del contenido por parte de los motores de búsqueda, reduciendo la ambigüedad semántica y permitiendo que Google indexe la página con mayor precisión para las consultas correctas. La segunda es habilitar los resultados enriquecidos en la SERP: cuando una página implementa correctamente el Schema Markup adecuado para su tipo de contenido, puede obtener resultados con estrellas de valoración, precios, preguntas frecuentes expandibles, breadcrumbs o imágenes junto al título y la meta descripción en los resultados de búsqueda, lo que aumenta la visibilidad visual del resultado y su Organic CTR.

En el contexto del AEO, los Datos Estructurados tienen una función adicional que los hace especialmente valiosos: son el canal de comunicación más directo y explícito entre el sitio web y los sistemas de IA que lo rastrean. Cuando un motor de respuesta con IA o el propio Knowledge Graph de Google procesan una página, los Datos Estructurados les proporcionan información inequívoca sobre la identidad de la entidad que representa el sitio, los atributos de esa entidad y sus relaciones con otras entidades reconocidas. Esta declaración explícita facilita el proceso de resolución de entidades del Knowledge Graph y mejora la precisión de los fragmentos que los sistemas de Grounding pueden extraer de la página.

Para los equipos de marketing B2B que trabajan con HubSpot, los Datos Estructurados representan una de las optimizaciones técnicas de mayor retorno por esfuerzo en el contexto del AEO. HubSpot CMS genera automáticamente algunos tipos de Datos Estructurados para las páginas estándar, pero la implementación de los tipos más relevantes para el AEO, como Organization, Article, FAQPage o HowTo, requiere configuración específica que conecta la identidad de la empresa con las fuentes externas de referencia que el Knowledge Graph consulta. Esta configuración es una inversión única que produce retornos continuos en el posicionamiento, en los resultados enriquecidos y en la Visibilidad en IA.

¿Qué tipos de Schema Markup son más relevantes para el AEO?

El tipo Organization es el Schema Markup más fundamental para el AEO de cualquier empresa porque declara la identidad de la entidad que opera el sitio web y la conecta con sus representaciones en otras fuentes externas. Las propiedades más importantes incluyen name (nombre oficial), url (URL del sitio), logo, description, foundingDate, address, contactPoint y, de forma especialmente crítica para el AEO, sameAs. La propiedad sameAs es un array de URLs que enlazan la entidad del sitio web con sus perfiles en plataformas de referencia como Wikidata, Wikipedia, LinkedIn y Crunchbase, indicándole explícitamente a Google que todas esas fuentes describen a la misma entidad. Es la acción técnica de mayor impacto directo para facilitar la inclusión correcta de la empresa en el Knowledge Graph.

El tipo Article es el Schema Markup más relevante para las páginas de contenido editorial. Sus propiedades más importantes para el AEO incluyen headline, author (con las propiedades del autor que demuestran Pericia y Autoridad según el E-E-A-T), datePublished, dateModified y publisher. La declaración explícita del autor con sus credenciales a través del tipo Person, enlazado a perfiles externos verificables como LinkedIn o perfiles académicos, es la señal de E-E-A-T más directa que los Datos Estructurados pueden proporcionar para el contenido editorial. Tiene impacto tanto en el posicionamiento orgánico como en la selección de la página como fuente de Grounding por los motores de respuesta.

El tipo FAQPage es especialmente valioso para el AEO porque estructura el contenido de preguntas y respuestas en un formato que los sistemas RAG pueden procesar directamente como pares pregunta-respuesta, el formato más cercano a los chunks ideales para el Grounding. Una página con FAQPage Schema correctamente implementado puede obtener el resultado enriquecido de preguntas frecuentes expandibles en la SERP de Google, aumentando la visibilidad visual del resultado, y además proporciona fragmentos claramente delimitados que los sistemas de recuperación semántica pueden indexar con alta especificidad. El tipo HowTo tiene un perfil similar pero para contenido de proceso: estructura los pasos de una guía en unidades discretas con nombre, imagen y descripción, habilitando resultados enriquecidos y mejorando la recuperabilidad de cada paso de forma independiente.

Otros tipos de Schema relevantes para sitios B2B incluyen Person para las páginas de perfiles del equipo directivo, Product o Service para las páginas de productos y servicios, Event para las páginas de webinars y conferencias, y BreadcrumbList para la arquitectura de navegación del sitio. Cada uno de estos tipos contribuye a una representación más completa de la empresa y su oferta en el Knowledge Graph de Google, lo que se traduce en mayor precisión de las respuestas de los motores de IA cuando los compradores preguntan sobre la empresa, sus productos o las categorías de soluciones que ofrece.

¿Cómo se implementan los Datos Estructurados y cuáles son los formatos disponibles?

Los Datos Estructurados pueden implementarse en tres formatos técnicos: JSON-LD, Microdata y RDFa. Google recomienda explícitamente JSON-LD como el formato preferido porque permite añadir los Datos Estructurados como un bloque de código independiente en el head o el body de la página, sin necesidad de modificar el HTML del contenido visible. Esta separación entre el marcado de datos y el HTML del contenido facilita el mantenimiento y reduce el riesgo de errores. JSON-LD se implementa dentro de una etiqueta script con el atributo type="application/ld+json" y su estructura sigue la sintaxis JSON estándar con propiedades y valores definidos por Schema.org.

Microdata es el formato más antiguo y requiere añadir atributos especiales (itemscope, itemtype, itemprop) directamente en los elementos HTML del contenido visible. Su principal ventaja es que los Datos Estructurados están integrados en el HTML que el usuario ve, reduciendo el riesgo de discrepancias entre contenido visible y datos declarados. Su principal desventaja es que dificulta el mantenimiento: cualquier cambio en la estructura visual de la página puede afectar a los datos estructurados. RDFa usa una sintaxis similar a Microdata basada en el estándar RDF y es menos frecuente en implementaciones de marketing web. Para la mayoría de los proyectos de AEO, JSON-LD es la elección práctica más eficiente.

La implementación práctica de los Datos Estructurados en un sitio B2B sigue un proceso de tres etapas. Primero, el inventario de tipos de Schema relevantes: identificar qué entidades y tipos de contenido existen en el sitio y qué tipos de Schema.org corresponden a cada uno. Segundo, la priorización de implementación: empezar por el tipo Organization en la página de inicio, el tipo Article en las páginas de blog de mayor tráfico, y FAQPage en las páginas con preguntas frecuentes. Tercero, la validación: usar la herramienta de prueba de resultados enriquecidos de Google y el validador de Schema.org para confirmar que el código es sintácticamente correcto y que Google puede procesarlo sin errores antes de publicar.

HubSpot CMS incluye capacidades nativas de generación de Datos Estructurados para los tipos más comunes, como Article para las entradas de blog y Organization para las páginas del sitio. Para tipos más específicos como FAQPage, HowTo o Product, HubSpot permite añadir bloques de JSON-LD personalizados en el head de cada página a través del gestor de metadatos, sin necesidad de acceder al código fuente directamente. HubSpot Marketing Hub integra además alertas sobre errores de Datos Estructurados detectados en Google Search Console, permitiendo identificar y corregir problemas de implementación que impidan que las páginas obtengan los resultados enriquecidos para los que el Schema ha sido configurado.

¿Cómo contribuyen los Datos Estructurados al Knowledge Graph y al Knowledge Panel?

Los Datos Estructurados del tipo Organization implementados en el sitio web oficial de una empresa son la señal más directa que esa empresa puede enviar a Google para facilitar su inclusión correcta en el Knowledge Graph. Cuando Google rastrea una página con Schema Organization que incluye la propiedad sameAs enlazando a los perfiles verificados de la empresa en Wikidata, Wikipedia, LinkedIn y Crunchbase, recibe un mapa explícito de las fuentes que describen a la misma entidad en distintos contextos. Esta información de conexión entre fuentes es exactamente lo que el proceso de resolución de entidades del Knowledge Graph necesita para fusionar las distintas representaciones de la empresa en un único nodo del grafo con todos sus atributos consolidados.

La propiedad sameAs del Schema Organization es el componente de mayor impacto individual para el Knowledge Graph porque resuelve el problema de ambigüedad de entidades. Cuando múltiples fuentes mencionan a una empresa sin contexto adicional suficiente para identificarla unívocamente, Google puede no saber con certeza si todas las fuentes se refieren a la misma entidad. La declaración explícita de sameAs con URLs a perfiles únicos en plataformas de referencia identifica inequívocamente la entidad, facilitando que Google consolide toda la información disponible sobre ella en su Knowledge Graph y la muestre correctamente en el Knowledge Panel cuando los usuarios buscan el nombre de la empresa.

La frecuencia de actualización de los Datos Estructurados también influye en la actualidad de la información del Knowledge Panel. Cuando la empresa actualiza la descripción, la sede, el número de empleados o cualquier otro atributo en su Schema Organization y Google rastrea esa página actualizada, el Knowledge Graph recibe una señal para actualizar esa información. Sin esta actualización explícita en los Datos Estructurados, Google debe depender de rastrear otras fuentes para detectar los cambios, lo que puede producir información desactualizada en el Knowledge Panel durante periodos más largos. Mantener el Schema Organization actualizado es una práctica de higiene de entidad con impacto directo en la precisión del Knowledge Panel y, por extensión, en la precisión de las Menciones en IA sobre la empresa.

Los tipos de Schema más allá de Organization también enriquecen el grafo de conocimiento de la empresa. El tipo Person en las páginas de perfiles del equipo directivo ayuda a Google a modelar las relaciones entre la organización y las personas que la forman. El tipo Product o Service en las páginas de productos ayuda a Google a modelar la oferta de la empresa como entidades relacionadas con la organización, lo que puede traducirse en una representación más completa de la empresa en los AI Overviews que responden a consultas sobre sus soluciones. Cada tipo de Schema adicional correctamente implementado añade nodos y relaciones al grafo de conocimiento de la empresa que los sistemas de IA pueden consultar para generar respuestas más precisas.

¿Qué resultados enriquecidos puede habilitar el Schema Markup en la SERP?

Google soporta un conjunto específico de tipos de Schema que pueden generar resultados enriquecidos en la SERP. Los más relevantes para sitios B2B incluyen las preguntas frecuentes expandibles (tipo FAQPage), las guías paso a paso (tipo HowTo), los resultados de artículos con imagen y fecha destacadas (tipo Article con imagen de alta resolución), los breadcrumbs en los resultados (tipo BreadcrumbList), los sitelinks de búsqueda de marca (tipo WebSite con potentialAction), y los resultados enriquecidos de eventos (tipo Event). En sectores con valoraciones, el tipo Review o AggregateRating puede habilitar las estrellas de puntuación visibles en la SERP, una de las señales de confianza visual más influyentes en el Organic CTR.

El resultado enriquecido de FAQPage tiene especial valor para el AEO por su doble impacto: en la SERP muestra entre dos y cuatro preguntas expandibles bajo el título del resultado, ocupando más espacio visual y aumentando el CTR; en los sistemas RAG, los pares pregunta-respuesta declarados en el Schema son los chunks más claramente delimitados y autónomos que el sistema puede extraer de la página. Cada par es un fragmento con una pregunta explícita y una respuesta directa que el sistema puede recuperar para la consulta exacta correspondiente. Esta doble ventaja, más CTR orgánico y mayor citabilidad en IA, hace del FAQPage Schema una de las implementaciones con mayor retorno en el contexto del AEO moderno.

El resultado enriquecido de HowTo puede mostrar en la SERP los pasos del proceso con nombres e imágenes, aumentando significativamente el espacio visual del resultado para consultas de intención procedimental. Para el AEO, la estructura de pasos numerados del HowTo Schema proporciona a los sistemas de recuperación contexto adicional sobre la posición de cada paso en el proceso, mejorando la recuperabilidad de pasos específicos para consultas que preguntan sobre fases específicas de un proceso más amplio. Un usuario que pregunta a Perplexity "cómo configurar el paso tres de la integración de HubSpot con Salesforce" se beneficia de que el HowTo Schema haya declarado ese paso como una unidad de información discreta y recuperable de forma independiente.

Google actualiza periódicamente los tipos de Schema que soporta para resultados enriquecidos, añadiendo nuevos tipos y modificando los requisitos de los existentes. La herramienta de prueba de resultados enriquecidos de Google Search Console es la fuente más actualizada para verificar qué tipos están activos y cuáles son los requisitos técnicos de cada uno. Una práctica eficiente es auditar periódicamente qué páginas del sitio tienen potencial de resultado enriquecido pero aún no tienen el Schema implementado, priorizando la implementación en las páginas de mayor tráfico y mayor impacto comercial para maximizar el retorno de la inversión técnica en Datos Estructurados.

¿Qué errores comunes de Schema Markup deben evitarse?

El error más frecuente y con mayor impacto negativo es la discrepancia entre los datos declarados en el Schema y el contenido visible de la página. Si el Schema FAQPage declara una pregunta y una respuesta que no existen en el HTML visible, o si el Schema AggregateRating declara una puntuación que no corresponde a ninguna reseña visible, Google puede considerarlo spam engañoso y aplicar acciones manuales. Las directrices de Google requieren explícitamente que los Datos Estructurados representen contenido que el usuario puede ver, no información añadida únicamente para manipular los resultados de búsqueda. Antes de implementar cualquier tipo de Schema, verificar que el contenido correspondiente está efectivamente visible en la página es el primer paso de la validación.

La implementación de Schema en páginas inadecuadas para ese tipo es el segundo error relevante. Implementar FAQPage Schema en páginas que no tienen formato de preguntas y respuestas, o HowTo Schema en páginas que no explican un proceso paso a paso, produce errores de validación en Google Search Console y reduce la credibilidad general del dominio ante los sistemas de evaluación de calidad de Google. La coherencia entre el tipo de Schema implementado y la naturaleza real del contenido es un requisito fundamental para que la implementación sea efectiva y no contraproducente.

Los errores sintácticos en el JSON-LD son el tercer problema común, especialmente en implementaciones manuales sin validación automática. Los errores más frecuentes incluyen comas faltantes entre propiedades, comillas incorrectas, arrays no cerrados correctamente y tipos de datos incorrectos (un número donde se espera una cadena de texto o viceversa). Estos errores producen que el Schema sea inválido y que Google no pueda procesarlo, anulando cualquier beneficio potencial sin generar penalizaciones. El uso de la herramienta de prueba de resultados enriquecidos y el validador de Schema.org para verificar cada implementación antes de publicar es la práctica más eficiente para detectar y corregir estos errores.

La implementación de propiedades deprecadas es el cuarto error relevante. Schema.org actualiza periódicamente su vocabulario y algunas propiedades quedan obsoletas y son reemplazadas por equivalentes más precisos. Las implementaciones basadas en guías desactualizadas pueden incluir propiedades que Google ya no procesa, lo que reduce la efectividad del Schema sin producir errores detectables en la validación básica. La verificación periódica de las implementaciones existentes con la documentación actualizada de Schema.org, especialmente tras actualizaciones mayores del vocabulario, es la práctica recomendada para mantener las implementaciones vigentes. HubSpot CMS gestiona automáticamente la compatibilidad de los Datos Estructurados generados de forma nativa, reduciendo el riesgo de este tipo de errores para los tipos más comunes.

¿Cómo evolucionarán los Datos Estructurados en el contexto de la búsqueda con IA?

Los Datos Estructurados están ganando importancia estratégica en el contexto de la búsqueda con IA porque los sistemas de IA procesan la información estructurada con mayor precisión y confianza que el texto no estructurado. Cuando un motor de respuesta con IA puede leer los atributos de una entidad de forma inequívoca a través de un Schema Organization bien implementado, en lugar de inferirlos a partir del texto de múltiples páginas, el resultado es una representación más precisa y consistente de esa entidad en las respuestas generadas. Esta ventaja de precisión hace que los Datos Estructurados sean especialmente valiosos en el AEO, donde la exactitud de la representación de la entidad influye directamente en el Sentimiento en IA y en la calidad de las Menciones en IA.

El desarrollo de nuevos tipos de Schema orientados a las capacidades de los sistemas de IA es una tendencia emergente. A medida que los casos de uso de la búsqueda generativa se consolidan, la comunidad de Schema.org y los principales motores de búsqueda están identificando qué tipos de información estructurada son más útiles para los sistemas de IA y cómo el vocabulario puede extenderse para capturarlos. El tipo Dataset, por ejemplo, permite declarar conjuntos de datos de investigación de forma estructurada, lo que puede facilitar que los modelos de IA citen los datos originales de una empresa con mayor precisión cuando responden a consultas sobre estadísticas del sector.

La convergencia entre los Datos Estructurados y el Grounding en tiempo real de los motores de respuesta es otra tendencia relevante. Actualmente, el Grounding se basa principalmente en la recuperación de fragmentos de texto. En el futuro, es plausible que los sistemas de Grounding más avanzados puedan recuperar datos específicos declarados en los Datos Estructurados, especialmente para afirmaciones factuales de alta precisión como precios, especificaciones técnicas o resultados de investigaciones declaradas en Schema Product o Schema Dataset. Esta evolución convertiría los Datos Estructurados en una fuente de Grounding aún más directa y verificable que el texto narrativo.

Para los equipos de marketing B2B que trabajan con HubSpot, la implicación práctica es invertir en construir una arquitectura de Datos Estructurados completa y bien mantenida para el sitio web, que cubra la identidad de la organización, el contenido editorial y la oferta de productos o servicios. Esta arquitectura es una inversión de largo plazo cuyos retornos crecen a medida que los sistemas de búsqueda con IA evolucionan hacia mayor dependencia de la información estructurada para generar respuestas precisas. HubSpot CMS y Marketing Hub proporcionan las herramientas técnicas y analíticas para construir, mantener y medir el impacto de esta arquitectura de forma sistemática y orientada a los resultados de negocio.

Puntos clave : Structured Data / Schema Markup (Datos Estructurados)

Los Datos Estructurados son un formato estandarizado de código que declara explícitamente qué tipo de entidad es una página web, sus atributos y sus relaciones con otras entidades, en un lenguaje procesable por los motores de búsqueda y los sistemas de IA. Schema Markup es el vocabulario más utilizado, basado en Schema.org. En SEO, habilitan resultados enriquecidos en la SERP que aumentan el Organic CTR. En AEO, son el canal de comunicación más directo entre el sitio web y los sistemas de IA: el Schema Organization con sameAs facilita la resolución de entidades en el Knowledge Graph; el Schema FAQPage estructura pares pregunta-respuesta como chunks ideales para los sistemas RAG; el Schema Article con atribución de autoría refuerza las señales de E-E-A-T. Google recomienda el formato JSON-LD. Los errores críticos a evitar son las discrepancias entre datos declarados y contenido visible, la implementación en páginas inadecuadas, los errores sintácticos y el uso de propiedades deprecadas. HubSpot CMS facilita la implementación nativa de los tipos más comunes y permite añadir JSON-LD personalizado para tipos específicos del AEO.

Preguntas frecuentes sobre Structured Data / Schema Markup

¿Los Datos Estructurados mejoran directamente el posicionamiento orgánico?

Google ha confirmado que los Datos Estructurados no son un factor de posicionamiento directo: implementar Schema Markup correcto no garantiza automáticamente una mejora de posición en los resultados orgánicos. Su impacto en el tráfico se produce de forma indirecta: habilitando resultados enriquecidos que aumentan el Organic CTR, mejorando la comprensión del contenido por parte de Google para las consultas correctas, y contribuyendo a la representación de la entidad en el Knowledge Graph con impacto en la Visibilidad en IA.

¿Es necesario implementar Datos Estructurados en todas las páginas del sitio?

No es necesario implementarlos en todas las páginas. La prioridad debe darse a las páginas con mayor potencial de resultado enriquecido o de mejora de la representación de entidad: la página de inicio o una página dedicada para el Schema Organization, las páginas de blog de mayor tráfico para el Schema Article, las páginas con preguntas frecuentes para el Schema FAQPage, y las páginas de productos o servicios para los tipos correspondientes. Las páginas de conversión, legales y de navegación tienen menor prioridad de implementación.

¿Cuánto tiempo tarda Google en procesar los Datos Estructurados después de su implementación?

El tiempo varía entre días y semanas dependiendo de la frecuencia con que Google rastrea el sitio. Una vez rastreada e indexada la página, puede tardar varios días o semanas adicionales en mostrar los resultados enriquecidos en la SERP. La herramienta de prueba de resultados enriquecidos de Google Search Console permite verificar si el Schema está siendo procesado correctamente sin necesidad de esperar a que el resultado enriquecido aparezca en la SERP, acelerando la detección de problemas de implementación.

¿Pueden los Datos Estructurados perjudicar al posicionamiento si se implementan incorrectamente?

Sí, en casos específicos. Si los Datos Estructurados contienen información engañosa o spam, como valoraciones que no existen o datos que no corresponden al contenido visible, Google puede aplicar acciones manuales que perjudican el posicionamiento de la página o del dominio. Los errores técnicos de sintaxis, en cambio, simplemente impiden que Google procese el Schema sin producir penalizaciones: el resultado es no obtener los beneficios pero sin coste de posicionamiento. Siempre se debe validar la implementación con las herramientas oficiales de Google antes de publicar.

¿Los Datos Estructurados tienen impacto en los AI Overviews de Google?

Google no ha documentado oficialmente el impacto exacto de los Datos Estructurados en la probabilidad de ser citado en los AI Overviews. Sin embargo, dado que los AI Overviews utilizan los mismos sistemas de indexación que la búsqueda orgánica, y dado que los Datos Estructurados mejoran la comprensión de la entidad y el contenido por parte de Google, es razonable esperar que páginas con Schema correctamente implementado tengan alguna ventaja como fuentes de AI Overviews, especialmente a través del impacto del Schema Organization en la representación de la entidad en el Knowledge Graph.