Validador Sitemap
Estructura y URLs de sitemap.xml
SEOSi no incluyes /sitemap.xml, se añadirá automáticamente
Acerca de esta herramienta
El Validador de Sitemap de lab.m8d.io analiza y valida archivos sitemap.xml según las especificaciones del protocolo Sitemap 0.9. Verifica la estructura XML, declaración XML, namespace correcto, formato de URLs, fechas en formato W3C, valores de changefreq y priority, límites de tamaño, y detecta extensiones como imágenes, vídeos, noticias y hreflang. Soporta tanto sitemaps simples (urlset) como índices de sitemaps (sitemapindex).
Qué verifica este validador
El análisis cubre todas las especificaciones del protocolo Sitemap y las extensiones comunes de Google:
• Estructura XML — Verifica que el archivo sea XML válido con la declaración <?xml version="1.0" encoding="UTF-8"?> correcta. La ausencia de esta declaración genera una advertencia.
• Namespace — Comprueba que el elemento raíz use el namespace correcto: xmlns="http://www.sitemaps.org/schemas/sitemap/0.9". Sin el namespace correcto, los motores de búsqueda pueden ignorar el sitemap.
• URLs — Cada <loc> debe contener una URL absoluta válida con protocolo HTTPS (las URLs HTTP generan advertencia). Se detectan URLs duplicadas, que desperdiciarían el presupuesto de rastreo.
• Fechas — Los valores de <lastmod> deben estar en formato W3C Datetime (YYYY-MM-DD o ISO 8601 completo). Fechas futuras o con formato incorrecto generan errores.
• Changefreq — Valores permitidos: always, hourly, daily, weekly, monthly, yearly, never. Cualquier otro valor es un error de validación.
• Priority — Debe ser un número decimal entre 0.0 y 1.0 inclusive. Valores fuera de rango generan error.
• Límites — El protocolo limita cada sitemap a 50,000 URLs y 50 MB sin comprimir. Exceder estos límites genera error.
• Extensiones — Detecta el uso de extensiones de Google para imágenes (image:image), vídeos (video:video), noticias (news:news) y hreflang (xhtml:link).
Sitemap vs Sitemap Index
Existen dos tipos de archivos sitemap:
• Sitemap (urlset) — Contiene directamente las URLs del sitio con sus metadatos opcionales (lastmod, changefreq, priority). Limitado a 50,000 URLs.
• Sitemap Index (sitemapindex) — Es un archivo maestro que referencia otros sitemaps. Útil cuando un sitio tiene más de 50,000 URLs o cuando se quieren organizar sitemaps por secciones (productos, blog, categorías). Cada entrada tiene un <loc> apuntando a un sitemap individual y opcionalmente un <lastmod>.
El validador detecta automáticamente el tipo y aplica las validaciones correspondientes. Para sitemap index, muestra la lista de sitemaps referenciados con sus fechas de última modificación.
Mejores prácticas para sitemaps
Para maximizar la efectividad del sitemap:
1. Incluir solo URLs canónicas — No incluir URLs con parámetros de tracking, versiones con y sin www, ni páginas redirigidas.
2. Usar HTTPS en todas las URLs — Las URLs HTTP indican un problema de migración incompleta.
3. Mantener lastmod actualizado — Solo cambiar la fecha cuando el contenido realmente cambie. Fechas falsas reducen la confianza de los crawlers.
4. No exceder los límites — Usar sitemap index si tienes más de 50,000 URLs.
5. Comprimir con gzip — Reduce el ancho de banda necesario para servir el sitemap.
6. Registrar en robots.txt — Añadir la directiva Sitemap: https://ejemplo.com/sitemap.xml al final del robots.txt.
7. Enviar a Google Search Console — Registrar el sitemap en Search Console para monitorear su estado de indexación.
Preguntas frecuentes
¿Es obligatorio tener un sitemap.xml?
No es obligatorio. Google puede descubrir páginas mediante enlaces internos. Sin embargo, un sitemap es altamente recomendable para sitios grandes (>500 páginas), sitios nuevos con pocos enlaces externos, sitios con contenido dinámico o páginas huérfanas (sin enlaces internos). El sitemap no garantiza indexación, pero facilita el descubrimiento de páginas por los crawlers.
¿Qué significa que mi sitemap exceda los 50 MB?
El protocolo Sitemap limita cada archivo a 50 MB sin comprimir y 50,000 URLs. Si tu sitemap excede estos límites, debes dividirlo en múltiples sitemaps y crear un sitemap index que los referencia. La compresión gzip reduce el tamaño de transferencia pero no cuenta para el límite de 50 MB, que se aplica al archivo descomprimido.
¿Las extensiones de imágenes y vídeos son necesarias?
Las extensiones de imágenes (image:image) y vídeos (video:video) en sitemaps ayudan a Google a descubrir y indexar estos recursos multimedia. Son especialmente útiles si las imágenes o vídeos se cargan dinámicamente con JavaScript y no son fácilmente descubribles por el crawler. Google también puede descubrir imágenes mediante el rastreo normal del HTML.
¿Con qué frecuencia debo actualizar mi sitemap?
El sitemap debe actualizarse cada vez que se añaden, modifican o eliminan páginas. La mayoría de CMS (WordPress, Shopify) generan sitemaps dinámicamente. Si tu sitemap es estático, automatiza su generación en el proceso de despliegue. La etiqueta <lastmod> solo debe cambiar cuando el contenido real de la página cambia significativamente.