Curso de Sitemaps
Te dejo con un curso exprés y comprimido, para que en 20 minutos sepas todo lo que necesitas sobre Sitemaps.
🧑🏻🏫 ¿Google te ignora? La diferencia entre que te vean y que te elijan
Seguro que alguna vez has publicado una URL y te has frustrado porque no aparece en Google. ¿Pero si mi web está bien, por qué no salgo?. Aquí falla la base: confundir que Google sepa que existes con que le importes.
Vamos a usar la analogía del bibliotecario para entenderlo de una vez por todas. Imagina que Google es un bibliotecario con una tarea imposible: catalogar todos los libros del mundo (en principio ese era el mantra de Google organizar toda la información del mundo, hasta que lo cambió por ganar todo el dinero del mundo. xD).
Rastreo (crawling): El bibliotecario corre por los pasillos (tu web) y anota que existe un libro nuevo. Lo descubre.
Indexación (indexing): El bibliotecario se sienta, lee el libro, mira si aporta valor y decide si merece la pena añadirlo al catálogo para que la gente lo encuentre.
Punto clave: Que Google rastree tu página (la descubra) no garantiza que la vaya a indexar.
El problema es que el bibliotecario (Googlebot) tiene un tiempo limitado para visitar tu biblioteca cada día. A esto lo llamamos crawl budget. Tu misión como SEO no es solo que te visiten, sino que Google no pierda ese tiempo precioso en pasillos vacíos o libros rotos (errores 404, filtros inútiles). Hoy empezamos a aprender a gestionar ese tiempo.
🧑🏻🏫 El GPS de tu web, ¿por qué Google se pierde sin tu ayuda?
Si tu web fuera una ciudad gigante, el sitemap XML no es más que el mapa GPS que le entregas a Google en la entrada.
Sí, Google podría intentar descubrir todas tus calles (URLs) conduciendo sin rumbo y siguiendo enlaces, pero es lento y probablemente se deje callejones sin salida o barrios nuevos sin visitar. El sitemap es tu forma de decirle: “Oye, déjate de vueltas, aquí tienes la lista exacta de las calles que quiero que visites”.
Pero cuidado con los mitos que te pueden confundir:
Mito: Si tengo sitemap, seguro que indexo. Falso. El sitemap “garantiza”, más bien favorece, el descubrimiento, no la indexación. Si tu contenido es malo, ya puedes tener el mejor sitemap del mundo, que Google no lo querrá.
Mito: Google me penaliza si no tengo sitemap. Falso. Pero estás desperdiciando la mejor herramienta de comunicación directa que tienes con él.
Úsalo para lo que sirve, velocidad de descubrimiento para contenidos nuevos y para asegurar que Google encuentra esas URLs profundas a las que es difícil llegar navegando.
🧑🏻🏫 Las reglas de oro, por qué tu sitemap se rompe si no está en la raíz
El protocolo de sitemaps es como un documento oficial, si no sigues las normas burocráticas, Google lo tira a la basura. No te compliques, solo necesitas grabar a fuego estas reglas técnicas:
Límite de peso y cantidad: máximo 50.000 URLs por archivo y máximo 50 MB (olvida lo de los 10MB, eso es historia antigua).
La regla de ubicación (muy importante): un sitemap solo tiene autoridad sobre las URLs que están en su mismo directorio o en inferiores.
Mal: Si pones tu sitemap en
midominio.com/blog/sitemap.xml, NO puedes incluir productos demidominio.com/tienda/. Google las ignorará.Bien: Por eso tu sitemap (o tu índice) SIEMPRE debe estar en la raíz:
midominio.com/sitemap.xml.
Ah, y cuidado con la codificación. Tiene que ser UTF-8. Como se te cuele una tilde mal puesta en otro formato, el archivo peta y Googlebot se da media vuelta.
Referencia:
- Sitemaps.org
🧑🏻🏫 Diseccionando el XML: etiquetas que importan vs. basura
No te asustes por el código. Un sitemap es ridículamente simple si sabes qué mirar. Si abres uno, verás mucha paja, pero solo tres cosas son obligatorias:
<urlset>: La portada y contraportada del libro.<url>: El capítulo de cada página.<loc>: La etiqueta reina. Aquí va la URL exacta de tu página.
Tu primera tarea de auditoría, abre tu sitemap y mira las etiquetas <loc>. ¿Ves errores de novato?
¿URLs con
httpcuando tu web eshttps?¿URLs relativas tipo
/mi-paginaen vez de la absoluta?¿Estás listando URLs que luego hacen redirección o tienen canonical a otra parte?
Regla de oro: En el sitemap solo entra la crème de la crème. Solo URLs finales, canónicas, que den un código 200 OK y que quieras indexar sí o sí. Todo lo demás, fuera.
🎁 Te dejo nuestra herramienta de VON SEO Tools (una extensión para Chrome) para analizar los sitemaps con dos clicks y sin complicaciones.
🧑🏻🏫 Etiquetas opcionales: <lastmod> es Dios, el resto es ruido
Aquí es donde la mayoría de plugins y webmasters pierden el tiempo. El protocolo permite añadir “pistas” extra a cada URL, pero Google (y John Mueller lo ha dicho mil veces) ignora casi todas.
<changefreq>(frecuencia de cambio): Le dices a Google “esto cambia cada hora”. Realidad: Google te ignora. Sabe mejor que tú cada cuánto cambias.<priority>(prioridad): Le pones un 1.0 a la home y 0.8 al resto. Realidad: Google también lo ignora. Ya sabe qué es importante por tus enlaces internos.
La única que importa: <lastmod> Esta sí. Le dice a Google la fecha exacta de la última modificación real del contenido. Si la usas bien (y no mientes diciendo que todo cambió hoy), es un arma brutal para el Crawl Budget. Google verá la fecha, verá que es nueva y priorizará el rastreo de esa URL sobre las que no han cambiado.
🧑🏻🏫 ¿El sitemap crearlo a mano? ni se te ocurra (casi nunca)
Estamos en 2026. Nadie pica sitemaps a mano en el bloc de notas salvo para aprender o para una landing page estática de 5 URLs.
Si usas WordPress: plugins como Yoast SEO o Rank Math lo hacen solos. Actívalo y olvídate. Lo único que tienes que configurar es qué excluir (fuera etiquetas, fuera archivos de medios, fuera autores si no escriben).
Si usas Shopify/Wix: ni siquiera tienes plugin. La plataforma lo genera en
tudominio.com/sitemap.xmly no puedes tocarlo mucho. Es lo que hay.La navaja suiza (Screaming Frog): Si eres consultor o tienes una web a medida extraña, usa Screaming Frog. Rastreas la web, vas a
Sitemaps > XML Sitemapy te genera el archivo perfecto limpio de polvo y paja para subirlo al servidor.
El objetivo no es que sepas escribir XML, es que sepas dónde está tu sitemap para dárselo a Google.
🧑🏻🏫 ¿Picar código a mano en 2026? sólo para valientes (y casos muy concretos)
Ya sé lo que piensas, ¿Javi, en serio me vas a hacer escribir XML a mano?. Tranquilo, el 99% de las veces no hace falta. Pero hay un 1% de casos donde te salvará la vida: webs “micro” de 5 páginas en HTML estático o landings de campaña aisladas que necesitas indexar para ayer.
Hoy nos ponemos el mono de obra para un taller rápido:
Abre el bloc de Notas: Sí, así de simple.
Copia la estructura básica:
<urlset>,<url>,<loc>y<lastmod>.El paso crucial - VALIDAR: No subas nada sin pasarlo por un validador online. Un error tonto, como poner un
&sin escapar (debe ser&), y todo tu trabajo se va a la basura porque Google no podrá leerlo.Súbelo: FTP o cPanel a la raíz. Listo.
🧑🏻🏫 El problema del millón de URLs: índices de Sitemaps
Si tu web es gigante (un eCommerce potente o un medio), te vas a chocar con el límite: 50.000 URLs o 50 MB por archivo. ¿La solución? No hagas un mapa más grande, haz un “índice de mapas”.
El sitemap index es simplemente un archivo que lista otros sitemaps. Es la “guía de guías”.
Estrategia Pro: No los dividas a lo loco. Hazlo con cabeza para diagnosticar mejor.
eCommerce:
sitemap-productos.xml,sitemap-categorias.xml.Medios:
sitemap-news-2025.xml,sitemap-news-2024.xml. Así, cuando entres a Search Console y veas errores, sabrás al instante si fallan tus productos o tus categorías. Divide y vencerás.
🧑🏻🏫 Sitemaps VIP: imágenes, vídeo y el club de Google News
A veces, con listar la URL no basta. Google tiene “carriles especiales” para ciertos contenidos y tenemos sitemaps específicos para ellos:
Imágenes: casi siempre recomendado. Ayuda a posicionar en Google Imágenes. Screaming Frog te lo hace automático activando un check.
Vídeo: ojo aquí. Solo si alojas tú los vídeos (algo raro hoy día). Si usas YouTube, olvídate, ellos ya se encargan.
Google News: La joya de la corona para medios. Reglas estrictas: solo noticias de las últimas 48 horas. Si no eres un medio aprobado en Publisher Center, ni te molestes.
🧑🏻🏫 Hreflang en sitemaps, la solución elegante para webs internacionales
Si tienes una web multiidioma, el hreflang es obligatorio para que Google no se vuelva loco mostrando la versión inglesa en España. Tienes 3 formas de ponerlo: en el HTML (pesado), en cabeceras (complicado) o en el Sitemap (¡La mejor!).
Es la forma más limpia. Tu web carga rápido porque no ensucias el código, y Google recibe las instrucciones claras en el XML. Regla de oro: El hreflang es bidireccional. Si A apunta a B, B tiene que apuntar a A. Si no se cierran el círculo, Google ignora la señal.
🧑🏻🏫 Enviarlo a Google: método pasivo vs. activo
Ya tienes tu sitemap perfecto. ¿Ahora qué?
Método pasivo (robots.txt): Añade una línea al final de tu robots.txt:
Sitemap: https://midominio.com/sitemap_index.xml. Esto es un aviso general para Google, Bing, y cualquier bot que pase por ahí.Método activo (Search Console): Ve a la sección Sitemaps, pega la URL y dale a “Enviar”. Esto es obligatorio para ver las estadísticas de las que hablaremos mañana.
Método antiguo (ping): Olvídate de hacer ping a URLs raras. Eso es SEO de 2010. Con GSC y el
lastmodvas sobrado.
🧑🏻🏫 GSC, diagnóstico y la métrica trampa
Entras a Search Console, ves “Estado: Correcto” en verde y te relajas. ¡Error! Hay una métrica trampa: “URLs descubiertas”. Que Google haya encontrado 1.000 URLs en tu sitemap NO significa que haya indexado las 1.000.
La magia está en cruzar datos con el Informe de Cobertura. Filtra por tu sitemap y busca los horrores:
Enviada y no indexada: Tu contenido no le gusta a Google (o es duplicado).
Excluida por noindex: ¿Para qué la pones en el sitemap si le dices que no la indexe? ¡Sácala de ahí!.
🧑🏻🏫 Auditoría avanzada: higiene y URLs huérfanas
Terminamos con el nivel experto. Un sitemap “sucio” es veneno para tu Crawl Budget.
Tu sitemap SOLO debe tener: URLs canónicas, código 200 e indexables. Si tienes redirecciones 301, errores 404 o páginas bloqueadas en tu sitemap, estás obligando a Googlebot a trabajar para nada.
El truco final con Screaming Frog: Cruza el rastreo de tu web con el de tu sitemap para encontrar URLs Huérfanas. Son esas páginas que existen en tu sitemap pero que no tienen ningún enlace interno en tu web. Si no las enlazas tú, ¿por qué debería importarle a Google?.






