Sitemap

Un Sitemap o mapa de sitio es un documento generalmente creado en XML que contiene una lista de todas las URL de un sitio web. Este mapa de sitio es útil para usuarios y especialmente para buscadores que pueden identificar fácilmente todas las URL de un sitio web. Un archivo puede estar en varios formatos, aunque el que se usa actualmente es el XML.

Los Sitemaps pueden contener información adicional como la última fecha de actualización del contenido de una URL y pueden estar ordenados según múltiples criterios, siendo el preferente el jerárquico.

El posicionamiento en los buscadores de los sitios que se diseñan y realizan es clave, ya que hoy en día existe un entorno muy competitivo en la web. De ello depende en gran medida muchas veces el éxito o el fracaso. En el mundo del diseño web, el posicionamiento ha ganado una gran importancia. Es por ello por lo que es importante dedicarle todo el tiempo y esfuerzo necesario para optimizar las páginas y para conseguir buenos enlaces para dicha página. Esta es una manera de que el sitio web rinda correctamente, y para ello debemos conseguir que todas las páginas del sitio estén correctamente entrelazadas en los motores de búsqueda. Esto se consigue cuando los crawlers (arañas) de los buscadores importantes visiten y registren esas páginas con cierta periocidad y sin omitir ninguna.

Una buena estrategia para el posicionamiento de nuestra página es suministrar a los buscadores una “lista” de las páginas que más nos interesan que se registren, acompañado con información adicional que haga la visita más eficaz. Para todo ello se utilizan los Sitemaps. Un Sitemap, como bien hemos comentado anteriormente, es un archivo XML que contiene una lista de las páginas del sitio junto a información adicional, como puede ser la frecuencia con la que la página cambia sus contenidos, cuándo fue la última actualización, etc. La construcción del archivo XML tiene que seguir una serie de pautas determinadas en el protocolo de Sitemaps, algunas de las cuales son:

Contenidos del Sitemap

El protocolo de Sitemaps se basa en etiquetas XML (Tags), que están incluidas en un archivo con codificación UTF-8. Los valores de los datos tienen que usar códigos de escape para ciertos caracteres especiales, tal como sucede en HTML.

Un ejemplo es las comillas dobles (“), que deben de ser reemplazadas por » y los signos de mayor y menor deben de sustituirse por &lt y &gt respectivamente.

El sistema XML debe:

  • Empezar con una etiqueta de apertura (urlset), y finalizar con una de cierre (/urlset).
  • Definir el protocolo estándar que responde dentro de la etiqueta de apertura (urlset).
  • Insertar una entrada (url) por cada dirección URL como nodo XML padre.
  • Insertar un nodo XML hijo (loc) para cada dirección URL.
  • Ese archivo XML se aloja en el servidor como uno más del sitio, con la excepción de que puede contener las URL en el mismo directorio en el que está, o en otros que estén contenidos en el mismo sitio.
  • Una vez realizado todo lo anterior, solo hay que enviar el Sitemap a los buscadores.

Funcionalidad del Sitemap

Aunque no todas las páginas tienen un Sitemap, es aconsejable tenerlo puesto que ayuda a la optimización de SEO, lo que nos genera más visitas a nuestra página y esto se traduce en más clientes. A continuación, exponemos algunos casos en los que es conveniente tener Sitemaps:

  • Es una web muy grande, y sin un Sitemap es posible que los rastreadores de Google se olviden de rastrear páginas nuevas o contenido actualizado recientemente.
  • La web tiene muchas páginas de contenido, pero estas están mal enlazadas o directamente no están enlazadas. Si en un sitio web las páginas del propio sitio no hacen referencia entre sí mismas de forma natural, está la opción de numerarlas en un Sitemap para asegurar que Google no pase por alto ninguna de estas páginas.
  • El sitio web es muy nuevo y aún tiene pocos o no tiene enlaces externos. Los rastreadores webs y el robot de Google se dedican a seguir los enlaces que existen de una página a otra para rastrear la Web. Es por ello por lo que existe la posibilidad de que Google no detecte las páginas si detecta que no son destinatarias de enlaces de otros sitios web.
  • El sitio web usa contenidos de soportes interactivos, aparece en Google Noticias o usa otras anotaciones que sean compatibles con Sitemaps. Google suele tener en cuenta la información adicional que incluyen los Sitemaps a la hora de realizar una búsqueda, si es necesario.