viernes, 11 de septiembre de 2009

Sitemaps

En el post anterior hacía la siguiente definición de sitemap:

Los "sitemaps" son unos índices de las páginas de un web site que indican al bot de Google qué paginas debe indexar en su rastreo


En la web sitemaps.org se proporciona más información sobre los sitemaps, incluyendo la especificación de la sintaxis (basada en XML) de un archivo sitemap.

¿Qué son los "sitemap"?

Son un mecanismo sencillo por el que los webmaster pueden informar a los motores de búsqueda sobre las páginas de sus lugares web que están disponibles para ser rastreadas. En su forma más sencilla, un sitemap es un archivo XML con un listado de URLs de un sitio web, junto con un conjunto de metadatos adicionales sobre cada una de estas URL (cuando se actualizaron por última vez, con qué frecuencia suelen actualizarse, cual es su importancia relativa con respecto al resto de URL del sitio web, etc). Gracias a estos metadatos, y al propio listado de URLs, los motores de búsqueda pueden rastrear el website de un modo más inteligente.

Los rastreadores web suelen descubrir las páginas nuevas a indexar a partir de los enlaces que existen en el propio sitio web (enlaces internos) y con otros sitios webs (enlaces externos). Este proceso puede ser lento (sobretodo si tenemos en cuenta el crecimiento exponencial del número de contenidos que está experimentando la web), por lo que los sitemap ayudan a los rastreadores a localizar antes las nuevas páginas de una web.

La utilización de sitemaps no garantiza que las páginas web listadas sean incluidas en los índices mantenidos por los motores de búsqueda, pero ayudan a los rastreadores a mantener estos índices actualizados.


Si estáis interesados en conocer la sintaxis del formato de los sitemaps, podéis encontrarlo en la dirección http://sitemaps.org/protocol.php.

Afortunadamente, para aquellos que no deseis picaros "a pelo" el documento XML con las páginas que deseais incluir en un sitemap (para que Google o cualquier otro motor de búsqueda las indexe) existen herramientas para hacerlo de un modo más o menos automático.

No hay comentarios:

Publicar un comentario

Limpiar un Wordpress hackeado

 Check list para limpiar instancias de Wordpress que han sido hackeadas, y para prevenir hackeos. Para técnicos de sistemas con acceso SSH a...