O arquivo sitemap.xml
Alguns mecanismos de buscas utilizam “robots” para vasculhar o conteúdo do site.
Os sitemaps são úteis para listar as páginas do site que possam ser “esquecidas” pelos robots ou que não tenham conteúdo que possa ser lido por eles. Isso depende da interface da página e também se o site usa muitos arquivos em Flash ou Ajax, uma vez que os robots não conseguem ler o conteúdo dentro de um arquivo Flash, por exemplo.
O sitemap, como o próprio nome diz, é um mapa do site. E esse mapa pode ser escrito em um arquivo denominado sitemap.txt ou sitemap.xml, que é o melhor.
Esse arquivo deve ser inserido no diretório principal do site. Em seguida deve-se informar aos mecanismos de buscas onde esse arquivo se localiza no seu site. No caso do Google, isso é feito em “Ferramentas para Webmaster“. No Bing é feito em Webmaster Tools. E no Yahoo é feito em Site Explorer.
Vale lembrar que o sitemap.xml é um complemento que ajuda na indexação do site. Ele não garante que o site seja exibido na primeira página do buscador, por exemplo. Uma página bem indexada num mecanismo de busca possui um conjunto de ações e o uso do sitemap é uma dessas ações.
.
O arquivo sitemap.txt
O arquivo sitemap.txt contém apenas uma lista de urls. Cada página é colocada em uma linha. Exemplo:
http://painelbr.com/contato
http://painelbr.com/about
.
O arquivo sitemap.xml
O arquivo sitemap.xml tem uma estrutura e além da url, ele também informa quando ocorrerá a atualização, a prioridade, entre outros. Os parâmetros são os seguintes:
- <xml>: especificações do arquivo xml
- <urlset>: indica o conteúdo de urls de um sitemap
- <url>: indica o bloco de código da url a ser rastreada.
- <loc>: indica o endereço da página que será rastreada
- <lastmod>: indica última vez que a página foi modificada. O formato é ano-mês-dia (aaaa-mm-dd)
- <changefreq>: indica a frequência que o robot deve verificar a página. A frequência deve ser escrita em inglês: always (utilizado quando a página é modificada cada vez que é acessada), hourly (a cada hora), daily (diariamente), weekly (semanalmente), monthly (mensalmente), yearly (anualmente), never (nunca)
- <priority>: indica a prioridade da página em relação as outras páginas do site.
.
Exemplo de um sitemap.xml (cada página fica num bloco <url></url>):
<?xml version='1.0' encoding='UTF-8'?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd"> <url> <loc>http://painelbr.com/</loc> <lastmod>2010-08-26</lastmod> <changefreq>daily</changefreq> <priority>0.8</priority> </url><url> <loc>http://painelbr.com/about</loc> <lastmod>2010-08-26</lastmod> <changefreq>monthly</changefreq> <priority>0.6</priority> </url></urlset>
Se você gostou deste post, escreva um comentário e/ou cadastre-se em nosso feed.

Comentários
Ainda não há comentários.
Escreva um Comentário