什麼是 Sitemap
Sitemap 可方便管理員通知搜索引擎他們網站上有哪些可供抓取的網頁。最簡單的 Sitepmap 形式,就是 XML 文件,在其中列出網站中的網址以及關於每個網址的其他元數據(上次更新的時間、更改的頻率以及相對於網站上其他網址的重要程度為何等),以便搜索引擎可以更加智能地抓取網站。
Sitemap協議講解
Google SiteMap Protocol 是Google自己推出的一種站點地圖協議,此協議文件基於早期的robots.txt文件協議,並有所升級。在Google官方指南中指出加入了Google SiteMap文件的網站將更有利於Google網頁爬行機器人的爬行索引,這樣將提高索引網站內容的效率和准確度。文件協議應用了簡單的XML格式,一共用到6個標簽,其中關鍵標簽包括鏈接地址、更新時間、更新頻率和索引優先權。
Google SiteMap文件生成後格式如下:
<urlset xmlns=http://www.google.com/schemas/sitemap/0.9>
<url>
<loc>http://www.SemCmd.com</loc>
<lastmod>2005-06-03T04:20-08:00</lastmod>
<changefreq>always</changefreq>
<priority>1.0</priority>
</url>
</urlset>
SiteMap XML標簽的解析:
changefreq:頁面內容更新頻率,
lastmod:頁面最後修改時間
loc:頁面永久鏈接地址
priority:相對於其他頁面的優先權
url:相對於前4個標簽的父標簽
urlset:相對於前5個標簽的父標簽
注意:XML文件必須為UTF-8編碼格式,不管你是手動生成還是通過代碼生成,建議最好檢查一下xml文件是否是utf-8編碼,最簡單的方法就是用記事本打開xml然後另存為時選擇編碼(或轉換器)為UTF-8。
怎麼樣制作SiteMap XML工具
請查看SiteMap XML 地圖生成工具詳細講解與制作
如何提交SiteMap XML 地圖
登錄Google 管理員工具 (https://www.google.com/webmasters/tools/)