要確定您的網站當前是否已包含在我們索引中,可以對此網站的整個網址進行查詢。例如,搜索 [ site:www.google.com] 將返回以下結果: http://www.google.com/search?hl=en&q=site%3Awww.google.com+
雖然 Google 可抓取超過幾十億網頁,但丟失幾個網站也在所難免。造成 Spider 丟失網站的常見原因有:
- 此網站未通過多個鏈接牢靠連接到 Web 上的其它網站。
- 在 Google 的最新抓取完成後此網站才啟動。
- 網站的設計使 Google 很難有效抓取其內容。
公平准確地展示互聯網的內容是我們的宗旨。為了實現此目標,我們提供了建立"便於抓取"網站的指南: http://www.google.com/webmasters/guidelines.html
我們無法保證 Spider 能找到某特定網站,但遵循以下指南應該可以增加您的網站顯示在搜索結果中的機會。
您需要在網頁上提供高品質的內容 -- 特別是在主頁上。這是您應該做的最重要的工作。如果您的網頁包含有用的信息,其內容就可以吸引許多訪問者並使網站管理員樂於鏈接到您的網站。要創建具有實用性且信息豐富的網站,網頁文字應清晰、准確地表述要傳達的主題。想一想,用戶會使用哪些字詞來查找您的網頁,然後盡量使這些字詞包括在網站上。
確保有網站鏈接到您的網站上。鏈接可幫助我們的抓取工具找到您的網站,並提高您的網站在我們的搜索結果中的展示率。返回搜索結果時,Google 會將 PageRank(我們對網頁重要性的評測)與先進的文字匹配技術合並使用,以顯示對每個搜索結果都兼具重要性與相關性的網頁。Google 會計算一個網頁收到的投票數量,以確定其 PageRank,其計算方法是將從網頁 A 指向網頁 B 的鏈接解釋為由網頁 A 對網頁 B 所投的一票。自身"重要"的網頁所投的票會更具分量,有助於提高其它網頁的"重要性"。請注意,網站在我們的搜索結果中的排名是完全自動的,我們並不人工地為網站指定關鍵字。
以合理的鏈接結構建立您的網站。每個網頁應至少可以通過一個靜態文本鏈接打開。如果某些區域未鏈接,您就可能把較低版本的浏覽器、某些用戶、甚至 Google 排除在外。
使用文本浏覽器(如 Lynx)檢查您的網站。大部分 Spider 查看網站的方式與 Lynx 一樣。如果因應用了 JavaScript、Cookie、會話 ID、框架、DHTML 或 Macromedia Flash 等技術,而造成在文本浏覽器中無法看到整個網站,則 Spider 在抓取此網站時可能也會遇到麻煩。
考慮創建動態網頁的靜態復本。雖然 Google 索引中包括動態網頁,但它們只占索引的一小部分。如果您懷疑您的動態生成的網頁(例如包含問號的網址)給我們的抓取工具帶來了麻煩,可以為這些網頁創建靜態復本。如果要創建靜態復本,不要忘記將動態網頁添加到您的 robots.txt 文件,以防止我們將其當成重復內容。
需要避免的事項
不要使用關鍵字列表填寫網頁、嘗試將網頁"隱藏"起來或建立"僅供抓取"頁。如果您的網站上包含您不希望訪問者看到的網頁、鏈接或文字,Google 會認為這些內容具有欺詐性並可能撇開您的網站。
您並不是非購買搜索優化服務不可。有些公司聲明可以"保證"您的網站在 Google 搜索結果中享有高排名。合法的咨詢公司可以改善您網站的流量和內容,但其它公司會采用欺騙性手段來騙過搜索引擎。請務必小心;如果您的網域與這些欺詐性服務相關,我們可能禁止其加入我們的索引。
不要使用圖片來顯示重要的名稱、內容或鏈接。我們的抓取工具無法識別圖形中所含的文字。如果網頁上的重要內容和關鍵字不能以普通的 HTML 格式顯示,請使用 ALT 標記。
不要為不同網址下的一個網頁創建多個復本。許多網站提供純文本的或易於打印的網頁,其包含的內容與相應的圖形豐富的網頁不相上下。為了確保您需要的網頁包括在我們的搜索結果中,您應使用 robots.txt 文件攔截我們的 Spider 抓取到的重復內容。有關使用 robots.txt 文件或元標記的信息,請訪問 http://www.google.com/remove.html