DIV CSS 佈局教程網

 DIV+CSS佈局教程網 >> 網頁SEO優化 >> SEO優化集錦 >> Google針對PDF文件在SEO中的作用做出回答
Google針對PDF文件在SEO中的作用做出回答
編輯:SEO優化集錦     

Google近日在其官方博客中就很多人關心的PDF文件在SEO中的作用做出詳細的回答,這篇Q&A裡面羅列了大家經常會問到的一些關於PDF的問題,很有參考價值!關於在SEO過程中使用PDF文件,網絡上流傳了一些比較通用的說法,比較流行的是原創PDF天生PR3,比HTML頁面更容易獲得信任與高的排名等等,具體情況怎樣也沒個定論,還是看看Google官方的說法吧:

Q:Google是否能夠收錄任何類型的PDF文件?

A:通常情況下,我們能夠收錄任何文字內容,沒用密碼保護或者加密處理的PDF文件。如果文件中的文字是圖片格式,我們會用OCR算法來處理這些文字。簡單點說只要你有辦法把一個PDF文件裡的文字 “弄” 出來做成普通文檔,我們就能收錄這個PDF文件。

Q:Google怎麼處理PDF文件裡的圖片?

A:目前PDF裡的圖片還不會被索引,你最好是用HTML頁面來展示你的圖片。如何讓你的圖片獲取更好的排名,可以參考Google幫助中心的相關文檔。

Q:Google如何看待PDF文件裡的鏈接?

A:通常情況下,PDF文檔裡的鏈接和HTML文件裡的鏈接效果一樣:可以傳遞PR以及其他一些鏈接效應,Google在爬行到這些鏈接的時候會做同等的“跟隨記錄(我瞎編的詞,你懂就行)”處理。目前PDF文檔還不支持 “nofollow” 屬性標簽!

Q:如何阻止Google收錄我的PDF文檔;或者文檔已經收錄了,怎麼刪除索引?

A:防止PDF文件被索引最簡單的方法就是在HTTP頭部添加X-Robots標簽:Noindex。(關於X-Robots,大家可以參考文檔:谷歌發布Robots.txt和抓取以及索引關鍵文檔,以及Google官方的Robots meta tag and X-Robots-Tag HTTP header specifications)。對於已經收錄的PDF文檔,在你添加Noindex標簽後,Google會在下次更新時予以刪除,如果想更快的刪除,可以到Google站長工具後台去操作。

Q:PDF文件能獲得高排名嗎?

A:當然,PDF的排名和其他網頁類似。這裡有三個例子 [mortgage market review], [irs form 2011] 以及 [paracetamol expert report] 等,在Google搜索時,PDF文檔的排名都很高,非常感謝這些PDF文檔裡的高質量內容以及從其他頁面過來的鏈接。

Q:如果我的頁面同時提供HTML和PDF兩種格式,是不是會出現重復內容的問題?

A:通常情況下,我們都建議你對同一份內容只提供一份Copy。如果因為一些特殊原因必須提供多份Copy(包括頁面表現形式,文檔格式等等)時,你可以采用指定標准化URL的方法來防止這個問題,你可以通過在網站地圖中指定,以及一些常規的URL標准化指定方法來設置。(關於標准化的問題,大家可以參考文檔:URL標准化,以及Google官方相應的文檔。)

Q:我能不能控制PDF文檔在搜索引擎中展現的標題?

A:我們采用兩個元素來確定一個PDF文檔的標題,一是PDF自身元標簽中的標題設置(Metadata,這些在PDF制作軟件中都有相應設置的),一個是從起來頁面鏈接過來的錨文本。要想搜索引擎能更好的確定你的PDF文檔標題,最好這兩個方面都規范一下。

原文:PDFs in Google search results

以上的QA我們關注兩個問題:

1:關於PDF文件中的鏈接,這個大家應該都知道,是外鏈的一種形式,所以PDF文檔共享也是增加外鏈的一種方式。

2:關於PDF排名的,Google並沒有強調其先天優越性,其排名參考因素和其他類型的網頁一樣,並沒有什麼特殊。

問題是很多人都在問,為什麼Google搜索的時候,經常會出現PDF排在前面。

這個問題,我們如果按照這個QA排除掉其特殊性,就個人經驗來說,在國外PDF文檔的引用和傳播比較頻繁,而且很多是權威站點才提供相應的PDF格式文檔,這其中包括一些政府報告,教育、健康信息等等一些高質量的長篇的完整的文檔…國內似乎在這方面並不感冒!所以你會經常看到Google首頁出現PDF的情況。

附:Matt Cutts關於PDF文件優化的視頻

需翻牆,自己去看吧,基本也就是說Google在試圖展示更高的更符合要求的結果blah,blah。

另附:幾個國外常用的PDF上傳分享網站:

Scribd.com

Slideshare.com

Docstoc.com

Yudu.com

Doxtop.com

Authorstream.com

Esnips.com

Issuu.com

Gazhoo.com

Edocr.com

Doocu.com – 不過的PDF搜索引擎,可以一試!

再附:BHW上一個超牛的分享

Amazon上經常會賣一些比較有價值的SEO或者Marketing書籍,都是PDF文檔的,買不起?不想買?直接Google搜吧,語法:

site:*.s3.amazonaws.com keyword(你要搜的關鍵詞)

site:.cloudfront.net keyword(你要搜的關鍵詞)

比我還懶?直接點下面圖片去下載

XML學習教程| jQuery入門知識| AJAX入門| Dreamweaver教程| Fireworks入門知識| SEO技巧| SEO優化集錦|
Copyright © DIV+CSS佈局教程網 All Rights Reserved