在上篇百度鼓勵原創中,Q豬引用了百度站長平台關於如何判斷原創的一段話,今天Q豬想就這段話,談談判斷原創的幾種方式,歡迎拍磚。
站長平台關於百度如何判斷原創的描述是這樣的:
首先,通過內容相似程度來聚合采集和原創,將相似網頁聚合在一起作為原創識別的候選集合;
其次,對原創候選集合,通過作者、發布時間、鏈接指向、用戶評論、作者和站點的歷史原創情況、轉發軌跡等上百種因素來識別判斷出原創網頁;
最後,通過價值分析系統判斷該原創內容的價值高低進而適當的指導最終排序。
百度如何判斷內容相似,是根據上下文意思,根據所表達的中心思想,還是文字的相似。
如果是根據表達的主題,那很多內容,不同的人所寫,內容不同,但是主題相同,是不是也被當成相似呢;
如果是文字的相似,那傳說中,將原先內容,通過自己的話,再寫一次,是不是就成了原創呢;
如果是上下文,那對文章重新組合,再替換關鍵詞,例如許多偽原創工具,是不是也很獨特呢?
當然,任何一種算法,都會考慮,N種可能,Q豬的觀點,任何一種原創,都必須要有自己獨特的觀點在裡面,要有自己獨特的視角,一篇文章中,屬於本人的原創觀點,要占最重要的位置。
判斷原創的幾個重要步驟
判斷原創,有幾個比較重要的因素。
a、作者、發布時間
分析:網絡上大部分抄襲的、復制的內容,作者都是改過的,不是原文作者。還有發布時間,互聯網上數以億計的網頁內容,搜索引擎不可能實時監控所有的網站,爬完所有的內容,精確記錄文章發布的時間。
所以這兩因素不是很靠譜,當然很多網站,特別是博客,有顯示發布時間,但是,這也不能太當真,是吧。
b、鏈接指向
分析:其實,對於做網絡優化SEO的人員來說,做好網站內部的鏈接,是一項最基本的工具。
你寫一篇文章,在提到一個內容的時候,比如說到網絡結構優化,然後就將鏈接鏈接做向前面寫過的文章:如何制作合理的網站結構。如果文章中講到石榴算法,那就直接連向:石榴算法,百度對低質量頁面說不。
在一篇文章中,擁有很完善的鏈接體系,也是作為原創文章的一個判斷標准,至少說明對文章內容很用心。
c、用戶評論
分析:用戶評論可以豐富文章的內容,對用戶具有更強的引導性和參考性,搜索引擎的目的是為用戶提供檢索服務,引到用戶,進入最有價值的網頁中。
一篇文章有大量的評論,在一定程度上也說明了文章的受歡迎程度,在後面的排序中可以獲得好的排名。
d、作者和站點的歷史原創情況、轉發軌跡
分析:這個判斷原創的出發點,就是考慮出身,試想一下,網站中,絕大部分的內容都是采集、復制、轉載而來的,那麼對於這個網站內的其他內容,在判斷原創時,就會被打上不信任的標簽。
綜合上面的觀點,網站內容需要堅持原創、鼓勵用戶評論、明確作者、發布時間,同時,更重要的一點,所有內容無論是原創還是轉載,都堅持標明原出處,這是為網站在搜索引擎內贏得信任投票。
好了,關於原創的判斷,Q豬就討論到這裡,本文由Q豬文學站(http://www.qzread.com/)原創發布,轉載請注明出處。
注:相關網站建設技巧閱讀請移步到建站教程頻道。
收藏本文