一篇文章被抓取後會和數據庫裡面相關的主題-----再到相關的分類下,再細分最後和庫裡存在的文章相對比沒有的話,就是原創。或者重復讀不超過多少百分比;最直接的說就是說如果百度數據庫裡沒有的它認為就是原創。
一、原創是有條件的,即百度收錄之後的對比。
比如一個小網站發布了一篇原創文章,被新浪等權重較高的網站直接復制粘貼,標題內容絲毫不改新浪等高權重網站收錄了而你的文章卻沒有收錄。這時,你說哪個網站是原創。
二、回到題目,百度是怎麼識別文章是原創的?
百度抓取你的文章之後,會將你文章的每個關鍵詞生成一個相應的指紋與之前相似主題的文章關鍵詞指紋進行對比。當發現核心關鍵詞偏差比較大的時候,便會認為是原創。因此要注意在文章中布局自己的目標關鍵詞,相關關鍵詞在文章中也要多次出現。(此段純屬本人臆斷)
三、原創的就一定好嗎?
百度沒有說你的文章必須要原創,只要符合用戶體驗的文章就是好文章。百度的字庫通過對一些常用詞的過濾後然後看主關鍵字出現的頻率。應該在一點百分比比較合適就像關鍵字的百分比在百分之2-百分之8一樣。當然肯定還會有相關文章對比如果其相識度超過百分60估計示為作弊。另外原創是效果不錯,但是哪有這麼多相關原創。
百度也沒有說原創的就是最好的。要不國內最大的網站應該頒發給那些盜版小說網站(因為他們的小說收費都是手打出來的)這麼多原創沒有理由不上第一。
周明個人覺得百度對於原創的識別還需要完善的地方還有很多百度還有很長的一段路要走。
本文由周明SEO博客http://www.zm0203.com整理發布,轉載請注明出處。
注:相關網站建設技巧閱讀請移步到建站教程頻道。
收藏本文