今年4月底5月初,谷歌、百度相繼出台了打擊“內容只是無意義穿插關鍵詞”的spam垃圾內容的“企鵝算法”與百度《Web2.0反垃圾詳細攻略》。希望通過這樣一些措施,對於spam垃圾實施打擊,以保障搜索引擎排名的公正與網絡世界的秩序。
百度曝光的垃圾頁面
必須指出的是,隨著搜索引擎商業價值越來越高,越來越多的spam垃圾內容制造工廠專門針對搜索引擎而做。spam垃圾制造者的初衷就是有意識地針對並利用搜索引擎缺陷,通過spam垃圾鏈接,獲得搜索引擎更高排名。借搜索引擎之手,將自己本無任何價值的網頁推薦給網友,獲得自己本不應該獲得的商業利益。
據了解,福建莆田專做仿牌網站的某網絡公司甚至建立了1000多人的外鏈團隊,每天至少將產生幾萬條“內容只是無意義穿插關鍵詞”的spam垃圾內容。
對此搜索引擎心知肚明,百度《搜索引擎優化指南2.0》定義“作弊”說:“任何利用和放大搜索引擎的策略缺陷,利用惡意手段獲取與網頁質量不符的排名,引起用搜索結果質量和用戶搜索體驗下降的行為都會被搜索引擎當做作弊行為”。
無論“利用和放大搜索引擎的策略缺陷,利用惡意手段獲取與網頁質量不符的排名”的Spam垃圾內容表現形式再怎麼千變萬化,但它始終無法改變的特點即谷歌、百度所一直強調的:“不是針對網友(提供更好的服務),而是專門針對搜索引擎(的缺陷)而做”。
一言以蔽之,搜索引擎對spam垃圾內容的認定原則就是“物之反常者為妖”——即作弊行為與正常網站經營者、網站用戶希望為更多用戶提供有用的內容(服務),並希望通過這樣持續、不間斷的行為獲得用戶認可,從而獲取合理的利益或網友贊譽的行為不同;作弊者並不在網頁內容(獨特服務)上下功夫——他們也就從來沒有打算通過獨特有效的網頁內容(獨特服務)吸引用戶,而是專門研究搜索引擎漏洞,有目的地針對搜索引擎漏洞傳播大量無實質內容的spam垃圾信息。
蘑菇街CEO陳琪在知乎問答回答“蘑菇街不可信內容鑒別”提問時,將“物之反常者為妖”的原則進一步闡明為:“可疑用戶的行為一定是與普通用戶不一樣的;長期活躍的用戶,行為模式是趨同的”。
不言而喻,所有的搜索引擎對於spam垃圾內容都持“零容忍”態度,它們也在不斷地加強對各種“物之反常者為妖”的spam垃圾內容鑒別認定工作。但遺憾的是,隨著網絡的不斷普及與網絡技術的高速發展,搜索引擎的工作原理卻沒有什麼實質性進步,這使得搜索引擎對於各種“物之反常者為妖”的作弊行為無法實施更精准的打擊,這無疑給了spam垃圾內容制造者可乘之機。
譬如說,在網頁收錄、排名上對於外部鏈接搜索引擎都十分依賴,但無論谷歌還是百度,對於“這個鏈接是否用戶or對方網站真心推薦你的網站、這個推薦,是否對用戶有價值”的技術上卻始終沒有明顯進步與突破,只有反過來要求站長、SEOER們思考建站目的,要求站長舉報垃圾鏈接制造網站。可事實上,“要想排名好,發外鏈少不了”已經完全成為了所有站長、SEOER們的一致共識。
並且,在搜索引擎眼中,這種“物之反常者為妖”行為必然是維持一段時間的持續行為,並不能僅僅憑一次“反常行為”就認定某個網站是spam垃圾實施者。搜索引擎需要時間綜合評判,而在這個認定的“時間差”裡,也許很多spam垃圾內容經營者已經賺了缽滿盆滿了。即便作弊網站被搜索引擎K站了,但由於網站域名注冊的無限制與低成本,更多網站換個域名又“前度劉郎今又來”了,連口氣都不歇,馬上又投入與搜索引擎“老鼠怕貓,那是謠傳”的游戲之中。
在這種情況下,無資源、無財力的眾多中小網站也不得不整“內容只是無意義穿插關鍵詞”的spam垃圾——他們中間更多人並不奢望更多不合理的搜索引擎高排名,只求自己網站搜索引擎排名不至於與自己網站真實相差太遠。至此,“物之反常者為妖”的spam垃圾逐漸成為了“不反常”的網絡常態。因此,網絡上各種spam垃圾內容呈現出越演越烈的星火燎原之勢。
百度自家內容體系與各種廣告頁面占據了百度搜索排名前幾位
面對spam垃圾的日趨常態化的現狀,為了維護自己的網絡霸主地位,搜索引擎除了不斷出台各種打擊spam垃圾舉措外,它們更多的心思用在自己宏大內容體系(百度百科、百度知道、百度文庫)構建上——谷歌也同樣開始了這樣的計劃。
搜索引擎希望,通過自己內容體系的構建,以自己“可信內容”的搜索引擎排名榜“總在最前”來解決spam垃圾對排名的影響,在更短的時間內將搜索引擎變為“站內搜索”,讓每天幾億次的龐大搜索流量留在自己家中——如此“肥水不流外人田”的願景才是搜索引擎心中解決spam垃圾影響的最完美方案。
這樣的負面影響已經初步顯現出來,太多關鍵詞搜索結果當中多個百度自家產品雄居榜首的高排位讓人徒呼奈何,再加上“百度推廣”、“谷歌廣告”各種PPC廣告,搜索引擎留給中小網站的空間已經越來越狹窄了,站長、SEOER們與搜索引擎的“蜜月期”即將過去。
在spam垃圾日益猖獗的“常態化”與搜索引擎努力構建自己內容體系的情況下,如何通過自己網站