1.不要自動采集,我這裡說的采集是那種做好了規則,設定好了時間系統自動完成的,這樣有個缺點就是所有網頁中你任何元素統統采集入庫了,包括文章中有些<table>或者<img=>之類的東西是你根本不需要的,也正是如此,搜索引擎就更加確定你的內容不是原創,而是簡單的復制來自互聯網上的內容。
如果這樣的內容在你網站中占的比例足夠高了,結果呵呵~~
2.對於搜索不要總是等到被k了才出來罵baidu或者google,聰明點,他們使用的方法1.中提到的正則表
達式來判斷的,我們為什麼不能避免呢?說個最簡單的辦法你可以把你要的內容通過自己手動完成,例如先ctrl+c到文本文檔中,在ctrl+c到你的目標編輯器中,這樣的話表面上看來沒什麼變化,但是實際上其中的html元素已經完全去掉了,這樣對於搜索引擎看來,肯定要比自動采集判別難多了。但是這樣很費事,是呀想省事,記得偷懶=風險。
3.雖然是采集但是自己在其中添加些自己的評論,或者你起碼要更改下<title></title>中的東西吧?
這樣有幾個好處:
<1>搜索越來越注重<title></title>這標題裡面東說明了,也許你采集的文章標題寫的不好,不利於搜索引擎的排名。你優化這裡面的關鍵詞對你好處自己不必說了。
<2>很自然減少了被k的幾率
4.打亂文章的分頁規則,也就是不要和源文章一樣。有自己的特色
5.保持自己網站內容的最新,也就是和你的目標網站盡量做到同步,這樣有利於和搜索引擎搶奪排名位置,我曾經試驗過我從zol 和pconline 抄內容,同樣的幾篇文章實際是zol原創的,但是我和他基本做到了同步更新,當時我記得是nokia n95那篇文章我在baidu和yahoo中排到了第一名,其中我優化了文章分頁和<title></title>,每天晚上到3點多我還在更新,別說他們這些大型網站是夠變態的,深夜還在更新,我靠~~不過也正是如此這一片文章給我每天帶來了1300多的ip所以以後我變更加堅定我的想法。