搜索引擎蜘蛛原理
更新內容,吸引蜘蛛,就是為了讓蜘蛛來抓取,抓取的同時蜘蛛有一個過濾功能,內容不好,會被抓取器當成蜘蛛的一個通道。
就不去抓取了(有的人看日志說,返回碼是200,缺總是不收錄?也許覺得是還沒有放出來,也許真的就把你當成一個通道了呢?)。
抓取以後,會把我們的頁面放到數據庫裡面,進行一系列的計算。排一下序,根據用戶的查詢去返回指定的結果。
溫馨提醒:
新站屏蔽蜘蛛問題
一個新網站,還沒有調試好,就上線了, 又怕頻繁該網站對搜索引擎不好友好,於是我們做了一件事情;robot屏蔽蜘蛛,之前我們也說過,蜘蛛是很高傲的,你屏蔽它,他可能真的會冷落你很長一段時間。所以說,上線就要吧網站調試好,切勿求快,穩中求勝,磨刀不誤砍柴工。