DIV CSS 佈局教程網

 DIV+CSS佈局教程網 >> 網頁SEO優化 >> SEO優化集錦 >> php記錄蜘蛛代碼 總結蜘蛛活動規律
php記錄蜘蛛代碼 總結蜘蛛活動規律
編輯:SEO優化集錦     

很多做seo的, 經常會問為什麼我的頁面沒有被收錄,為什麼我的快照還是上個星期的,怎麼百度還不更新我的站點。這些都是剛入門問的問題。做seo的人都知道,知道搜索引擎的規律很重要。你要知道蜘蛛是否來過你的站點,什麼時候來 過,是哪家蜘蛛。這些都有利於你針對性的做優化。

很多服務器支持蜘蛛爬行日志,但是大部分站長都是虛擬機,有的空間並不支持記錄蜘蛛爬行。這時候就需要我們編寫代碼來記錄蜘蛛的活動規律。

在網上找了很多的代碼都不能正確使用,或者功能不完善。

只要自己研究起來。總結出一下一套代碼,百分百保證使用。

<?php

function get_naps_bot()

{

$useragent = strtolower($_SERVER['HTTP_USER_AGENT']);

if (strpos($useragent, ‘googlebot’) !== false){

return ‘Googlebot’;

}

if (strpos($useragent, ‘msnbot’) !== false){

return ‘MSNbot’;

}

if (strpos($useragent, ’slurp’) !== false){

return ‘Yahoobot’;

}

if (strpos($useragent, ‘baiduspider’) !== false){

return ‘Baiduspider’;

}

if (strpos($useragent, ’sohu-search’) !== false){

return ‘Sohubot’;

}

if (strpos($useragent, ‘lycos’) !== false){

return ‘Lycos’;

}

if (strpos($useragent, ‘robozilla’) !== false){

return ‘Robozilla’;

}

return false;

}

function nowtime(){

$date=date(“Y-m-d.G:i:s”);

return $date;

}

$searchbot = get_naps_bot();

if ($searchbot) {

$tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);

$url=$_SERVER['HTTP_REFERER'];

$file=”robotslogs.txt”;

$time=nowtime();

$data=fopen($file,”a”);

$PR=”$_SERVER[REQUEST_URI]“;

fwrite($data,”Time:$time robot:$searchbot URL:$tlc_thispage\n page:$PR\r\n”);

fclose($data);

}

?>

以上代碼比網上流傳的版本多了個記錄搜索引擎請求頁面記錄,可以看到蜘蛛每次來爬取的是那個頁面。更加利於分析蜘蛛對網站的權重以及對不同欄目和頁 面的青睐。

Seo最終的是從實際出發,用數據說話,而不是憑空想象。一切優化的基礎都是數據,一切優化的目的也是為了得到數據。

本文出自ceo 風向標 轉載請注明出自http://www.ceologo.com/seo/371.html

感謝 靈魂de信仰 的投稿

XML學習教程| jQuery入門知識| AJAX入門| Dreamweaver教程| Fireworks入門知識| SEO技巧| SEO優化集錦|
Copyright © DIV+CSS佈局教程網 All Rights Reserved