筆者的SEO博客沒有使用301重定向,主要是虛擬主機不支持,也罷。之前談到URL標准化的5條建議也略有提到,但忽略了一種情況。
一般情況下,我們在搜索結果頁面看到的都是省去默認首頁的,主流建站程序語言有asp/php/jsp/.net,其默認首頁一般是index.html/index.htm/index.php/index.asp/default.asp/default.aspx等。推薦閱讀:做網站哪種編程語言好。比如WordPress默認首頁應該是這樣調用的,當有人輸入http://www.××.org/來到筆者的SEO博客,DNS解析系統會幫助浏覽器找到網站服務器,然後網站服務器調用了硬盤上的一個默認的文件:index.php。
之前site:www.××.org,是沒有該默認首頁的,在五種網頁自動跳轉方法與示例中的第四個示例把該默認首頁亮出來了,沒想到第二天百度就把這個默認首頁放出。現在筆者已經index.php改成index.html,並且在robots.txt屏蔽index.php,過段時間再看看百度是否會刪除該頁面。
這次經歷筆者明白一個道理,如果你不想讓某種形式的鏈接出現在搜索引擎結果頁面SERP,那麼就應該避免在任何情況下對其提及。這個道理其實在SEO優化如何降低頁面相似度有提到,SEO從業者應該思考如何把目標內容更有效的展示在搜索引擎結果頁面。
不過屏蔽之後發現,搜搜跟搜狗好像變得更加不愛收錄頁面了。幾個月前筆者的SEO博客robots.txt實際上剛開始時候有添加一條記錄是Disallow: /index.php,後面通過日志文件分析發現,蜘蛛是通過抓取index.php/*.html這樣格式進行收錄的。搜搜和搜狗蜘蛛好像抓取後並不放出,後來筆者把SEO博客的tag標簽屏蔽後,搜搜就更不懂得怎麼抓取了,當時就把robot.txt的這條記錄刪除了,後面搜狗好像正常了一些。現在又添加了這條記錄後,搜狗好像收錄又不正常了,這個情況筆者繼續觀察一段時間。
既然知道301重定向的好處,那麼如果能讓http://www.××.com/index.php轉向http://www.××com/,這聽起來是不是挺棒的?!
後面SEO技術細細思考下,事情好像沒那麼簡單。我們想想是不是這麼個流程?1、服務器接到http://www.××.com/index.php請求,然後看到應該301轉向到http://www.××.com/,於是當調入http://www.××.com/時候,又要獲取默認文件(index.php),就又調用http://www.××.com/index.php,然後服務器又看到需要轉向http://www.××.com/,這豈不是無限循環了?
關於默認首頁index/default做301重定向的思考,希望SEO技術愛好者能夠提供簡單明了的思路,福建SEO期待你們的分享!