加入收藏RSS訂閱SEO教程 SEO優化 SEO自學 網站優化
你的位置:首頁 ? SEO教程 ? 正文

網頁不被收錄怎么辦?五招教你引導搜索引擎蜘蛛訪問網站!

選擇字號: 超大 標準 發布時間:2014-7-10 15:57:5 | 作者:Searcheo | 0個評論 | 人瀏覽

本文地址:http://www.umpuhz.live/post/86.html 轉載請注明出處!

網頁不被收錄?五招教你引導搜索引擎蜘蛛訪問網站!

  第一、常見蜘蛛: 蜘蛛其實就是搜索引擎用來訪問頁面的程序,英文叫spider,也稱為機器人,英文為bot。有時候查看IIS日志就能看到各種蜘蛛訪問網頁的情況,對網 站的優化起到一定的指導作用。當蜘蛛訪問一個網站時,會發出頁面訪問請求并返回HTTP狀態碼,然后蜘蛛會把這些狀態碼存入自己的數據庫,為以后的各種計 算做鋪墊。常見的蜘蛛有百度蜘蛛(Baiduspider)、雅虎蜘蛛(Mozilla)、微軟Bing蜘蛛(msnbot)、搜狗蜘蛛 (Sogou+web+bot)、Google蜘蛛(Googlebot)等。一般情況下,IIS日志都會有顯示,站長們應該多花點時間仔細看下蜘蛛對自 己網站的訪問情況,然后對自己網站做出調整。

  第二、文件存儲:文件存儲是搜索引擎的一個技術關鍵所 在,同時也是面臨的一個挑戰。當搜索引擎爬行和抓取完成后,會把這些數據存入原始頁面數據庫。在這個數據庫存放的數據和用戶在瀏覽器中看到的頁面是完全一 樣的。每個URL都會有一個獨特的編號。除此之外,還要存儲各種計算權重所需要的數據,比如各種鏈接的關系,PR的迭代計算等。這些數據量是巨大的。很多 網站不存在時,我們可以訪問搜索引擎的快照頁面,這些頁面就是存在搜索引擎自己的數據庫中,與站長網站本身的數據沒有關系,是獨立存在的。平時的快照更 新、排名波動都和搜索引擎的文件存儲有著直接的關系。

  第三、跟蹤鏈接:跟蹤鏈接指的是蜘蛛會順著頁面上的鏈接從一個頁面爬到下一個頁面
那 么蜘蛛就會順著這個詞來排。因為整個互聯網都是有不同的鏈接構成,所以理論上蜘蛛能爬行所有的頁面。但由于現實中網站間的鏈接結構非常復雜,蜘蛛就會采取 一定的策略才能爬行所有頁面。常見的策略一般有兩種,一是深度優先,二是廣度優先。深度優先指的是順著鏈接一直爬行,直到沒有鏈接為止,然后返回第一個頁 面。而廣度優先是順著第一層的鏈接爬行,直到把第一層的鏈接爬行完然后再爬行第二層的鏈接。如果從理論上講,只要有充足的時間,蜘蛛就能爬行完所有的網 頁,但實際上搜索引擎只是收錄了互聯網上很小的一部分網頁。因此對我們來講,爭取做足夠多的外部鏈接,讓蜘蛛有機會來爬行與抓取。

  第四、地址庫: 地址庫對搜索來說顯得尤為重要,互聯網上的網頁數量是巨大的,為了避免爬行和抓取重復的網址,搜索引擎會建立一個地址庫,這個地址庫主要記錄已經發現但是 還沒有被抓取的頁面,以及已經抓取的頁面。有了地址庫,就能讓搜索引擎的工作更加有效率,地址庫中的URL地址常常有幾個來源:一是人工錄入URL;二是 自己爬行和抓取,如果爬行到一個新的網址,地址庫中沒有就會存入待訪問的數據庫;三是通過提交,很多站長都會去主動提交要被收錄的頁面。蜘蛛會從待訪問的 地址中訪問里邊的URL,爬行完就會刪除,并存入以訪問的地址庫中。但大家也需要了解,我們去主動提高給搜索引擎網址,并不代表他一定會訪問并收錄我們的 頁面,搜索引擎更喜歡自己爬行發現新的URL,所以我們還是要做好網頁的內容和外部鏈接。

  第五、吸引蜘蛛: 通過上文我們知道,雖然蜘蛛理論上能爬取所有頁面,但由于鏈接的復雜性以及時間的局限性,蜘蛛往往只是抓取互聯網上網頁的一部分,如果我們的網站想要獲得 好的排名,那么就必須想方設法讓蜘蛛來抓取,蜘蛛一般會抓取比較重要的頁面,那些頁面較重要呢?一是頁面權重高、資格老的網站會被認為比較重要;二是頁面 常更新的頁面,對于經常更新的頁面,蜘蛛會更加頻繁訪問;三是導入鏈接比較多的頁面,無論什么樣的頁面,如果想要蜘蛛訪問,就必須有導入鏈接;四是與首頁 點擊距離近的頁面,因為首頁的權重往往最高,所以,距首頁最近點擊距離的頁面往往也被認為是最重要的頁面。



標簽:  

SEO教程網

猜你喜歡

發表評論

必填

選填

選填

必填,不填不讓過哦,嘻嘻。

記住我,下次回復時不用重新輸入個人信息

◎歡迎參與討論,請在這里發表您的看法、交流您的觀點。

站長推薦的文章
瀏覽最多的文章
無覓相關文章插件,快速提升流量 体彩app官方网站