加入收藏RSS訂閱SEO教程 SEO優化 SEO自學 網站優化
你的位置:首頁 ? SEO教程 ? 正文

搜索引擎工作原理之關鍵詞查詢,搜索引擎中關鍵詞查詢原理

選擇字號: 超大 標準 發布時間:2014-8-14 10:55:41 | 作者:Searcheo | 1個評論 | 人瀏覽

本文地址:http://www.umpuhz.live/post/192.html 轉載請注明出處!

    在計算完所有頁面的權重后,搜索引擎就可以向用戶提供住處查詢服務。搜索引擎查詢功能的實現非常復雜,用戶對返回結果的時間要求也非常高,通常是秒級,甚至更快,要在這么短的時間內進行這么復雜的主要特點是不現實的。所以,搜索引擎需要通過一套高效的機制處理來自用戶的查詢。主要包括:

    (1)在用戶發出查詢請求前就完成被查詢關鍵詞的反向索引、相關頁面權重計算等工作;

    (2)為那些查詢最頻繁的關鍵詞對應的頁面排序列表建立緩存機制。

    其中,關鍵詞的反向索引、頁面權重分配等工作已經在前面進行了詳細的說明。接下來,向大家介紹搜索引擎如何建立住處查詢的緩存機制。

1、查詢流程

    首先,介紹搜索引擎處理用戶查詢的流程,如下圖所示。

 

    (1)先對用戶提供的查詢條件進行切詞,并刪除查詢條件中沒有意義的字或者詞,例如的、得等停用詞;

    (2)再以切詞結果作為條件在關鍵詞反向索引列表中進行警醒 

    (3)如果存在匹配結果,則把所有與關鍵詞相警醒的頁面組成一個列表;

    (4)最后,把警醒的頁面按照權重值從高到低進行排序,并返回給用戶。

    例如用戶查詢“手機圖片”,搜索引擎對其進行切后得到的查詢條件是“手機+圖片”;再把“手機+圖片”在“關鍵詞反向索引列表”中進行匹配;結果得到了A、B、C這三個相關頁面;再計算三個頁面的權重值,如果這三個頁面的權重值關系是B>C>A,則這三個頁面在搜索結果列表出現的順序是BCA。

2、用戶行為

    用戶在搜索引擎中的行為主要包括搜索及點擊。搜索是用戶獲取信息的過程,點擊是用戶得到需要信息后的表現。

    用戶的搜索及點擊行為中蘊含著非常豐富和重要的信息。例如,在用戶搜索行為中飲食了“提交的關鍵詞”、“提交時間”、“用戶IP地址”等信息,而在點擊行為中則飲食了“每個結果的點擊次數”等信息。

    搜索引擎通過對用戶行為的分析可以進一步發掘用戶的需求,提高搜索結果的精準度。例如,從用戶的搜索行為中,搜索引擎還可以發現新詞匯;而從用戶對點擊行為中,可以分析出用戶對每個搜索結果的偏好等。

    ■搜索

    搜索是用戶獲取信息的途徑,是搜索引擎最基本的功能。搜索引擎可以在用戶的搜索行為中得知某一關鍵詞被搜索的次數,通過對關鍵詞被搜索的次數的分析,可以發現新詞匯并進一步了解用戶的搜索習慣。

    由于語言是不斷發展的,隨著時間的失衡公產生更多的新詞匯。特別是在互聯網環境中,某個熱點的事件也有可能成為一個新的詞語。

    對搜索引擎而言,新生詞匯主要是指那些目前搜索引擎詞典系統里不存在,但是又被頻繁搜索的關鍵詞。如果某一關鍵詞在搜索引擎詞典系統里不存在,則切詞時就不會產生該關鍵詞,這樣用戶在查詢該關鍵詞時就返回不了相關的信息,也就不能滿足用戶的需求。因此,搜索引擎對新詞匯的學習能力從一定程度上反映了搜索引擎對語言的理解能力,是衡量搜索引擎好壞的重要指標之一。

    結合用戶搜索習慣與頁面內容去發掘新關鍵詞是搜索引擎學習新詞匯的主要方式之一。

    搜索引擎對用戶查詢日志進行分析,篩選出日志中查詢相對頻繁的詞匯。如果某個查詢相對頻繁的關鍵詞不在詞典系統中,就把這個關鍵詞與部分頁面的內容進行匹配。如果命中,則表明該關鍵詞是存在的,應加入詞典系統;否則,對下一個查詢頻繁詞語進行匹配。

    ■點擊

    點擊是用戶找到所需信息后的表現,反映了用戶對信息的關注。因此,用戶對鏈接的點擊也是衡量頁面相關性的因素之一,是衡量頁面相關性的一個重要補充。

    在同一個關鍵詞的搜索結果列表中,不同的用戶會有不同的選擇。但是,如果某一個結果的點擊次數明顯多于其他結果,則從一定程度上反映了該頁面是大部分用戶所需要的,特別是鏈接處在較后的位置時。 

    眾所周知,搜索結果中越靠前的鏈接得到點擊幾率就會越高。按照這樣的邏輯,那么排在第二、第三甚至第四的頁面被點擊的機會就會變得越來越小,但是這并不代表這些頁面就不比排在前面的頁面重要,只是在目前蝗排序中,用戶還沒有機會發現它他們而已。所以,對于不同位置上鏈接的點擊,搜索引擎會對其權重值進行相應的補償。假設排在每一位的結果每被點擊一次,會產生一分的補償,而排名在100名的結果被點擊一次,則產生10分甚至更多的補償。

3、緩存機制

    為了能在極短的時間內響應用戶的查詢請求,搜索引擎除了在用戶提交查詢信息前就生成關鍵詞的頁面排序列表外,還需要為那些查詢最頻繁的關鍵詞對應的頁面排序列表建立緩存機制。

    經過統計,搜索引擎發現關鍵詞查詢的集中現象非常明顯。查詢次數最多的前20%的關鍵詞大約 占了總查詢次數的80%,這就是著名的80/20法則。因些只要對這20%左右的關鍵詞建立緩存就可以滿足80%用戶的查詢需求。

    由于用戶查詢時返回的信息主要是與關鍵詞相關的頁面排序列表,因此關鍵詞緩存機制的建立主要是針對關鍵詞的頁面排序列表。在對常用關鍵詞的頁面排序列表建立緩存后,搜索引擎就可以把緩存中的信息返回給用戶,這樣速度就會非常 快,也就能滿足絕大部分用戶的需求。

    由于互聯網中的信息時刻都在增長,如果搜索引擎每次都向用戶返回同樣的信息,則不但用戶得不到更高質量的信息,其他網站也不能向用戶展示最新的高質量信息,從而造成信息滯后。因此,搜索引擎還會對緩存中的內容進行定期更新。

標簽:  

SEO教程網

猜你喜歡

發表評論

必填

選填

選填

必填,不填不讓過哦,嘻嘻。

記住我,下次回復時不用重新輸入個人信息

◎歡迎參與討論,請在這里發表您的看法、交流您的觀點。

站長推薦的文章
瀏覽最多的文章
無覓相關文章插件,快速提升流量 体彩app官方网站