美女脱了内裤趴开腿让男生添_国产日本一区二区三区_美女无遮挡免费视频观看网站_国内高清久久久久久久久 - 最近中文字幕的在线mv视频

日照網絡公司
掃描關注網站建設微信公眾賬號

掃一掃微信二維碼

日照網站優化公司教大家一些網站優化的基礎知識!

昊諾網絡o2017-07-25 09:25:28o網絡知識o

頁面分析


  頁面抓取只是搜索引擎工作的一個基礎環節,頁面抓取回來后并不代表搜索引擎馬上就可以向終端用戶提供查詢服務。因為用戶在使用搜索引擎進行查詢的時候,使用的是一個詞或者短語,而到目前為止,搜索引擎僅能提供網站的原始頁面,不能返回與用戶查詢條件想匹配的信息。因此,搜索引擎還需要對原始頁面進行一系列的分析和處理,以迎合用戶信息查詢的習慣。
1.  網頁索引
  為了提高頁面檢索的效率,搜索引擎需要抓取回來的原始頁面建立索引,由于URL就是頁面的入口地址,為原始頁面建立索引實際上就是為了頁面的URL建立索引,這樣就可以實現根據URL快速定位到對應的頁面。
2.  網頁分析
  網頁分析是整個網頁處理中很重要的環節,包括網頁正文信息的提取(即標簽信息過濾)、切詞、建立關鍵字索引列表及關鍵字重組這幾個重要的步驟。結果形成了一個關鍵字對應多個原始頁面的關系,即形成了與用戶查詢習慣相符合的信息雛形。

  •   正文信息提取
      網頁正文信息的提取實際上就是網頁中非正文信息的過濾。其中,很為重要的就是對網頁中標簽信息的過濾。經過標簽過濾以后,搜索引擎就可以得到網頁的正文信息。
  •   切詞/分詞
      經過對原始頁面提取正文信息后,搜索引擎就可以得到頁面的實質內容。而為了得到與用戶查詢相關的數據,搜索引擎還需要對頁面中的內容進行切分(也就是我們常說的切詞或者分詞),從而形成與用戶查詢條件相匹配的以關鍵字為單位的信息列表。
      每個搜索引擎的切詞系統都會存在或多或少或少的差別,切詞系統的優化只要取決于開發者對語言的理想能力。格外是中文語言環境里,切詞算法直接影響網頁內容經過切詞處理后會產生什么樣的關鍵字,這些關鍵字是否與用戶的搜索習慣一致。因而,切詞的結果直接決定搜索引擎能否提供與用戶查詢條件想匹配的信息。
  •   關鍵字重組
      為了迎合用戶順找信息的習慣,即以關鍵字為條件順找與關鍵字相關的頁面。因此,搜索引擎需要建立以關鍵字為主索引的一個關鍵字對應多個頁面的關系表,即關鍵字反向索引表。而建立關鍵字反向索引表重要的任務就是對所以頁面中的關鍵字列表進行重組。

  經過對原始頁面進行分析、處理后,搜索引擎已經可以根據用戶的查詢條件返回相應的頁面列表。但是,簡單地向用戶返回這個頁面列表,往往不能滿足用戶的需求,所以搜索引擎還會根據頁面與用戶查詢條件相關性的高低再對這個列表重新排列,然后把處理的列表返回給用戶。


   以上是日照網站優化公司(昊諾網絡公司)分享,以后還要向大家介紹的搜索引擎對頁面排序的問題。

文章關鍵詞