頁面分析
頁面抓取只是搜索引擎工作的一個基礎環節,頁面抓取回來后并不代表搜索引擎馬上就可以向終端用戶提供查詢服務。因為用戶在使用搜索引擎進行查詢的時候,使用的是一個詞或者短語,而到目前為止,搜索引擎僅能提供網站的原始頁面,不能返回與用戶查詢條件想匹配的信息。因此,搜索引擎還需要對原始頁面進行一系列的分析和處理,以迎合用戶信息查詢的習慣。
1. 網頁索引
為了提高頁面檢索的效率,搜索引擎需要抓取回來的原始頁面建立索引,由于URL就是頁面的入口地址,為原始頁面建立索引實際上就是為了頁面的URL建立索引,這樣就可以實現根據URL快速定位到對應的頁面。
2. 網頁分析
網頁分析是整個網頁處理中很重要的環節,包括網頁正文信息的提取(即標簽信息過濾)、切詞、建立關鍵字索引列表及關鍵字重組這幾個重要的步驟。結果形成了一個關鍵字對應多個原始頁面的關系,即形成了與用戶查詢習慣相符合的信息雛形。
經過對原始頁面進行分析、處理后,搜索引擎已經可以根據用戶的查詢條件返回相應的頁面列表。但是,簡單地向用戶返回這個頁面列表,往往不能滿足用戶的需求,所以搜索引擎還會根據頁面與用戶查詢條件相關性的高低再對這個列表重新排列,然后把處理的列表返回給用戶。
以上是日照網站優化公司(昊諾網絡公司)分享,以后還要向大家介紹的搜索引擎對頁面排序的問題。
建站咨詢熱線
15163346885