2016-11-03 分類: 網站建設
索引是經過文字,分詞,消噪,去重后,搜索引擎得到的就是獨特的,能反映頁面主體內容的,以詞為單位的內容,接下來搜索引擎索引程序就可以提取關鍵詞,按照分詞程序劃分好的詞,把頁面轉換為一個關鍵詞組成的集全,同時記錄每一個關鍵詞在頁面上的出現頻率,出現次數,格式,位置.這樣,每個頁面都可以記錄為一串關鍵詞集全,其中每個關鍵詞的詞頻,格式,位置等權重信息也都記錄在案.
正向索引不能直接用于排名,如果只存在正向索引,排名程序需要掃描所有索引庫中的文件,找出包含關鍵詞的2個文件,再進行相關性計算,這樣的計算量無法滿足實時返回排名結果的要求.
所以搜索引擎會將正向索引數據倉庫重新構造為倒排索引,把文件對應到關鍵詞的映射轉換為關鍵詞到文件的映射.在倒排索引中關鍵詞是主鍵,每個關鍵詞都對應著一系列文件,這些文件中都出現了,這個關鍵詞,這樣當用戶搜索某個關鍵詞時,排序程序在倒排索引中定位到這個關鍵詞就可以馬上找出所有包含這個關鍵詞的文件.
分享名稱:正向索引與倒排索引的關系與區別
URL地址:http://m.newbst.com/news/59081.html
成都網站建設公司_創新互聯,為您提供品牌網站建設、Google、企業建站、網站維護、網站導航、建站公司
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯
猜你還喜歡下面的內容