2021-11-22 分類: 網站建設
我想說的是無論搜索引擎怎樣變化,大概的收錄原理是不會變的:
1、找到網站的URL并下載頁面。
2、判斷頁面質量是否達到收錄標準收錄頁面,否則刪除。
3、判斷收錄頁面是否更新,更新頁面快照。以上三條是搜索引擎收錄頁面基本的規律,無論百度還是谷歌都不會違背。那么我們就可以以以上三條作為依據詳細的解釋一下搜索引擎的工作原理。
1、抓取網頁系統:分為探測系統和下載系統,探測系統就是我們平常說的蜘蛛,蜘蛛在互聯網上爬行時探測到一個網站的URL,就會把URL所指向的頁面利用下載系統,下載到搜索引擎的服務器上,然后將頁面交給數據分析系統。
2、數據分析系統:分為數據分析和數據處理兩個系統,當數據分析系統從抓取網頁系統那獲取到被下載的頁面,首先進行數據分析去除不相關的文字或網站重復內容,進行頁面文字的處理,然后對處理過后的頁面內容進行判斷,是否達到收錄標準,達到交給存儲系統,沒有達到刪除。
3、存儲數據系統:將收錄的頁面進行保存,然后定時進行判斷存儲的頁面是否有更新。
4、緩存系統:存儲搜索引擎認為高價值的內容,當用戶搜索某個關鍵詞時經常看到收錄量有幾千萬,但是搜索引擎顯示的只有1000條,這也就是說只有1000條被放在了緩存系統上,用戶可以最快速的查找到他們想要的內容。
5、展示系統:用戶搜索返回到顯示器上的信息。
這是搜索引擎的系統的組成,那么一個頁面是如何被搜索引擎發現并收錄的呢計算機的緩存中讀取數據,比在硬盤中讀取數據快很多。所以搜索引擎只將緩存中的一部分顯示給用戶。被存儲在硬盤中的頁面,搜索引擎會根據網站權重定時對其進判斷是否有更新,是否達到了放入緩存區的標準,如果搜索引擎在判斷是否有更新的同時發現網站頁面被刪除或網頁達不到被收錄的標準也會被刪除。
名稱欄目:SEO從業者必須了解的搜索引擎工作原理
URL網址:http://m.newbst.com/news/137044.html
成都網站建設公司_創新互聯,為您提供外貿網站建設、自適應網站、搜索引擎優化、品牌網站制作、網站導航、網站建設
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯
猜你還喜歡下面的內容