2014-01-25 分類: 網(wǎng)站建設(shè)
搜索引擎是指使用特定的程序(如“百度蜘蛛”,或“機(jī)器人”),主要是收集互聯(lián)網(wǎng)上的信息。對(duì)于收集到的信息,它會(huì)進(jìn)行處理和排序,留下它認(rèn)為有價(jià)值的內(nèi)容信息。當(dāng)用戶使用本搜索引擎平臺(tái)搜索相關(guān)信息時(shí),本平臺(tái)直接將其收集的信息處理并顯示給用戶的系統(tǒng)。我們稱之為搜索引擎。
百度是大的中文搜索引擎,谷歌是大的英文搜索引擎。2010年,谷歌退出中國(guó)內(nèi)地市場(chǎng)。
搜索引擎的分類是什么?有四類:
通俗地說(shuō),可以搜索的關(guān)鍵詞有很多類別,比如“SEO優(yōu)化”的關(guān)鍵詞,可以搜索網(wǎng)頁(yè)、新聞、圖片、貼吧等類別。這是全文搜索引擎。例如:百度、谷歌、360
這種搜索引擎不具備自動(dòng)抓取互聯(lián)網(wǎng)內(nèi)容的功能。它需要手動(dòng)提交網(wǎng)站到搜索引擎,然后手動(dòng)審查。審核通過(guò)后,用戶可以在上面搜索您的網(wǎng)站信息。
現(xiàn)在中國(guó)幾乎沒(méi)有這樣的搜索引擎,國(guó)外也有其他的搜索引擎。這個(gè)搜索引擎意味著沒(méi)有人自己的抓取程序來(lái)抓取互聯(lián)網(wǎng)上的信息并直接顯示其他搜索引擎的結(jié)果。例如,使用360搜索引擎搜索一個(gè)關(guān)鍵詞,顯示的搜索結(jié)果就是百度的結(jié)果。
對(duì)一個(gè)行業(yè)或地區(qū)的深入調(diào)查。比如,“搜房網(wǎng)”只能在這個(gè)網(wǎng)站上搜索與房地產(chǎn)相關(guān)的信息,不能搜索到網(wǎng)上營(yíng)銷的SEO優(yōu)化信息。
那么搜索引擎的工作原理和步驟是什么呢?只有了解了搜索引擎的工作原理,才能更好地優(yōu)化我們的網(wǎng)站。
第一步,爬行
我們以百度為例說(shuō)明百度搜索引擎稱之為“百度蜘蛛”,這里的“爬行”是一個(gè)圖像。搜索引擎通過(guò)它的爬行程序沿著網(wǎng)站的鏈接爬行。我們的網(wǎng)站鏈接就像“蜘蛛網(wǎng)”。你怎么能想到如何讓蜘蛛在你的蜘蛛網(wǎng)上再爬幾個(gè)圈呢?也就是說(shuō),我們的網(wǎng)站鏈接應(yīng)該豐富合理,不應(yīng)該有死鏈接。這樣,蜘蛛就可以在你的網(wǎng)站上自由爬行,獲取更多的網(wǎng)站內(nèi)容。應(yīng)該注意的是,當(dāng)蜘蛛通常抓取頁(yè)面時(shí),它們首先抓取主頁(yè),然后抓取內(nèi)部頁(yè)面。
第二步:抓取存儲(chǔ)
蜘蛛沿著網(wǎng)站上的鏈接爬行,抓取與鏈接對(duì)應(yīng)的內(nèi)容,并將此頁(yè)面的內(nèi)容存儲(chǔ)在原始數(shù)據(jù)庫(kù)中。目前,spider只能捕獲文本信息,不能捕獲大圖像、視頻、JS等文件。這就要求我們?cè)?a href="http://m.newbst.com/seo.html" target="_blank">網(wǎng)站seo優(yōu)化時(shí)要注意。對(duì)于SEO優(yōu)化的網(wǎng)站,我們不建議使用大量圖片和JS特效,因?yàn)橹┲氩蝗菀鬃サ健N覀兘ㄗh添加更多的文章內(nèi)容,以增加被蜘蛛抓住的機(jī)會(huì)。
第三步:預(yù)處理
對(duì)于百度蜘蛛抓取的內(nèi)容,它并不能馬上顯示出來(lái),它必須經(jīng)過(guò)自己的處理。
蜘蛛捕獲的內(nèi)容將與百度數(shù)據(jù)庫(kù)中的內(nèi)容進(jìn)行比較。如果與現(xiàn)有數(shù)據(jù)庫(kù)中的內(nèi)容重復(fù),則將丟棄該內(nèi)容,并且不包括該內(nèi)容。所有的站長(zhǎng),發(fā)表文章和創(chuàng)作原創(chuàng)文章是非常重要的。
根據(jù)網(wǎng)頁(yè)的標(biāo)簽代碼,搜索引擎將提取網(wǎng)頁(yè)的關(guān)鍵詞,記錄關(guān)鍵詞出現(xiàn)的次數(shù),分析出現(xiàn)在網(wǎng)頁(yè)上的關(guān)鍵詞密度,分析判斷關(guān)鍵詞與網(wǎng)站內(nèi)容的相關(guān)性。至于關(guān)鍵詞密度,最好控制在2%-8%之間,因?yàn)檫@個(gè)范圍是搜索引擎最喜歡的范圍,應(yīng)該不會(huì)太低。如果太低,關(guān)鍵字和內(nèi)容之間的相關(guān)性就不會(huì)太高,也不會(huì)太高。如果太高,搜索引擎會(huì)認(rèn)為你有堆積關(guān)鍵字的行為,這將導(dǎo)致網(wǎng)站的正確減少。內(nèi)容相關(guān)性也很重要,你的網(wǎng)站是哪個(gè)行業(yè),哪個(gè)行業(yè)的內(nèi)容會(huì)被發(fā)送。你不能隨意發(fā)送一些與網(wǎng)站無(wú)關(guān)的內(nèi)容。即使內(nèi)容寫得很好,也不會(huì)被搜索引擎捕獲。
例如,單詞“de”、“de”、“Di”、“ah”和“you”被稱為停止詞。例如,搜索引擎中包含了“美麗的西湖”這個(gè)詞。如果你再發(fā)表一篇名為“美麗西湖”的文章,它會(huì)自動(dòng)刪除停止字,變成“美麗西湖”。這樣,它會(huì)認(rèn)為你的文章是一個(gè)副本,所以不會(huì)包括在內(nèi)。這里我們建議名字可以長(zhǎng)一些,這樣被收錄的概率會(huì)很大。
這里的噪音指的是網(wǎng)頁(yè)上的一些彈出窗口、版權(quán)和其他信息。搜索引擎將在基于關(guān)鍵字和網(wǎng)頁(yè)內(nèi)容構(gòu)建索引庫(kù)之前刪除這些信息,并將您的信息存儲(chǔ)在索引庫(kù)中。索引是什么樣子的?它是一個(gè)鏈接地址,然后是web內(nèi)容。所有的,我們以前做SEO優(yōu)化的站點(diǎn),最好不要添加彈出窗口,因?yàn)檫@樣不利于搜索引擎的收錄。
第四步:顯示結(jié)果
當(dāng)用戶使用搜索引擎搜索關(guān)鍵字時(shí),搜索引擎將顯示與您搜索的關(guān)鍵字匹配度高的頁(yè)面。
分享標(biāo)題:SEO從業(yè)者必須了解搜索引擎的工作原理和步驟
文章位置:http://m.newbst.com/news20/5720.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供外貿(mào)網(wǎng)站建設(shè)、自適應(yīng)網(wǎng)站、品牌網(wǎng)站制作、品牌網(wǎng)站設(shè)計(jì)、動(dòng)態(tài)網(wǎng)站、做網(wǎng)站
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容