免费观看又色又爽又黄的小说免费_美女福利视频国产片_亚洲欧美精品_美国一级大黄大色毛片

利用蜘蛛爬取跟蹤分析網(wǎng)站整體信息

2021-10-19    分類: 網(wǎng)站建設(shè)

做網(wǎng)站的基本都知道蜘蛛是什么,其實(shí)蜘蛛就是一個(gè)搜索引擎的爬取程序,用來(lái)收錄網(wǎng)站,然后在搜索引擎里面搜索呈現(xiàn)出來(lái)的頁(yè)面。利用搜索引擎蜘蛛的爬取跟蹤我們可以從中得到很多意想不到的信息從而更利于我們優(yōu)化網(wǎng)站。

1、 利用蜘蛛告訴我們死鏈接

死鏈接對(duì)于網(wǎng)站的危害是非常大的,我們都知道,可以使用 robots.txt來(lái)對(duì)其進(jìn)行屏蔽,但如何找出這些鏈接成為我們很頭疼的問(wèn)題,而搜索引擎蜘蛛會(huì)告訴我們哪些是真正的死鏈接,當(dāng)蜘蛛爬取到一個(gè)死鏈接網(wǎng)頁(yè)的時(shí)候,會(huì)在IIS日志里返回一個(gè)404狀態(tài)碼,這個(gè)時(shí)候就是告訴我們,這個(gè)網(wǎng)面是不可訪問(wèn)的,是一個(gè)死鏈接,所以我們只要查看IIS日志我們就知道搜索引擎蜘蛛提示我們網(wǎng)站有哪些死鏈接,然后我們?cè)儆胷obots.txt屏蔽掉即可,這樣就不會(huì)讓死鏈接對(duì)我們的網(wǎng)站造成影響了。

2、利用蜘蛛爬取的數(shù)量詳細(xì)分析網(wǎng)站整體情況

我們可以通過(guò)IIS日志查詢每天搜索引擎蜘蛛訪問(wèn)我們網(wǎng)站的次數(shù),并且可以知道它訪問(wèn)了我們哪些頁(yè)面,我們可以根據(jù)蜘蛛每天的爬取量就可以算出每個(gè)月蜘蛛的平均抓取量,這樣我們就可以進(jìn)行對(duì)比。

提升蜘蛛爬取量有以下兩個(gè)因素

1)外部鏈接質(zhì)量和數(shù)量增加

外鏈數(shù)量越多,蜘蛛爬取次數(shù)也就越多,同樣外鏈的質(zhì)量和權(quán)重越高,蜘蛛抓取網(wǎng)站的次數(shù)也就會(huì)越多了。

2)網(wǎng)站文章質(zhì)量和更新頻率

網(wǎng)站文章質(zhì)量越好,蜘蛛來(lái)爬取后放出文章的通過(guò)率就會(huì)越高,蜘蛛爬取的次數(shù)就會(huì)增加,同樣的道理,更新頻率越快,蜘蛛爬取的頻率也會(huì)增加。

從以上可以得出,如果網(wǎng)站每個(gè)月蜘蛛的爬取量是增加的,那我們就可以判斷出來(lái)是由哪個(gè)因素引起的,也可以肯定網(wǎng)站權(quán)重也是隨著蜘蛛爬取量上長(zhǎng)而上升的,反之,蜘蛛的爬取量減少了,也可以確定,網(wǎng)站權(quán)重會(huì)隨之下降。所以每天都要記錄IIS日志的蜘蛛爬取量,然后根據(jù)這個(gè)來(lái)做網(wǎng)站優(yōu)化的調(diào)整。

3、根據(jù)IIS日志的蜘蛛爬取分析服務(wù)器的穩(wěn)定性

蜘蛛爬取我們的網(wǎng)站,如果網(wǎng)站不穩(wěn)定,訪問(wèn)出了問(wèn)題,蜘蛛就會(huì)返回503或500這樣的狀態(tài)碼,并且也會(huì)出現(xiàn)200 0 64 這樣的狀態(tài)碼,如果出現(xiàn)這種情況,首先要確定是什么時(shí)間產(chǎn)生的,需要馬上聯(lián)系服務(wù)器商或空間商,這樣就可以馬上解決我們所存在的問(wèn)題。

4、 利用IIS日志蜘蛛爬取深入分析

搜索引擎在爬取我們網(wǎng)站內(nèi)容的時(shí)候,經(jīng)常會(huì)出現(xiàn)有一些目錄他在爬取之后就不再去重復(fù)爬取了,而有些目錄甚至一些內(nèi)頁(yè)會(huì)重復(fù)的不斷爬取,對(duì)于此我們可以根據(jù)IIS日志中蜘蛛的爬取情況作珍上整體分析或是對(duì)比,看那些爬取差的頁(yè)面是因?yàn)槭裁丛蛟斐傻?。比如有一個(gè)案例,用IIS日志發(fā)現(xiàn)蜘蛛喜歡不斷抓取網(wǎng)站的新聞目錄,而產(chǎn)品目錄抓取得少,究其原因,發(fā)現(xiàn)這兩個(gè)頁(yè)面之間的相似程度達(dá)到了90%以上,像這樣的重復(fù)性很高的頁(yè)面就要注意了,一定要添加原創(chuàng)性內(nèi)容,避免頁(yè)面的相似程度過(guò)高而導(dǎo)致蜘蛛不來(lái)抓取。

從以上我們可以看出,我們非常有必要每天都要下載網(wǎng)站的IIS日志進(jìn)行查看,以及時(shí)的發(fā)現(xiàn)問(wèn)題并解決問(wèn)題,以保證我們的優(yōu)化不受影響。

網(wǎng)站標(biāo)題:利用蜘蛛爬取跟蹤分析網(wǎng)站整體信息
文章地址:http://m.newbst.com/news13/132013.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供建站公司、域名注冊(cè)、手機(jī)網(wǎng)站建設(shè)、網(wǎng)站內(nèi)鏈服務(wù)器托管、App設(shè)計(jì)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

成都app開(kāi)發(fā)公司