2023-03-30 分類: 網站建設
怎么看百度蜘蛛是否來過?怎么正確識別百度蜘蛛?怎么進行蜘蛛的抓取診斷?怎么經過百度蜘蛛IP得知網站狀態?
一、怎么檢查百度蜘蛛是否過來網站
可以經過檢查網站日志進行剖析。Windows服務器的IIS與Linux服務器的apache都有記載網站日志的功用。
二、怎么區分百度蜘蛛
百度官方給出的區分百度蜘蛛的辦法如下。
1、檢查UA
首先要UA正確,百度公布過的UA有如下這些。
移動UA:Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,likeGecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0;+)
PC UA:Mozilla/5.0 (compatible; Baiduspider/2.0;+)
新增烘托UA:
移動UA:Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 likeMac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143Safari/601.1 (compatible; Baiduspider-render/2.0; +)
PC UA:Mozilla/5.0 (compatible;Baiduspider-render/2.0; +)
三、怎么經過百度蜘蛛IP得知網站狀態
1、抓取你網站的網頁蜘蛛
60.172.229.61
61.129.45.72
61.135.162.*
2、百度競價蜘蛛
61.135.165.134
117.34.74.66
118.122.188.194
119.63.196.9
125.39.78.185
3、百度統計的蜘蛛
61.135.186.*
4、站長東西的仿照的百度蜘蛛
61.147.98.146
61.188.39.16
113.98.254.245
117.21.220.245
117.28.255.42
5、搜外站長東西的仿照的百度蜘蛛
124.248.34.52
6、114站長東西箱仿照的百度蜘蛛
119.147.114.213
121.10.141.*
7、百度圖片蜘蛛
123.15.**.**
8、抓取網站內頁錄入的權重較低的非原創,需要經過一段時間調查
123.125.71.*
9、站長東西檢測造成的無用
125.90.88.*
10、百度調查期蜘蛛或降權蜘蛛
159.226.50.*
180.76.5.*
180.76.5.87
220.181.158.107
11、假裝百度蜘蛛
180.149.130.*
12、新站及站點有不正常現象
183.91.40.144
203.208.60.*
13、不間斷巡查各站就是路過
210.72.225.*
14、沙盒或者有被K站
123.125.68.*
218.30.118.102
220.181.68.*
15、此ip爬過的文章或首頁,肯定24小時內放出來和隔夜快照
220.181.108.*
16、百度蜘蛛IP來過,預備抓取
123.125.66.*
220.181.7.*
17、度過新站調查期
121.14.89.*
18、百度抓取首頁的專用IP,網站首頁快照更新快,隔夜更新
220.181.108.95
19、百度的權重IP段,抓取的文章第二天放出來,權重較高
220.181.108.92
20、綜合性權重IP,抓取文章和首頁,權重較高
220.181.108.91
220.181.108.75
21、抓取內頁錄入的,但權重較低
123.125.71.95
123.125.71.97
123.181.108.77
123.125.71.106
22、抓取網站首頁的,也屬于權重段,權重較高。
220.181.108.89
220.181.108.94
220.181.108.97
220.181.108.80
220.181.108.77
220.181.108.83
220.181.108.86
網站題目:百度搜索引擎蜘蛛剖析
當前URL:http://m.newbst.com/news13/248863.html
成都網站建設公司_創新互聯,為您提供小程序開發、定制網站、網站策劃、虛擬主機、ChatGPT、商城網站
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯
猜你還喜歡下面的內容