2016-11-08 分類: 網站建設
如何查看搜索引擎SEO蜘蛛精否來過網站?如何正確識別搜索引擎SEO蜘蛛精?如何進行搜索引擎SEO蜘蛛精的抓取診斷?如何通過搜索引擎SEO蜘蛛精IP得知網站狀態?是對網站優化推廣診斷最好的途徑。
一、如何查看搜索引擎SEO蜘蛛精是否過來網站
可以通過查看網站日志進行分析。Windows服務器的IIS與Linux服務器的apache都有記錄網站日志的功能。
二、如何辨別搜索引擎SEO蜘蛛精
1、查看UA
首先要UA正確,百度公布過的UA有如下這些。新增渲染UA。
2、反查IP
可以通過dns反差ip的方法判斷是否是搜索引擎SEO蜘蛛精,只要不是來自“. baidu . com”或“. baidu . jp”即為假冒的百度SEO蜘蛛精。
三、如何診斷搜索引擎SEO蜘蛛精是否能夠正常抓取網站內容
張俊SEO認為很多網站因使用JavaScript代碼或框架結構等問題,不能被搜索引擎SEO蜘蛛精所抓取。這里進行診斷也是為了防止SEO蜘蛛精來網站后,因為不能正常抓取而離開,導致網站收錄很差,快照不更新等問題。
如果診斷結果有問題,則需要修正問題,提升與搜索引擎SEO蜘蛛精的友好度。
百度官方在線抓取診斷工具如下圖所示,選好網站(主頁或其他頁面)后,選擇PC UA 或者移動UA,最后點擊“抓取”即可。
四、如何通過百度SEO蜘蛛精IP得知網站狀態。張俊SEO認為以下內容僅供參考。
1、抓取你網站的網頁蜘蛛
60.172.229.61
61.129.45.72
61.135.162.*
2、百度競價蜘蛛
61.135.165.134
117.34.74.66
118.122.188.194
119.63.196.9
125.39.78.185
3、百度統計的蜘蛛
61.135.186.*
4、站長工具的模仿的百度蜘蛛
61.147.98.146
61.188.39.16
113.98.254.245
117.21.220.245
117.28.255.42
5、搜外站長工具的模仿的百度蜘蛛
124.248.34.52
6、114站長工具箱模仿的百度蜘蛛
119.147.114.213
121.10.141.*
7、百度圖片蜘蛛
123.15.**.**
8、抓取網站內頁收錄的權重較低的非原創,需要通過一段時間考察
123.125.71.*
9、站長工具檢測造成的無用
125.90.88.*
10、百度考察期蜘蛛或降權蜘蛛
159.226.50.*
180.76.5.*
180.76.5.87
220.181.158.107
11、偽裝百度蜘蛛
180.149.130.*
12、新站及站點有不正常現象
183.91.40.144
203.208.60.*
13、不間斷巡邏各站就是路過
210.72.225.*
14、沙盒或者有被K站
123.125.68.*
218.30.118.102
220.181.68.*
15、此ip爬過的文章或首頁,絕對24小時內放出來和隔夜快照
220.181.108.*
16、百度蜘蛛IP來過,準備抓取
123.125.66.*
220.181.7.*
17、度過新站考察期
121.14.89.*
18、百度抓取首頁的專用IP,網站首頁快照更新快,隔夜更新
220.181.108.95
19、百度的權重IP段,抓取的文章第二天放出來,權重較高
220.181.108.92
20、綜合性權重IP,抓取文章和首頁,權重較高
220.181.108.91
220.181.108.75
21、抓取內頁收錄的,但權重較低
123.125.71.95
123.125.71.97
123.181.108.77
123.125.71.106
22、抓取網站首頁的,也屬于權重段,權重較高。
220.181.108.89
220.181.108.94
220.181.108.97
220.181.108.80
220.181.108.77
220.181.108.83
220.181.108.86
以上就是某個網站帶來的百度搜索引擎SEO蜘蛛精的分析方法。
SEO優化中不可忽視的蜘蛛精陷阱。什么是SEO優化蜘蛛精陷阱?搜索引擎SEO蜘蛛精陷阱有著怎樣的危害呢?我們又該如何去避免這些蜘蛛陷阱呢?今日張俊SEO就和大家聊聊關于如何避免SEO優化蜘蛛精陷阱的那些事兒。
什么是SEO蜘蛛精陷阱?
網站設計做的對于搜索引擎來說很不友好,就導致了不利于蜘蛛精的爬行和抓取,其實這樣就構成了一個蜘蛛陷阱。官方說法,“蜘蛛精陷阱”是阻止蜘蛛精程序爬行網站的障礙物,通常是那些顯示網頁的技術方法,目前很多瀏覽器在設計的時候考慮過這些因素,所以可能網頁界面看起來非常正常,但這些蜘蛛精陷阱會對蜘蛛精程序造成障礙,如果消除這些蜘蛛精陷阱,可以使蜘蛛精程序收錄更多的網頁。SEO工作中,網頁被收錄是基礎工作,但對于搜索引擎來講,極少情況會100%收錄你網站的所有網頁,搜索引擎的爬蟲程序設計的再精巧,也難以逾越所謂的蜘蛛精陷阱。
搜索引擎SEO蜘蛛精陷阱的主要類別
1、登錄要求
2、動態URL
3、強制用Cookies
4、框架結構
5、各種跳轉
6、Flash
7、Javascript鏈接
8、Session ID
如何避免搜索引擎SEO蜘蛛精陷阱?
1、采用session id的頁面,有的銷售類站點為了分析用戶的某些信息會采用會話ID來跟蹤用戶,訪問站點的時候每個用戶訪問都會增加一次session id而加入到URL中,同樣蜘蛛的每一次訪問也會被當做為一個新用戶,每次蜘蛛來訪問的URL中都會加入一個session id,這樣就會產生了同一個頁面但URL不同的情況,這種的一來會產生復制內容頁面,造成了高度重復的內容頁,同時也是最常見的蜘蛛陷阱之一。比如說有的網站的為了提高銷售業績,而進行彈窗會話等,比如說您好來自XXX地的朋友等。
2、常識性的SEO蜘蛛精陷阱,采用強制注冊或登錄才能訪問的頁面,這種的對于SEO蜘蛛精來說就相當為難了,因為SEO蜘蛛精無法提交注冊,更無法輸入用戶名和密碼登錄查看內容,對于SEO蜘蛛精來說我們直接點擊查看到的內容也是蜘蛛所能看到的內容。
3、喜歡采用flash的站點,之所以說是喜歡采用flash的站點是因為對于一些中小型企業來說,因為flash本身可以做很多種效果,尤其是放在導航上視覺效果強,所以不少企業站喜歡弄個flash來展示自己公司的實力,文化,產品等,甚至一些企業站點的網站首頁就是一個flash,要么是在多長時間后通過flash跳轉到另外一個頁面,要么就是通過flash上的鏈接讓用戶自己點擊后進入一個新的頁面,但是對于SEO蜘蛛精來說一來是很難讀取flash中的內容,所以SEO蜘蛛精也很難點擊flash上的鏈接。
4、動態URL,在url中加入過多的符號或者網址參數等,這種蜘蛛陷阱我在url優化中曾經有提到,雖然說隨著搜索引擎的的技術發展,動態url對于蜘蛛的抓取已經越來越不是問題了,但是從搜索引擎友好度上來講,靜態哪怕是偽靜態url相對來說都比動態url要好,可以看下很多SEO同行對于url中的處理方式。
5、框架,在早期框架到處被泛濫使用,而現在框架網頁很多網站已經很少使用了,一是因為現在隨著各大CMS系統的開發問世,網站維護相對也越來越簡單了,早期網站使用框架是因為對網站頁面的維護有一定的便利性了,現在已經大可不必了,而且不利于搜索引擎收錄也是框架越來越少被使用的原因之一。
6、JS,雖然現在搜索引擎對于javascript里的鏈接是可以跟蹤甚至在嘗試拆解分析的,但是我們最好不要寄望于搜索引擎自己克服困難,雖然說通過js可以做一些效果不錯的導航,但是css同樣可以做到;為了提高網站對搜索引擎的友好度建議使網頁能夠更好的SEO蜘蛛精爬行,就盡量不要采用js,當然在seo中,js有一個好處就是站長不希望被收錄的頁面或者友情鏈接可以采用js。還有一種方法可以消除JavaScript 蜘蛛程序陷阱。
網站SEO優化中幾點吸引蜘蛛精的方法!
一:采用百度官方方法
在百度算法里,在用戶搜索相同標題或關鍵詞的時候,原創內容會優先展示。因此提高文章的原創度,自然是最好的,但是往往我們服務客戶的網站專業性質很強,而我們的知識面有限,也只能通過偽原創實現,但是提升偽原創的質量也是可取的。
第二:發外鏈吸引蜘蛛精的方法
很多站長發布外鏈都是添加網站的首頁網址就OK了,如果你的網站權重低,更新不頻繁的話,可能蜘蛛精通過鏈接到了你的網站就不再深入去爬行了。方法:可以去各大論壇和博客發布文章,然后帶上當天發布的文章地址,這種效果還是比較不錯的,小伙伴們可以試試。
第三:友情鏈接交換的選擇
友鏈的作用,每個SEO都知道,它對于網站的排名有一定的幫助,同時又是引導蜘蛛在網站之間來回爬行的一種方式,對于網站的排名和收錄都是非常有利。所以我們要經常和一些更新比較頻繁的網站交換鏈接。
第四:站內頁面之間鏈接
不論是文章之間還是欄目和網站首頁之間,全部要有一個或者幾個鏈接的路徑互通,這個路徑是蜘蛛精在網站上面爬行的一種鏈接,同時也可以讓用戶點擊的鏈接,對于網站的收錄,排名和權重的提高都是比較不錯的。
文章名稱:張俊SEO蜘蛛精細分析爬取網站詳情
新聞來源:http://m.newbst.com/news6/62506.html
成都網站建設公司_創新互聯,為您提供企業網站制作、響應式網站、網站導航、網站收錄、網站維護、品牌網站設計
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯
猜你還喜歡下面的內容