2016-11-04 分類: 網站收錄
網站優化過程中收錄一直是一個不管是菜鳥還是老鳥都非常揪心的問題,收錄盡管與網站排名沒有直接關系,但是排名與收錄的的關系總所周知,隨著百度算法的不斷更新,百度對于收錄的準則也越來越高,如何做好收錄成了不管是站長還是企業都非常關心的一個問題,接下來就來談談網站為什么不收錄的問題。
一、是否知道這個頁面的存在
對頁面進行收錄當然首先就必須要知道有這個頁面,蜘蛛都不知道這個頁面,談何收錄?這一點主要分為2大類:搜索引擎找不到網頁入口和不讓搜索引擎抓取。
1.搜索引擎找不到網頁入口
很多時候不是你更新了文章搜索引擎就要來抓取收錄的,要怎么讓蜘蛛知道你的更新呢?除了有規律的更新,可以向百度站長平臺主動提交URL或者是提交站點地圖,也可以讓搜索引擎被動收集,這就是通過外鏈讓蜘蛛知道你的網頁,還有很多時候蜘蛛來到了你的網站,卻找不到你更新的鏈接,因為網站的鏈接結構做得太復雜或是內鏈結構差,以致搜索引擎在抓取時間類不會爬到網站深處的頁面,這也造成蜘蛛不知道該頁面的存在。所以不管怎么樣,一步我們要保證頁面能被蜘蛛看到,關于這一點可以通過查看網站日志來判斷蜘蛛是否來訪過。
2.不讓搜索引擎抓取
很多網站有意無意的直接在robots文件屏蔽了百度或網站部分頁面,卻整天在找原因為什么蜘蛛不來抓取我的頁面,這能怪百度嗎?你都不讓別人進門了,百度是怎么收錄你的網頁?所以有必要時常去檢查一下網站robots文件是否正常。
二、是否可以正常的抓取
好了,蜘蛛發現了這個頁面,也有權利抓取這個頁面了,那能否正常抓取就是一個很大的問題,我們都知道蜘蛛抓取這個頁面要從域名到DNS服務器再到網站空間,所以其中任何一個環節出現問題,蜘蛛都不能正常的抓取,首先域名需要備案,然后域名解析要正常,如果解析出現問題,域名是不能訪問網站ip地址的,這個時候網站打不開,蜘蛛抓取不了頁面。
在有就是經常提到的空間服務器了,服務器長期打不開那肯定是抓取不了的,這個大家都知道。并且如果服務器比較卡或者不穩定,就會影響蜘蛛的抓取,蜘蛛不能很好的去抓取頁面或由于加載慢只抓取到網頁一半,這就很大程度上影響了網站的收錄。具體可以看《草根站長做SEO,如何選擇域名和空間》
三、是否達到收錄標準
很多人覺得蜘蛛抓取就代表著收錄,其實這是錯誤的,蜘蛛訪問網站抓取頁面并不代表就要收錄你的網頁,頁面被抓取后要進行對比篩選,符合要求的才會被收錄,為什么有的頁面會被收錄后又被吐出來?就是因為蜘蛛在不停的過濾,這個我們先不談。既然是符合要求才會收錄,那收錄標準到底是什么呢?
1.行業不同標準也不同
這個是顯而易見的,新聞類網站肯定比一般企業站容易收錄,而對于醫療、bocai、成人用品等網站,標準肯定是更加嚴格,所以對于不同的行業,百度給予的收錄標準也是不一樣的。
2.不同的網站標準不同
百度有一個優先抓取的原則,對于絕大多數用戶喜歡,權重高的網站收錄得要快,就像新浪網、騰訊網收錄得肯定要比一般網站要快,為什么?因為信任,這類網站本身就有其嚴格的過濾系統,在此類網站公布的內容百度基本是直接抓了就收,搜索引擎是互聯網與用戶的橋梁,它的目的就是給用戶提供有價值的內容,你能為它提供良好的內容,它當然也會對你更好,這是互利的。所以搜索引擎不是做慈善,你的網站能給它什么?
3.主體收錄標準
百度有一個收錄標準值,對頁面進行評分,滿足評分收錄,否則扔掉。這里在木木SEO百度網站綜合得分算法一文中已經說過了,主要是從頁面基礎、站內、站外、用戶四個方面進行評分,感興趣的可以看一看,這里就簡單談一談網站頁面的內容,
(1)頁面字數建議是在500-800字,內容健康良好,信息豐富;
(2)受眾多: 文章要有一定得用戶需求,也即用戶檢索需求的大小;
(3)時效性:寫最新的東西用戶和搜索引擎都喜歡
(4)稀缺性: 稀缺主要是描述頁面在互聯網中的獨特性。稀缺不等于無重復,只有對于大量完全無增益的重復頁面,我們才應該認為其稀缺度較低。
四、是否有干凈的域名
剛說了百度的收錄標準,其實這一點也屬于一個特別的標準,域名不干凈同樣是影響網站收錄的一個重要原因,這個不干凈我們分為2種情況。一種就是域名在購買之前就有人用過了,不僅使用了而且還是用廢了,這樣的域名背景就是不干凈,這就相當于以前如果你去考警察,如果家里是黑幫世家,那肯定是會影響你的,這和百度的收錄是一個道理,嚴重的甚至域名直接作廢。
另一種情況是我們經常說的降權,網站被降權這段時間是百度的一個審核期,網站的內容就算滿足了上面所說的3點也可能收錄慢或者是不收錄,這個就需要我們堅持了。有恒心,能再次獲得百度的信賴就會收錄正常。
五、是否達到收錄大限度
等級不同的網站總收錄的大限度不同,日收錄限制也不同。在新浪上更新1萬篇文章可能會收錄90%,但是如果在你的企業站更新1w篇文章可能是只會收錄幾十篇。這就是因為新浪的等級比你的高。等級不等于權重,權重只是等級的一個部分,等級是網站的重要程度,就像我們一個網站中不同頁面的重要程度不一樣,而在整個互聯網不同網站的重要程度也不一樣。所以中小型網站不要為了有大量的收錄不斷的去大量更新文章,這樣的做法是錯誤的。不同的行業的更新的頻率和數量是不一樣,娛樂新聞行業可能需要幾分鐘更新一次,但是小型企業站可以幾天或者幾周更新一次都沒有關系。
同時不同網站總收錄大限度也不一樣,一個中小型新站目前的權重是1或者沒有權重,那么它的收錄限制維持在幾十、幾百到一千的數量。如果你發現不管你怎么更新做原創高質量的內容收錄也上不去,可能就是因為網站權重處于一個階段達到了收錄限制,所以收錄不可能上去。就好比家里的貓長得再大食量也沒有豬多,所以豬分配的食物就自然要比貓多了,如果網站要突破這個收錄的限制就要在權重上上升一個等級。
網站欄目:網站優化:網站為什么不收錄?
文章鏈接:http://m.newbst.com/news/59814.html
網站建設、網絡推廣公司-創新互聯,是專注品牌與效果的網站制作,網絡營銷seo公司;服務項目有網站營銷、網站收錄等
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯
猜你還喜歡下面的內容