robots.txt 是放在一個網站根目錄之下的一個文件,并不是給用戶看的,而是為了讓搜索引擎看的。robots 的意思可以翻譯為搜索引擎機器人,也就是搜索引擎派出去爬取網站頁面的蜘蛛,而 robots 文件就是蜘蛛爬取網站時需要經歷的第一道們,通過 robots 文件可以明確自己的訪問權限。形象的解釋可以看做是限制某一些蜘蛛進入網站,以及限制進入了網站的蜘蛛訪問網站內容權限。
Robots 文件并不是一個像 W3C 那樣指定網絡規范協議,而是眾多搜索引擎約定俗成的。下圖顯示的是我們網站的 robots 文件內容。第一行的 User-agent:*的意思是以下的 Disallow 命令是針對所有的搜索引擎的,也可以改為針對某一單獨的搜索引擎。Disallow 后的內容則是不允許搜索引擎爬取收錄的內容。
robots 文件的意義及對網站優化作用
雖然知道了 robots 文件的意義是什么,但是 robots 文件對于網站 seo 優化都有什么用呢?robots 文件對于網站 seo 是有著一定作用的,要對其熟練的進行運用,主要有以下五個方面促進網站優化推廣,因為 robots 文件是針對搜索引擎的,所以運用好能夠增加搜索引擎爬取網站的體驗度從而增加網站收錄量。
1.屏蔽網站的空、死鏈接
由于網站內容的修改以及刪除,容易導致網站內的一些內鏈失效變為空鏈或者死鏈。通常我們會對網站定期檢查空鏈和死鏈,將這些鏈接提取出來,寫入 robots 文件之中,防止搜索引擎爬取該鏈接,間接提升搜索引擎的體驗。該種方式是有效的,因為修改已經收錄的內容時會使得搜索引擎重新的爬取修改過的網頁,再次判斷是否進行收錄,如果沒有繼續收錄了,那么就得不嘗試了。
2.防止蜘蛛爬取網站重復內容
因為網站很多的動態頁面搜索引擎時無法收錄的,所以很多時候我們需要對于這些動態頁面進行制定一個靜態的頁面以助于搜索引擎收錄。這時候就讓搜索引擎不要爬取某一些重復的內容,可以減少站內的頁面關鍵詞權重競爭。
3.防止蜘蛛爬取無意義內容,浪費服務器資源
網站上是有很多的內容都是一些無意義的內容,例如網站的各種腳本代碼、css 文件和 php 文件等等,這些文件對于網站優化都是無意義的,爬取這些網站不僅不會收錄,而且還會浪費服務器的資源。上圖中很多禁止訪問的內容都是這類無意義的文件目錄。
4.保護網站隱私內容
網站有很多的頁面都是有著一定隱私的,例如一個用戶接受的推送又或者是購物車等等,這些鏈接雖然在一個頁面之中有,但是顯然是不希望搜索引擎爬取的內容。
5.有利于網站調試
在網站初步上線前都會有著一定的錯誤,需要一段時間的調試再對搜索引擎開放爬取,在調試期間就可以將 robots 文件設置為對于所有的搜索引擎都處于拒絕爬取狀態,等所有的錯誤都解決后再修改 robots 文件。
注意細節:每次修改 robots 文件之后都需要到搜索引擎站長平臺去提交 robots 文件更新提醒,因為搜索引擎更新網站的狀態都是需要一定的時間,只有人工提交才能夠讓更新后的 robots 文件 like 生效。
網頁標題:robots文件對網站優化的作用
文章URL:http://m.newbst.com/news34/252884.html
成都網站建設公司_創新互聯,為您提供標簽優化、建站公司、全網營銷推廣、網站排名、靜態網站、網頁設計公司
廣告
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源:
創新互聯