robots文件是什么?
今天,上海網站優化—一易企排小編給大家整理關于robots文件的概念知識。
我們在與人交往的時候,往往會將自己最好的一面展現給對方,避免不好的方面給對方留下不好的印象。同樣,百度為了收錄更多有效的頁面,而SEO人員也為了展示更多有價值的頁面,避免百度收錄一些沒有意義的頁面,robots文件就誕生了。但是網站的程序是多樣化的,不可能每個頁面包括的數據庫都有價值,所以百度給出了一個優先級的txt文件,也就是robots.txt文件。這個robots文件里優先存儲的一般都是禁止百度蜘蛛爬行的文件,也就是不希望百度收錄該網站的頁面。
當百度蜘蛛首次爬行我們網站的時候,會優先爬行根目錄下的robots文件,根據robots文件里屏蔽的文件夾或者某個文件名,而跳過這些文件,然后進行其他目錄下頁面的爬行及收錄。如果網站下并不存在這個文件,那么百度或許會收錄一些不必要的文件,甚至暴露我們的數據庫等,這就會給一些不法分子造成空隙,通過我們的網站獲利。
1.robots.robots.txt所存放的位置
robots.txt文本文件必須存放在站點的根目錄下,也就是需要和首頁在同級目錄下。這樣一方面優先百度查找并進行排除,另一方面使百度蜘蛛沒有必要去判斷robots.txt文件存放在哪個目錄下。如果沒有robots.txt文件,會使百度蜘蛛爬行所有的網站,然后進行收錄等,增加了一些不必要的操作,加大了百度蜘蛛的工作量。
注意:百度蜘蛛只能識別小寫的rrobots文件,如圖,而且只能放在站點根目錄下。
2.robots.txt常用語句
一般情況下,為了快速
建站,會使用一些網絡上的開源程序,而這些開源程序已經了解百度蜘蛛的模式,會默認在根目錄下添加robots.txt文件,并且已經屏蔽了某些文件夾。以織夢網站CMS(內容管理系統)里的robots.txt為例:
根據織夢網站的CMS里的robots.txt文件可以看到,User-agent:*表示禁止所有的搜索引擎收錄本站。Disallow的意思是禁止抓取,/data/表示數據庫,/dede/表示織夢默認的后臺登錄地址,/images/表示圖片文件,/include/表示配置文件,/plus/表示附加文件,/special/表示專題目錄,/templets/表示模板靜態文件,/uploads/表示上傳文件。最后的Sitemap是網站地圖,是告訴百度蜘蛛這是網站的運行軌跡。
以上是織夢網站CMS里的robots文件,每個程序都會有對應的robots文件,我們只需要根據不同的開源程序提供的robots文
件,我們只需要根據不同的開源程序提供的robots文件進行添加即可。
3.robots在網站中的展現形式
當SEO工作者需要在網站中展現robots文件的時候,可以根據自己的代碼知識,或者通過網站程序員的幫助,進行一些必要的代碼添加。而常用的代碼則是<META NAME="ROBOTS"CONTENT="INDEX,FOLLOW">
·META:HTML網站中一個重要的標簽,通??梢哉宫F網站的關鍵詞和網站描述等;
·NAME="ROBOTS":識別所有搜索引擎;
·CONTENT="INDEX,FOLLOW":搜索引擎索引該頁,并可以通過網頁的鏈接搜索其他頁面。
4.小結
一個優秀的網站都會存在robots文件,這個文件往往能幫助我們規避一些不必要的文件被展現出來。做SEO重要的任務是展現我們的首頁、欄目頁及重要的文章頁。只有當這些頁面優化得足夠好的時候,我們的網站才是一個優秀的網站。
分享標題:SEO中robots文件的應用
文章地址:http://m.newbst.com/news45/254145.html
成都網站建設公司_創新互聯,為您提供品牌網站設計、做網站、軟件開發、網站制作、響應式網站、關鍵詞優化
廣告
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源:
創新互聯