2021-12-16 分類: 網站建設
因為在端午節前。筆者做過一個實驗,并且寫了一篇實驗報告《探究搜索引擎不收錄網站內容與外鏈因素有無關系的實驗》,具體實驗內容,在這里就不再多說。因為筆者針對leyuanbaby.com做的這個實驗結論,并沒有達到想要的效果,所以我還沒有死心,就通過網站日志來觀察到底蜘蛛有沒有爬行我未收錄的鏈接。這個過程中,獲得了一些關于分析網站日志心得,在這里分享給大家。
通過網站日志我們可以清晰的看到用戶和搜索引擎蜘蛛訪問網站的行為,并形成一個數據,這些數據可以讓我們知道搜索引擎對于網站的態度,以及網站的健康情況。通過網站日志我們獲取的指標有很多,比如:訪問次數、停留時間、抓取量、目錄抓取統計、頁面抓取統計、蜘蛛訪問IP、HTTP狀態碼、蜘蛛活躍時段、蜘蛛爬取路徑等。
那么下面就通過實例來看看,網站日志是如何分析的:
#Software: Microsoft Internet Information Services 6.0
#Version: 1.0
#Date: 2013-05-27 16:44:28
#Fields: date time s-sitename s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs(User-agent) sc-status sc- substatus sc-win32-status
2013-05-27 16:44:27 W3SVC195483716 61.152.94.150 GET /index.html - 80 - 123.125.71.84 Mozilla/5.0+(compatible; +Baiduspider/2.0;++http://www.aoxsys.net/search/spider.html) 200 0 64
2013-05-27 16:45:15 W3SVC195483716 61.152.94.150 GET /index.html - 80 - 220.181.108.176 Mozilla/5.0+(compatible; +Baiduspider/2.0;++http://www.aoxsys.net/search/spider.html) 200 0 64
上面是我的站點leyuanbaby.com的5月27的網站日志情況,我們就根據以上的一段日志來分析,如何查看網站日志。
1.首先我們看到Software,這是指軟件的名稱,version表示的是軟件的版本號,這兩項就不再多說。
2.Date表示的是訪問日期,即百度蜘蛛是什么時間來爬行的你的站點。
3. s-sitename:表示你的虛擬主機的代稱或機器碼;
4.s-ip:服務器IP;
5.cs-method:表示訪問方法或發生的請求/提交事件,常見的有兩種:一個是GET,就是平常我們打開一個URL訪問的動作,另一個是POST,提交表單時的動作;
6.cs-uri-stem:用戶在當前時間訪問哪一個文件或具體頁面;
7.cs-uri-query:是指訪問地址的附帶參數,如asp文件后面的字符串id=12等等,如果沒有參數則用“-”表示;
8.s-port:訪問的端口
9.cs-username:訪問者名稱,如果沒有參數則用“-”表示;
10.c-ip:訪問者IP
11.cs(User-agent):訪問的搜索引擎和蜘蛛名稱;
12.sc-status:Http狀態碼,200表示成功,403表示沒有權限,404表示打不到該頁面,500表示程序有錯;
通過上面的實例,我們已經知道了分析網站日志要看的各項數據,那么我們分析網站日志能給我們帶來什么作用和提示呢筆者認為,網站日志可以給我們帶來6項提示:
1.清晰明了的知道百度蜘蛛抓取網頁的情況。
2.根據蜘蛛的爬行情況,我們可以看出搜索引擎收錄網頁的原則。
3.搜索引擎蜘蛛爬行站點是否正常,從而明白網站優化手段是否健康。
4.搜索引擎蜘蛛在哪個頁面爬行最多,為什么喜歡這一頁面,是否其他頁面要向此頁面學習。
5.搜索引擎蜘蛛很少訪問的頁面帶給我們的提示是,這個頁面可能存在一些搜索引擎不喜愛的東西,我們要去總結修改。
6.我們卸載robotS中的內容,搜索引擎有無訪問
同時我們需要特別注意的是Http狀態碼,通過狀態碼,我們可以更明確的知道,這一頁面存在什么樣的問題,蜘蛛是如何評判的。Http狀態碼有很多,是每一位站長需要掌握和熟記的,在這里就不做多解釋。
網站的健康分析、蜘蛛爬行規則等均是通過網站日志來觀察,可以說網站日志就是蜘蛛和站長們交流的一種方式,學會看網站日志,對于網站優化有著很重要的作用。
分享題目:網站日志如何分析之實例解說
URL網址:http://m.newbst.com/news10/140710.html
成都網站建設公司_創新互聯,為您提供面包屑導航、Google、做網站、網頁設計公司、網站導航、外貿建站
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯
猜你還喜歡下面的內容