2021-10-12 分類: 網(wǎng)站建設(shè)
有很多人問過我,說Mr.Zhao啊,百度如何判斷偽原創(chuàng)和原創(chuàng)百度喜歡什么樣的文章什么樣的文章比較例如獲得長尾詞排名等等諸如此類的問題。面對這些問題,我常常不知如何回答。如果我給一個比較大方向一些的答案,例如要重視用戶體驗、要有意義等等,那么提問者會覺得我在應(yīng)付他,他們往往抱怨說這些太模糊。可是我也沒法再給出具體的內(nèi)容,畢竟我不是百度,具體算法我又何德何能的為你們指點江山呢
為此,我開始寫這個“如果是我”系列的文章。在這一系列文章里,我假設(shè)如果是我絞盡腦汁的來為網(wǎng)民提供較好的搜索服務(wù),我會怎么做,我會怎么對待文章內(nèi)容、如何對待外鏈、如何對待網(wǎng)站結(jié)構(gòu)等等諸如此類的站點元素。當(dāng)然,本人技術(shù)有限,我只能寫一點我稍微理解的東西。而百度以及其它的商業(yè)搜索引擎,他們有大量比我優(yōu)秀的人才,相信他們的算法以及處理問題的方式會比我完善很多,而我之所以寫這些,無外乎拋磚引玉,希望大家看后,心里有一個大概。畢竟在SEO的道路上走過一段時間后,沒有誰能夠當(dāng)誰的老師,一些觀點僅供參考。
在此,我要鄭重聲明,這個系列文章中所有涉及到的思想、算法與程序,均非本人所寫,全部是我從一些公開的資料里搜集而得的。同時,相信大家也能理解,如果這些免費公開的東西都能做到如此程度,那么那些商業(yè)機密就更不用提了好的,現(xiàn)在開始。
如果是我,我會喜歡什么樣子的文章呢我會喜歡我的用戶喜歡的文章,如果硬要加判定標(biāo)準(zhǔn),那無外乎是兩種:1.原創(chuàng)且用戶喜歡。2.非原創(chuàng)且用戶喜歡。在這里,我的態(tài)度很明顯,偽原創(chuàng)就是非原創(chuàng)。那么用戶喜歡什么樣的文章呢很顯然,一些新觀點、新知識往往是用戶喜歡的,也就是說通常原創(chuàng)文章都是用戶喜歡的,而且即便用戶不喜歡,原創(chuàng)站點作為新鮮內(nèi)容的制造者,也應(yīng)該受到一定的保護。那么非原創(chuàng)的文章用戶就一定不喜歡嗎誠然否也。一些站點,其內(nèi)容往往是經(jīng)過搜集整理后聚合而成的,那么這些站點對用戶來說就是有價值的,其相對應(yīng)的文章理應(yīng)獲得較好的排名。
由此可見,我需要重視兩類文章即可。一是原創(chuàng)文章,二是有價值的信息聚合站點下的文章。首先要明確一點,本文探討范圍僅限內(nèi)容頁,而非專題頁、列表頁和首頁。那么我在甄別這兩類文章之前,我需要先進行信息的采集。本文對于spider程序部分不進行闡述。當(dāng)spider程序下載下來網(wǎng)頁信息后,在內(nèi)容處理的模塊中,我需要先對內(nèi)容除噪。
內(nèi)容除噪,并非大家經(jīng)常性的誤以為僅僅除去代碼而已。對于我來說,我還要出去頁面部分非正文內(nèi)容的文字。比如導(dǎo)航條、比如底部文字以及各個文章列表。將它們的影響除去后,我將得到一段僅僅包含網(wǎng)頁正文內(nèi)容的文本段落。寫過采集規(guī)則站長朋友應(yīng)該知道,這個并不難。但搜索引擎畢竟是一款程序,不可能針對每個站寫個類似于的采集規(guī)則的東西,所以我需要建立一套除噪算法。
網(wǎng)頁標(biāo)題:如果是我我如何判斷有價值的文章轉(zhuǎn)自Mr.Zhao
當(dāng)前URL:http://m.newbst.com/news19/130919.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站制作、關(guān)鍵詞優(yōu)化、網(wǎng)站導(dǎo)航、網(wǎng)站設(shè)計公司、服務(wù)器托管、網(wǎng)站設(shè)計
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容