如何保證搜索引擎結(jié)果準(zhǔn)確度
搜索引擎如何能夠搜得更準(zhǔn)是其最重要的目標(biāo),那么如何才能使得搜索結(jié)果更準(zhǔn)確?深圳
網(wǎng)站建設(shè)小編帶大家看看這里面涉及的3個(gè)核心問(wèn)題。
1.用戶(hù)真正的需求是什么
搜索引擎用戶(hù)輸入的查詢(xún)請(qǐng)求非常簡(jiǎn)短,查詢(xún)的平均長(zhǎng)度是2.7個(gè)單詞。如何從如此短的查詢(xún)請(qǐng)求里獲知隱藏其后的真實(shí)用戶(hù)需求?這是搜索引擎首先需要解決的非常重要的問(wèn)題。如果不能獲取用戶(hù)真正的搜索意圖,搜索的準(zhǔn)確性無(wú)從談起,即使后續(xù)內(nèi)容匹配算法再精巧也無(wú)濟(jì)于事。
從另外一個(gè)角度看,即使是同一個(gè)查詢(xún)?cè)~,不同用戶(hù)的搜索目的是不同的,如何識(shí)別這種差異?如果更進(jìn)一步,即使是同一個(gè)用戶(hù)發(fā)出的同一個(gè)查詢(xún)?cè)~,也可能因?yàn)橛脩?hù)所處場(chǎng)景不同,其目的存在差異,又如何識(shí)別?所有這些都是搜索引擎需要解決的核心問(wèn)題,即用戶(hù)在此時(shí)此地發(fā)出某個(gè)查詢(xún),他的真實(shí)搜索意圖到底是什么。
2.哪些信息是和用戶(hù)需求真正相關(guān)的
上述第一個(gè)核心問(wèn)題是從用戶(hù)需求角度出發(fā)的,另外兩個(gè)核心問(wèn)題則是從數(shù)據(jù)角度考慮的。搜索引擎本質(zhì)上是一個(gè)匹配過(guò)程,即從海量數(shù)據(jù)里面找到能夠匹配用戶(hù)需求的內(nèi)容。所以,在明確用戶(hù)真實(shí)意圖這個(gè)前提條件做到后,如何找到能夠滿(mǎn)足用戶(hù)需求的信息則成為關(guān)鍵因素。
判斷內(nèi)容和用戶(hù)查詢(xún)關(guān)鍵詞的相關(guān)性,一直是信息檢索領(lǐng)域的核心研究課題,不斷提出的信息檢索模型即在試圖解決這個(gè)問(wèn)題。相關(guān)研究歷時(shí)近60年,盡管不斷有新方法提出,檢索效果總體而言也在逐步改進(jìn),但是這個(gè)領(lǐng)域的基本指導(dǎo)思想還是基于關(guān)鍵詞的匹配,包括現(xiàn)在所有搜索引擎的相關(guān)性計(jì)算部分,其基本計(jì)算思路和幾十年前相比并無(wú)本質(zhì)差異。
3.哪些信息是用戶(hù)可以信賴(lài)的
搜索本質(zhì)上是找到能夠滿(mǎn)足用戶(hù)需求的信息,盡管相關(guān)性是衡量信息是否滿(mǎn)足用戶(hù)需求的一個(gè)重要方面,但并非全部。信息是否值得信賴(lài)是另外一個(gè)重要的衡量標(biāo)準(zhǔn)。
搜索引擎需要處理的信息對(duì)象是互聯(lián)網(wǎng)上任意用戶(hù)發(fā)布的內(nèi)容,但是內(nèi)容發(fā)布者所發(fā)布內(nèi)容是否可信并無(wú)明確判斷標(biāo)準(zhǔn)。這其間存在惡意的信息發(fā)布者故意歪曲事實(shí)的情況,也有信息發(fā)布者無(wú)心的錯(cuò)誤。在同一個(gè)查詢(xún)的搜索結(jié)果內(nèi),完全可能存在相互矛盾的搜索答案,此時(shí)信息的可信性即成為突出問(wèn)題。
標(biāo)題名稱(chēng):如何保證搜索引擎結(jié)果準(zhǔn)確度
文章網(wǎng)址:http://m.newbst.com/news44/117944.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供電子商務(wù)、網(wǎng)站改版、網(wǎng)站收錄、ChatGPT、服務(wù)器托管、企業(yè)建站
廣告
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶(hù)投稿、用戶(hù)轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀(guān)點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話(huà):028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源:
創(chuàng)新互聯(lián)