2016-09-04 分類: Google
天空為什么是藍(lán)色的? 這是小孩常常會提出的一個問題,而大部分家長都無法獨立解答。在不太久以前,尋找正確的答案至少需要求助于百科全書,甚至意味著跑一趟圖書館。在最近這幾年,父母只需要跑到電腦前,登陸谷歌(Google),評估與該問題相關(guān)的鏈接,快速瀏覽解釋,深入理解這個問題,從而給孩子們滿意的答復(fù)。
但是到了2015年,即使這個看似已經(jīng)提速的過程還是未能達(dá)到預(yù)期。一方面,問題不只是被拼寫到搜索框中,更多是直接向移動設(shè)備口頭提出。另一方面,雖然從經(jīng)過排列的鏈接清單中選擇最具相關(guān)性的一條仍然是大部分問題的有效解決辦法,但那些獲得明確答案的提問者開始希望迅速得到答案。一旦谷歌不能做到,他們就感到失望,甚至生氣。
因此……“谷歌,為什么天空是藍(lán)色的?”(注:語音提問)
Android手機只花了不到一秒鐘就對這個口頭問題作出回應(yīng)—以一種可以讓人理解但又明顯自動化的音調(diào)。
“在晴朗、無云的白天,天空之所以是藍(lán)色的是因為大氣中的微粒對來自太陽的藍(lán)色光散射能力高于紅色光。
谷歌搜索團(tuán)隊負(fù)責(zé)人阿密特·辛格哈爾(Amit Singhal)利用這個解釋來幫助證明,迄今為止全球最受歡迎的搜索引擎在過去幾年是如何進(jìn)行自我改革的。在過去幾年我對他進(jìn)行的采訪中,辛格哈爾將推行重大調(diào)整比喻為在半空飛行過程中更換發(fā)動機,因為谷歌將其算法“飛行計劃”更改為改善排名、增加新的信息材料(如圖片、書本或者旅行),或者在用戶還沒有輸入完問題之前就開始進(jìn)行搜索。不過,在過去幾年,谷歌不僅改變了飛機的發(fā)動機,還改變了駕駛艙的大部分。移動端不可阻擋的勢頭(在2015年手機和平板電腦搜索量可能超過PC搜索量)促成了一些更為重大的變革:鑒于出現(xiàn)如此重大的變化,需要對未來的使命進(jìn)行重新考慮。
他表示:“我們都必須深入地考慮,在已經(jīng)進(jìn)入移動化的世界里,搜索真正意味著什么。想到這個問題的時候,我們頭都大了。
不斷變革
在過去17年歷史里,谷歌搜索不斷進(jìn)化,在這個過程中該公司經(jīng)常發(fā)表慶祝性的博客文章并偶然進(jìn)行新聞發(fā)布會(不過一旦要對這些變革進(jìn)行量化,谷歌又恢復(fù)到一貫的“惜字如金”—多年來,該公司對其用于幫助排列搜索詞條的提示的數(shù)量描述為“超過200條”)。因為搜索仍然是該公司的旗艦產(chǎn)品—并且支持搜索廣告的平臺仍然是谷歌的主要收入來源—谷歌一直在努力改善這個數(shù)十億人用以尋找信息的途徑。在過去幾年,通過短期和長期努力,該公司加快了這種節(jié)奏,以期于競爭對手。
用戶不應(yīng)錯過部分變革。搜索速度更快,內(nèi)容更加新鮮,也更具社交性(不過這是在Google Plus推出后,當(dāng)時該公司大力推廣“社交搜索”,現(xiàn)在大家已經(jīng)很少聽到這個口號了)。谷歌搜索的頁面也不一樣了。谷歌搜索體驗負(fù)責(zé)人之一塔瑪爾·耶霍舒亞(Tamar Yehoshua)表示: “在早期,頁面較為簡潔—只有主頁面和搜索結(jié)果?,F(xiàn)在,在搜索結(jié)果頁面上有很多不同的功能和產(chǎn)品。
展望未來,谷歌一直在擴展人工智能的邊界,從而打造一個巨型“大腦”—能夠更好地理解用戶和世界、甚至在人們還沒提問之前就列出準(zhǔn)確結(jié)果。
但是部分批評者指出,谷歌搜索正在走下坡路。他們埋怨垃圾結(jié)果太多,或者對較新信息的過分強調(diào)導(dǎo)致較早前出現(xiàn)但更具相關(guān)性的結(jié)果被阻擋。大家都聽說過,谷歌自夸的“10個藍(lán)色鏈接”( ten blue links)已經(jīng)被大量令人迷惑和謀求私利的功能(如購物、新聞及多媒體結(jié)果)所污染(另一方面,谷歌在美國大的競爭對手微軟必應(yīng)吹噓稱,谷歌仍然非常依賴于10個藍(lán)色鏈接)。美國新聞聚合網(wǎng)站Buzzfeed去年一則新聞的標(biāo)題指出,“我們正進(jìn)入現(xiàn)代歷史最糟糕的時期”,接著直接指責(zé)稱“谷歌的實用性正在降低”。
辛格哈爾對此作出嚴(yán)詞回應(yīng)?!笆聦嵧耆喾矗彼硎?。“我調(diào)查了這些投訴,發(fā)現(xiàn)當(dāng)中存在一些懷舊情緒。我們現(xiàn)在的搜索遠(yuǎn)好于去年或者兩年前。
辛格哈爾的評論表明了谷歌搜索的關(guān)鍵人物現(xiàn)在所具有的自豪感和信心。在幾年前,盡管谷歌認(rèn)為其搜索質(zhì)量無人能比,但也存在真實的憂慮—擔(dān)心該公司的統(tǒng)治地位可能被削弱。谷歌當(dāng)時處于Facebook恐慌的陣痛之中。“我們不擁有這些聯(lián)系,”辛格哈爾在2011年告訴我,顯然他指的是Facebook的網(wǎng)絡(luò)(Facebook禁止谷歌抓取其數(shù)據(jù))?!拔也恢佬畔⒃谶@些網(wǎng)絡(luò)里如何流動。”在這種躁狂癥最嚴(yán)重的時期,辛格哈爾在谷歌擔(dān)當(dāng)類似于兇事預(yù)言家的角色,在某個時刻攔住該公司的社交業(yè)務(wù)負(fù)責(zé)人維克·岡多特拉(VicGundotra),高聲指出這些封閉網(wǎng)絡(luò)可能會威脅谷歌的存在。辛格哈爾在接受采訪時跟我說,如果有人他向提出這種威脅與谷歌在搜索領(lǐng)域無人能敵的威力不可相提并論,他會回答說:“在我小時候,泛美航空公司(Pan Am,1991年倒閉)也是看起來非常強大的。
不過實際上這些擔(dān)心有點過頭了;現(xiàn)在不可能有人將谷歌比喻為這家已經(jīng)破產(chǎn)的航空公司。Facebook的“圖譜搜索"(Graph Search)仍然是剛起步的產(chǎn)品,但發(fā)展勢頭緩慢,對谷歌造成的沖擊較小。必應(yīng)雖然在搜索質(zhì)量上可稱得上是受人尊敬的競爭對手,但所持市場份額仍然不足五分之一。雖然Google Plus的成績未及公司預(yù)期,未能最終形成一款轟動的社交網(wǎng)絡(luò)產(chǎn)品,但的確成功地吸引了很多搜索用戶注冊加入。
統(tǒng)治地位
谷歌現(xiàn)在面臨的威脅并不是由強勁對手所組建的封閉網(wǎng)絡(luò),而是搜索現(xiàn)在似乎已經(jīng)從網(wǎng)絡(luò)遷移至各款應(yīng)用程序(向移動端轉(zhuǎn)移也代表了谷歌的搜索廣告收入受到挑戰(zhàn))。谷歌認(rèn)為這種應(yīng)用內(nèi)部信息的崛起是可以被其征服的—畢竟,移動開發(fā)者也希望自己的信息能夠被世人了解。自從2013年秋天以來,谷歌啟動了一個名為App Indexing的項目,希望將移動應(yīng)用程序內(nèi)的數(shù)據(jù)集中到其總索引。不過應(yīng)用索引目前并不包括iOS應(yīng)用,這是一個比較大的問題。App Indexing產(chǎn)品經(jīng)理勞倫斯·張(Lawrence Chang)表示:“仍然有一條很長的路要走。不過我們已經(jīng)打造了基礎(chǔ)性的結(jié)構(gòu)單元。
不過現(xiàn)在,網(wǎng)絡(luò)應(yīng)用世界的挑戰(zhàn)并沒有影響谷歌在搜索領(lǐng)域的統(tǒng)治地位。數(shù)據(jù)仍然大得令人驚訝。谷歌每天接受超過30億條搜索詞條。在美國,三分之二的搜索使用谷歌—在全球范圍內(nèi),該公司仍然享受類似的統(tǒng)治地位(最近市場份額降低主要不是因為搜索質(zhì)量問題,而是雅虎與火狐達(dá)成協(xié)議,取代谷歌成為該瀏覽器的默認(rèn)搜索引擎)。甚至更為令人印象深刻的是,谷歌處理超過80%移動搜索。2013年谷歌遭遇持續(xù)5分鐘的宕機事件,網(wǎng)絡(luò)流量減少40%。
沒有任何一家搜索領(lǐng)域競爭對手能達(dá)到谷歌的基礎(chǔ)設(shè)施、人才儲備或者經(jīng)驗。沒多少企業(yè)能有谷歌的雄心壯志。因此盡管有關(guān)谷歌的新聞報道出現(xiàn)了監(jiān)管問題、谷歌眼鏡的幸運與不幸以及YouTube的青少年超級巨星,搜索一直進(jìn)行著穩(wěn)定且高強度的革新。
從某些方面看,這些革新只是延續(xù)谷歌自最初以來對搜索所進(jìn)行的變革。在微觀基礎(chǔ)上,谷歌對其算法進(jìn)行了一些細(xì)微調(diào)整,在每周一次的搜索質(zhì)量發(fā)布會上對其大加稱贊。之后,每2年或3年,其排名系統(tǒng)會出現(xiàn)重大更新,從而在那些與關(guān)鍵字高度相關(guān)的企業(yè)之間產(chǎn)生贏家和輸家。最近一次是在2013年,推出代號為Hummingbird的算法。過去10年,本·戈麥斯(Ben Gomes)一直在搜索部門擔(dān)任辛格哈爾的副手,他指出谷歌在過去3年對搜索排名進(jìn)行的調(diào)整超過了此前13年。
從各個方面看,大的挑戰(zhàn)一直在于針對從PC向便攜設(shè)備轉(zhuǎn)移的趨勢進(jìn)行調(diào)整。正如很多互聯(lián)網(wǎng)企業(yè)一樣,谷歌搜索采用一種以移動為中心的辦法。谷歌搜索的主設(shè)計師瓊·威利(Jon Wiley) 表示:“移動端對我們?nèi)绾慰紤]設(shè)計產(chǎn)生巨大影響。”在執(zhí)掌搜索設(shè)計領(lǐng)導(dǎo)職位后,他首先做的一樣事情是將移動和PC團(tuán)隊整合在一起。最初,這個想法是將大量努力投入到手機端—現(xiàn)在,他表示,完全是關(guān)于將搜索視為一種多設(shè)備的體驗。
知識圖譜
重大變革當(dāng)中,哪項最為意義重大的?谷歌搜索團(tuán)隊對此毫不掩飾。搜索業(yè)務(wù)負(fù)責(zé)人辛格爾明確表示:“當(dāng)然是知識圖譜(Knowledge Graph),只要你開始進(jìn)行打造,就能慢慢了解現(xiàn)實世界。第二是語音輸入—因為我不能在這里打字,”他一邊說著,一邊向手腕上的三星智能手表打手勢。“我們還意識到,除了預(yù)測外還需要一些科學(xué),這樣的話人們就不必總是提出問題,因此我們開發(fā)了Google Now。
知識圖譜將全世界的知識打造成一個廣大的數(shù)據(jù)庫。語音搜索將語音帶到搜索。Google Now在用戶提問之前就告知答案。所有這三項都與谷歌對移動端的關(guān)注密切相關(guān)。這些組成部分—以及它們運作的方式—已經(jīng)在過去三年幫助對谷歌搜索進(jìn)行改造:從一個“10個藍(lán)色鏈接”的投遞系統(tǒng)到某些幾乎超自然的東西—這個系統(tǒng)的行為并不像計算機,而是一個智能的知識儲備庫,能夠聰明地解譯和滿足你的信息需求。在你還沒有開始予以尋找的時候,它已經(jīng)完成一切。
谷歌在2010年收購一家名為MetaWeb的公司,該消息并沒有引起太多關(guān)注。但事實證明這筆并購成為了谷歌搜索史上一項最意義重大的變革的關(guān)鍵。
MetaWeb在2005年由丹尼·希利斯(Danny Hillis)創(chuàng)辦,他是一位知名的計算機科學(xué)家和企業(yè)家。在經(jīng)營他的公司Applied Minds時,希利斯構(gòu)想了大量創(chuàng)造性項目,不過他認(rèn)為MetaWeb項目非常意義重大,因而將其剝離出來成為一家獨立公司。MetaWeb公司在2007年成立,是所謂的Semantic Web的首批重大利用成果之一。Semantic Web實際上是一種處理多數(shù)據(jù)庫的辦法,經(jīng)整合后數(shù)據(jù)庫中的信息可被輕松閱讀。希利斯說:“我們嘗試創(chuàng)造一個全球性的數(shù)據(jù)庫,包含全世界的信息?!庇捎贛etaweb可以掃描互聯(lián)網(wǎng)來回答問題,因而被廣泛視為是谷歌的競爭對手。不過在經(jīng)過幾年的經(jīng)營以及超過5000萬美元融資后,希利斯意識到只有加入一家規(guī)模更大的公司—即谷歌—這個想法才能開花結(jié)果。
當(dāng)時,谷歌已經(jīng)在向用戶提問提供一些直接的回答:如果你輸入“奧巴馬生日”,它會在搜索結(jié)果的頂部顯示“1961年8月14日”。不過,正如谷歌在2010年7月一篇宣布收購Metaweb的博客文章上解釋說,谷歌的搜索引擎未能回答像“美國西岸學(xué)費低于3萬美元的大學(xué)”或“至少奪得過一個奧斯卡獎項的40歲以上藝人”這樣的問題。該篇博客承諾Metaweb將幫助谷歌提供這些答案。
產(chǎn)品經(jīng)理艾米麗·莫斯利(Emily Moxley)從2011年就開始參與到Metaweb項目,她表示:“谷歌收購Metaweb的時候,知道‘物’的概念將成為搜索一個非常重要的部分。我們認(rèn)為這是快速呈現(xiàn)一些簡要事實以及人們所關(guān)注事物的有關(guān)信息的良好途徑。
在2012年5月,谷歌推出了這些Metaweb材料,將其稱為“知識圖譜”(Knowledge Graph)。該項目從1200萬實體發(fā)展至5億。該產(chǎn)品可以在自認(rèn)為合適的時候?qū)λ阉鹘Y(jié)果提供補充性的答案:多項有關(guān)所搜索主題的關(guān)鍵事實,其位置位于平常的搜索排名的右側(cè)。這看起來有點“手氣不錯”(I’m feeling lucky)的感覺。
在介紹谷歌如何考慮哪些詞條應(yīng)該獲得知識圖譜結(jié)果時,莫斯利引用了弗吉尼亞州里奇蒙德(Richmond, Virginia)地區(qū)的洲際高速公路系統(tǒng)。從西北向佛羅里達(dá)州進(jìn)發(fā)的游客應(yīng)該非常清楚這種情況—在里奇蒙德背部,95號公路出現(xiàn)分叉,駕駛員可以選擇繼續(xù)沿南北主干道行駛并途徑市中心,或者選擇295號公路,在外圍繞過該城市并在里奇蒙德南部再進(jìn)入95號公路。
她解釋說,如果用戶提供一個搜索詞條,谷歌將其擴展為替代性的形式以及同義詞等,之后提供一個算法測試,從而了解它是否與“知識圖譜”結(jié)果具有相關(guān)性?!叭缓?,用戶可能會選擇295號公路的出口,說‘好,有什么可能的知識圖譜內(nèi)容會對這個詞條有用?’—我們搜索所有的文件,給出相關(guān)的內(nèi)容。之后用戶再次回到95號公路,我們說‘好,我們認(rèn)為這些內(nèi)容足夠有用,讓我們更顯著地呈現(xiàn)這些信息吧’。
谷歌搜索與“知識圖譜”整合的2年多里,該公司繼續(xù)改善這款產(chǎn)品(谷歌并未正式公布設(shè)計“知識圖譜”回答的詞條比例,不過似乎大約為25%)。最初,“知識圖譜”較為動態(tài)。不過這款產(chǎn)品逐漸掌握谷歌搜索本身所具有的學(xué)習(xí)能力,能夠分析用戶的習(xí)慣。莫斯利舉了“誰在電影《太空炮彈》(Spaceballs)中扮演Barf?”作為例子,“知識圖譜”已經(jīng)接觸了非常多詞條,因而知道如何提供涉及演員和電影的圖解—并且以非常快的速度完成。
“知識圖譜”也在另一個重要領(lǐng)域—新鮮度—取得較大進(jìn)步。由于谷歌假定對一個問題提供一個正確答案,因此其信息必須與時俱進(jìn)。否則,答案會是錯誤的,對用戶造成的影響會比沒有答案更糟糕。莫斯利表示,“知識圖譜”在2012年推出的時候,其中一個實體的變化—例如大眾汽車(Volkswagen)決定聘請新的首席執(zhí)行官—該系統(tǒng)可能要花長達(dá)2周來反映這種變化?,F(xiàn)在該系統(tǒng)能夠在幾分鐘內(nèi)處理這些新聞并進(jìn)行調(diào)整。但是她承認(rèn),對“知識圖譜”而言,這種特定的“大眾汽車首席執(zhí)行官”詞條既是成功也是失敗。新任首席執(zhí)行官要幾個月后才會正式上任?!爸R圖譜”仍然展示當(dāng)前的領(lǐng)導(dǎo)人,不過很多在谷歌輸入“大眾汽車首席執(zhí)行官”詞條的用戶可能尋求的是有關(guān)繼任者的信息。因此,盡管“知識圖譜”是正確的,其回復(fù)可能不會令用戶滿意。
谷歌還需要進(jìn)行很多改進(jìn)。首先是增加更多領(lǐng)域和行業(yè);該項目最近增加了汽車、視頻游戲及雨果獎(Hugo Award)獲獎?wù)叩闹R。不過她表示,谷歌正嘗試找出如何提供更加復(fù)雜的結(jié)果—不再只是快速事實,還提供更主觀、更模糊的聯(lián)想?!叭藗儾恢皇菍κ聦嵏信d趣,”她說。“他們對一些主觀性的東西也感興趣,如該電視節(jié)目是否好看。這些東西能幫助將‘知識圖譜’提升至新的級別?!边@就像谷歌并不希望讓用戶感覺自己在進(jìn)行機械搜索,而是咨詢一位圣人,這位圣人不僅無所不知而且在文化方面還具有自己的獨立見解。
不過這還需要走很長的路,并且由于對“知識圖譜”所提供信息的預(yù)期提升,其所犯錯誤也不斷令用戶感到失望。莫斯利最近較為煩惱,因為她意識到“知識圖譜”雖然了解電視節(jié)目的信息,但是缺乏有關(guān)新節(jié)目以及何時播出的內(nèi)容。她說:“我希望有這樣的提醒,能告訴我本周有新節(jié)目播出,我也想知道哪些網(wǎng)站有放映,從而可以登陸觀看,”承諾最終谷歌將穿越這個“中間階段”,雖然該項目還沒有將所有東西都收入到目錄中。
談到期望提升,可能“知識圖譜”最顯眼的錯誤是谷歌在2010年夏天收購Metaweb時提到的兩個問題。4年后,其搜索引擎仍然未能對“美國西岸學(xué)費低于3萬美元的大學(xué)”或“至少奪得過一個奧斯卡獎項的40歲以上藝人”等問題提供一站式答案。
語音輸入
在意識到移動技術(shù)將變得無處不在后,谷歌決定對搜索業(yè)務(wù)進(jìn)行一項細(xì)微但意義重大的調(diào)整。該公司不再將搜索詞條視為向計算機系統(tǒng)提交的指令,而是把所有輸入的內(nèi)容都當(dāng)成是對話?!昂茱@然,一旦你擁有這種類型的設(shè)備(他舉起手機做例證),語音輸入將變得非常重要,”本·戈麥斯說,“同樣非常明確的是,用戶說話比打字更自然。
這種調(diào)整不僅涉及改變搜索引擎處理詞條的方式。它意味著改變我們。我們現(xiàn)在可以將搜索框—不管在PC或在移動端上—視為可以進(jìn)行對話的對象。塔瑪爾·耶霍舒亞(Tamar Yehoshua) 表示:“在谷歌出現(xiàn)前,人們并沒有詞條的概念,我們花了多年時間教會大家使用詞條。不過,如果你以平常的方式進(jìn)行交流,不必進(jìn)行很認(rèn)真的思考,這樣不是更輕松嗎?這會是非常美好的情景。
進(jìn)行這種變革需要2個方面。首先,谷歌的搜索引擎必須加強,從而更仔細(xì)地傾聽,對輸入的語音內(nèi)容進(jìn)行分析。之后谷歌必須確保當(dāng)用戶向手機發(fā)出語音指示—或者在搜索框通過文字進(jìn)行交流,其系統(tǒng)會理解用戶在說什么。
的確,谷歌已經(jīng)在語音識別方面進(jìn)行了一段時間的努力。“在很多年前,我們當(dāng)然知道這些基礎(chǔ)部分—語音、自然語言處理—將具有重要意義,”耶霍舒亞說。“我們知道那些都是投資,都是科技界未曾解決的問題,我們需要花多年時間才能收獲成果?!痹?0世紀(jì)初的幾年里,谷歌有一項服務(wù)名為Google 411,所做的事情跟用戶撥打(付費)電話號碼查詢系統(tǒng)時電話公司所做的事情一樣。谷歌使用那數(shù)百萬的免費電話來學(xué)會如何正確地解譯不同語言和口音的語音。這一點非常有用,不過在其他一些地方,谷歌并沒有獲得分析語音輸入所需的大約2500個短語樣本。因此,該公司開始派遣小型團(tuán)隊到多個不同的地區(qū),并在此之前在谷歌網(wǎng)絡(luò)發(fā)布消息稱該公司希望收集語音樣本。在印度尼西亞進(jìn)行的努力具有代表意義。谷歌語音專家林奈·哈(Linne Ha)說:“在第二天,有900人現(xiàn)身?!惫雀柽M(jìn)行這些研究的時候,會選擇在與該地區(qū)相匹配的現(xiàn)場條件進(jìn)行收集:如在香港的街道和巴黎的地鐵路里記錄物體。
這些努力獲得了回報—谷歌搜索支持159種語言,語音搜素(Voice Search)現(xiàn)在支持其中58種語言。谷歌聲稱該應(yīng)用的“錯詞率”已經(jīng)降低至8%。
戈麥斯自豪地指出谷歌發(fā)展過程中的一個里程碑:他現(xiàn)在親自進(jìn)行語音展示?!拔业目谝舴浅2粯?biāo)準(zhǔn),”這位印度裔工程師說?!拔业脑舭l(fā)音是美國的,不過我不發(fā)R的的音。”在這個語音項目前,戈麥斯從未親自去證明谷歌在語音識別方面的努力:相反,該公司使用一位內(nèi)部的專家,他具有純正的美國口音,能夠與機器和諧共處?,F(xiàn)在,戈麥斯已經(jīng)與這位專家失去聯(lián)系?!八辉偈菍@份工作非常重要,”他說?!拔铱梢杂H自進(jìn)行展示。讓我坐在記者面前,親自進(jìn)行語音輸入,我對此毫不畏懼。
谷歌還必須考慮電話向用戶回應(yīng)的方式。應(yīng)該像Siri那樣的擬人化形象,還是使用明顯的機器人語調(diào)從而讓用戶意識到自己在跟系統(tǒng)對話?谷歌選擇了后者。該公司搜索設(shè)計主管瓊·威利表示,為了成功實現(xiàn)與一個有意識個體對話這種錯覺,他們必須達(dá)到皮克斯(Pixar)般故事自動敘述能力。“我認(rèn)為從具有個性的計算機到人類與之自然交流還有很長的路要走。
不過科技迅速發(fā)展,已經(jīng)足以讓谷歌(當(dāng)然,也包括其他一些公司)達(dá)到研究人員數(shù)十年來所幻想的語音互動級別?!拔艺J(rèn)為三或四樣?xùn)|西推動實現(xiàn)了這種可能性,”戈麥斯說。“顯然,計算機變得更快且運算能力變得更強。硬件—麥克風(fēng)—也變得更好。軟件算法方面也有進(jìn)步。不過大的變化是我們理解語言的能力。
費爾南多·佩雷拉(Fernando Pereira)是搜索部門的“杰出搜索科學(xué)家”(Distinguished Research Scientist),過去30年他一直從事自然語言處理(NLP)工作。他表示,這幾年來,谷歌變得非常善于找出如何接收搜索詞條以及將詞條與網(wǎng)絡(luò)及其他其他信息庫上的文件配對。他說:“當(dāng)你進(jìn)行搜索的時候,很有可能你在詞條中使用的詞語會出現(xiàn)在部分搜索結(jié)果中?!辈贿^將“知識圖譜”這樣的數(shù)據(jù)庫增加到搜索引擎中會帶來新的挑戰(zhàn)和機遇。他指出:“要預(yù)期所使用的語言是否與數(shù)據(jù)庫所設(shè)計的方式配對變得更具難度。
一方面,這并不容易。當(dāng)谷歌收到像“巨人隊在哪里打比賽?”這樣的詞條,它必須知道很多東西:該詞條涉及體育,球隊所比賽的場館等。它還必須作出選擇—這是棒球聯(lián)盟的巨人隊還是橄欖球隊?用戶希望知道的是該球隊通常在哪里打比賽,如主場,還是該球隊下周的比賽在哪里進(jìn)行?谷歌使用詞條中的信號以及用戶此前的習(xí)慣來確定答案。佩雷拉說:“所有這些思考,所有的推理,都是在幾年前不能做到的。
一旦這些障礙被去清除,谷歌的NLP系統(tǒng)可以憑借“知識圖譜”而實現(xiàn)進(jìn)一步提升?!拔覀冮_始理解世界上的事物,”戈麥斯說。這讓谷歌能夠正確地猜測用戶在詢問什么,甚至即使詞條的拼寫存在錯誤或者語言輸入不太正確。戈麥斯指出,例如有人向手機說“大衛(wèi)·卡梅倫(David Cameron)”,系統(tǒng)已經(jīng)知道這兩個詞通常是配對在一起的,而且還是男性—因而可以使用替代詞“他”。即使麥克風(fēng)沒有太聽清楚后面說到的姓,“知識圖譜”也可以想到指的是英國首相。
谷歌懂得的東西越多,對用戶就越了解。
Google Now
在2004年,我問拉里·佩奇(Larry Page)和謝爾蓋·布林(Sergey Brin)對于搜索的長期展望。佩奇表示,搜索將融入到人們的大腦中。“當(dāng)你考慮某些東西并且對其了解不是太多,你會自動獲得信息?!辈剂种赋?,關(guān)鍵點是,“你可以讓與你進(jìn)行交流的設(shè)備或者讓關(guān)注周邊事物的計算機,提出有用的信息。
在2010年,兩位在Android部門工作的工程師巴利斯·古爾特金(Baris Gultekin)和安德魯·基爾斯姆(Andrew Kirsme)著手一項與上述展望非常相符的課外項目,從而創(chuàng)辦了Google Now。
根據(jù)古爾特金(去年從Google Now調(diào)任至該公司其他項目),這款產(chǎn)品恪守他們最初的宣傳文件?!昂诵牡穆暶魇牵F(xiàn)在大家的手機并不智能,不過它們可以變得智能,”他說?!叭绻覀兛梢詫⑦@些具有各種功能、強勁和連接互聯(lián)網(wǎng)的設(shè)備的能力與谷歌的能力合并在一起,那會怎么樣?
換言之,Google Now可以回答那些你沒有主動提出來的詞條。這意味著將多個領(lǐng)域的信息合并起來,解決某些重要的事情。古爾特金表示,最開始創(chuàng)造一個系統(tǒng)來這樣做是令人恐懼的,不過他和他的合作伙伴開始分解在計算領(lǐng)域內(nèi)可以如何實現(xiàn)這個目標(biāo)。即使某些類似具有限制性的東西也要求系統(tǒng)具有實質(zhì)性的知識:家和辦公室的地理位置、好路線、交通信息等。如果Google Maps知道如何在路網(wǎng)中導(dǎo)航,肯定會有幫助作用—但這恰恰就是關(guān)鍵的地方。谷歌會使用其全部能力去放大這種搜索工具。很快,他們擁有了一款優(yōu)秀的應(yīng)用程序來幫助通勤者。“不過我們不希望它只是作為一款通勤應(yīng)用,”古爾特金表示?!拔覀兿M蔀橐晃恢鲃拥闹郑梢蕴幚砗芏嗍虑椤!币虼怂麄冊?012年7月推出了Google Now,主要關(guān)注幾個領(lǐng)域:通勤、航班、體育比賽、附近的場所、出游、公共交通運輸以及天氣?,F(xiàn)在,它已經(jīng)覆蓋超過70個領(lǐng)域,并且正迅速增加。古爾特金說:“我的遠(yuǎn)大目標(biāo)是,Google Now向用戶提供大部分所需的信息,而其他東西都只成為備用品。
Google Now的有效性取決于將對世界的了解(所有這些都是谷歌搜索以及“知識圖譜”能夠提供的)與個人信息深度融合。這正是為什么有人可能指出,這個搜索的細(xì)分部門可視為是谷歌的替代品:每一次Google Now及時提供信息卡,都會利用大量谷歌服務(wù)。一張普通的信息卡會將來自個人電子郵件、日程表和通訊錄的信息與公交線路安排、交通信息及天氣進(jìn)行整合。
很多時候,只有在Google Now行動后,人們才會準(zhǔn)確知道它干些什么。例如,當(dāng)你停好車后,Google Now會記錄你停車并記住你停車的位置—以防你忘記了。如果你的電子郵件告訴Google Now你在找房子,該項服務(wù)可能會向你推送你希望居住地區(qū)的待租售房屋的照片。
隨著Google Now進(jìn)化,它從一個課外項目發(fā)展為一項全職服務(wù)。不過其大的助推器可能出現(xiàn)在2011年,當(dāng)時蘋果推出了Siri,這在谷歌總部引起了一些擔(dān)憂情緒,也為這個以語音為方向的項目吸引了更多資源。它成為搜索部門的一個正式組成部分,盡管該團(tuán)隊實際上受命于搜索和Android兩個部門。古爾特金表示:“搜索和Google Now都值得贊美。我們希望在用戶搜索之前就為其提供信息,不過在很多情況里,我們不知道你的水管爆裂了,你需要水管工。
(當(dāng)然, 在未來,通過谷歌旗下智能家居企業(yè)Nest,谷歌將知道你家的水管何時破裂,或者你家是否著火了。古爾特金表示,整合Nest“可能會在將來,但不是現(xiàn)在”。)
與傳統(tǒng)版本的搜索不同的是,Google Now搜索只有在你全部采用谷歌產(chǎn)品的情況下才能起到效果。耶霍舒亞表示:“拉里(佩奇)曾說過,搜索應(yīng)該理解你的意圖并提供你所需的信息。這是一個谷歌生態(tài)系統(tǒng),如果你在手機端和PC上注冊登陸后,我們可以予以利用。如果你想要獲得航班信息并追蹤你的包裹以及任何來自Gmail的信息,我們都會帶給你。如果你沒有使用Gmail,你就不會得到信息—不過你還是可以利用我們的語音服務(wù)并獲得答案。
沒有其他解決辦法—如果你想要使用Google Now但Gmail不是你默認(rèn)的郵箱,你不會得到Google Now甚至谷歌搜索的全部價值?!叭绻覀兛梢詫⑦@些信息分享給所有人,這會是非常美好的事情。我不認(rèn)為這會在明天出現(xiàn)。當(dāng)然,蘋果也會給我們帶來壓力。
谷歌非常刻意地不將Google Now作為一款獨立的產(chǎn)品。相反,該公司將其視為搜索應(yīng)用的一部分。該應(yīng)用并不是以搜索作為名稱,而是冠名“谷歌”。這種命名法不僅顯示搜索非常密切地與谷歌聯(lián)系在以前,還顯示Googe Now對該公司非常重要。
盡管如此,Googe Now部件仍是可選部件。所有人使用的時候都會考慮隱私警告;該產(chǎn)品看起來無所不知,但也從側(cè)面提醒我們這家巨頭對我們是多么了解。隨著谷歌對個人信息的掌控引發(fā)更多麻煩,特別是在歐洲,當(dāng)?shù)卣苿蛹訌姳O(jiān)管并實施罰款,甚至威脅將其分拆,該公司希望服務(wù)大眾的雄心壯志可能會被隱私擔(dān)憂所挫敗。即使對于那些信任谷歌的人士而言,斯諾登事件證明政府可以很輕松地訪問我們的信息。如果Google Now知道你把車停在哪里,當(dāng)?shù)氐那閳蟛块T也是如此,對吧?
辛格哈爾認(rèn)為,搜索的第一個時代是以人們想象在他們與某些遙遠(yuǎn)機器之間進(jìn)行互動為標(biāo)志的?,F(xiàn)在這個新時代清除了這個障礙。我們預(yù)期電話會明白我們的意思。我們預(yù)期搜索也同樣精通于提供涉及我們個人信息的答案,因為它正在發(fā)掘來自網(wǎng)頁、文件和公共數(shù)據(jù)庫的信息。
“我認(rèn)為搜索是所有計算的界面,”辛格哈爾說。“當(dāng)設(shè)備消失或者變小,你將如何與它們互動?因為在大部分時間里,你需要采取行動—可能簡單如播放音樂,或復(fù)雜如寫便簽來提醒自己經(jīng)過附近雜貨店時買牛奶。或者你想知道妻子的航班是否準(zhǔn)點?或者奧巴馬有多高?
人們可能認(rèn)為這是理所當(dāng)然的—他們甚至可能抱怨說谷歌搜索不再像以前那樣了。不過辛格哈爾認(rèn)為,搜索已經(jīng)跨越了一個他在過去幾十年所對付的障礙。辛格哈爾說:“20年來,我作為研究員未能做到這一點”,他指的是他的團(tuán)隊為谷歌搜索實現(xiàn)的成就。他承認(rèn),有很多問題還有待解決。不過在描述詞條后面的科學(xué)時,他充滿了自豪感。當(dāng)有人提出“天空為什么是藍(lán)色”這樣簡單的問題時,谷歌能夠成功地進(jìn)行回應(yīng)。
名稱欄目:谷歌三大法寶:知識圖譜、語音搜索和Google Now
網(wǎng)頁地址:http://m.newbst.com/news17/46117.html
網(wǎng)站建設(shè)、網(wǎng)絡(luò)推廣公司-創(chuàng)新互聯(lián),是專注品牌與效果的網(wǎng)站制作,網(wǎng)絡(luò)營銷seo公司;服務(wù)項目有Google等
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容