2023-11-22 分類: 網站建設
對于一個SEOer,或者一個需要和SEO打交道的網站制作者而言,準確了解網絡搜索引擎能看見什么,看不見什么,將有助于我們更加合理地推進工作。
搜索引擎并非完全不具備圖片內容辨識能力,但它通常是只能判斷出有一張圖片正在顯示,但是通常其無法識別這張圖片的內容是什么。除非這張圖片的提供者用ALT屬性提供了相關信息。搜索引擎對圖片的辨識是通過識別像素顏色來完成的,比如能通過圖片中肉色比例來判斷是否是色情圖片,這種判定方式實在是只能用“很弱”來評價。正因為很弱,所以這種判別是極不準確的——想必各位還記得當初“綠壩”將加菲貓的圖片誤判為色情圖的笑話。目前,搜索引擎通過光學字符識別技術已經能簡單判斷圖片中包含的文字信息,但一般只限于比較工整的字體。
較早期的SEO觀念認為,搜索引擎無法識別FLASH文件。在目前,這個認識已經嚴重過時了。無論是Google還是baidu,它們都可以從FLASH中抽取有用信息來提交搜索結果。但是如果要徹底判定這是個展示什么的FLASH文件,對于目前的搜索引擎來說還有難度,因為搜索引擎更側重于文字信息的抓取。而FLASH的制作者通常喜歡以圖片和音頻內容來完成自己的制作,可能出現的少量文字內容通常無法準確詮釋該文件的實際內容。
音頻和視頻文件也是搜索引擎通常會略過的內容,除非是使用了AD3標簽的Mp3文件或者使用了AAC格式內嵌文字性說明的增強型播客。但別指望目前的技術能做到讓搜索引擎辨別這里音頻和視頻里到底在說些什么玩意兒。
同樣的,搜索引擎無法解析文件的源代碼,也無獲取任何編寫者不希望它獲取的網頁信息。盡管蜘蛛整天在各類網頁源代碼上攀爬著,但只要標記nofollow,那么相關代碼內容就會被蜘蛛所忽略。
對于網站制作者來說,有一個問題是特別需要注意的——蜘蛛對于AJAX表示束手無策。由于AJAX的動態顯示方式,其直接從數據庫獲取信息而不需要刷新頁面,故蜘蛛無法解析那些只會直接顯示在用戶電腦上的內容。不少JavaScript腳本也存在著相似的問題,即在用戶僅僅輸入而不執行任務之前,HTML中不生成相關內容。
當前名稱:搜索引擎對哪些內容是辨識不了的
分享地址:http://m.newbst.com/news28/296028.html
成都網站建設公司_創新互聯,為您提供品牌網站設計、網頁設計公司、軟件開發、企業建站、定制開發、網站內鏈
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯
猜你還喜歡下面的內容