搜索領域群雄並起 新秀誓言超越Google [熱點追擊]
搜索領域群雄並起 新秀誓言超越Google | 出處:計算機世界網責任編輯:moon |
[04-3-31 10:26] | 作者:劉彥青 編譯 |
一家公司有使搜索引擎能夠更完整地對互聯網進行「編目」的主意,另一家公司則相信它能夠更好地預測搜索用戶的需求,還有一家公司正在試圖將搜索與用戶的思維同步。 這些新秀與包括Google在內老牌搜索廠商都在探索對信息進行分類的新方法,這可能引發搜索的新一輪革命。澳大利亞的搜索新秀Mooter公司的CEO卡普表示,由於信息正在爆炸性地增長,如果我們不能理順這些信息,互聯網的使用將非常困難。 當前的技術給辛西婭這樣的私人投資者帶來了困難。當懷疑某家澳大利亞公司最近是否有欺詐行為時,她會首先求助於Google,然後會轉到澳大利亞證券和投資委員會等機構的網站。但專家表示,認為Google的資料非常詳盡的用戶是在自欺欺人。目前的搜索引擎只能發現互聯網上不到1%的信息,主要原因與它們搜索和對互聯網上資源索引的方式有關。辛西婭說,這是令人沮喪的,就象我們來到圖書館查閱資料,卻只從書架上拿了一本書一樣。 搜索領域的分析師沙利文認為解決這些問題是大有希望的,他認為未來的搜索引擎將在各方面達到最好。但他同時警告說,互聯網上有許多沒有獲得投資或用戶青睞的搜索創新。 目前,所有的搜索引擎都不能夠捕獲「無形Web」的大量資源━━被鎖在資料庫中和搜索引擎的爬蟲找不到的內容,其中包括美國證監會的監管文件和大多數報紙的完整文檔。有時,訪問「隱形」資料庫需要付費,即使資料庫是免費的,網站也可能要求註冊,這就將爬蟲擋在了外面。特別是,動態網頁給爬蟲也造成了障礙。 為了解決這些問題,Dipsie公司正在開發能夠填寫Cars.com網站簡單表格的稿子,並預計將在今年夏季發布測試版本。其它公司也在開發能夠捕獲音頻和視頻文件的軟體,這一直困擾著基於文本的爬蟲。StreamSage公司使用語音識別技術轉錄提供的資料,使搜索引擎能夠從較長的表達中找出相關聯的部分。該公司的總裁默里表示,哈哈佛大學醫學院和NASA已經使用了這項技術,但設計人員必須提高這一技術的速度,使它能夠被廣泛使用。雅虎公司則採取了一條非技術的、倍受爭議的策略:企業通過付費保證其「隱形網頁」被索引。 但索引更多的內容也帶來了另一個問題━━在數以十億計的網頁中找到與搜索關健字最相關的網頁,因此一些搜索引擎開發商將目光放在了個性化和組織化的搜索方面。今年1月份剛成立的Eurekster公司將搜索與社會網路結合了起來,它根據用戶的社會網路中其它成員的搜索情況來猜測用戶想找到哪方面的內容。因此,如果低眉的社會網路成員與娛樂界相關,對「casting」搜索的結果可能是電影網路,而如果社會網路成員喜歡周末郊遊,則搜索結果可能是與釣魚相關的網站。 各大搜索引擎還在努力對搜索進行本地化處理。由於已經擁有大量用戶的收費和註冊信息,在這方面雅虎、AOL比Google有優勢。而SuperPages.com等網站還對數據添加標誌,使客戶能夠不僅僅按城市還能夠按逛商店的時間和信用卡號碼進行搜索。在Google搜索中添加「星期六」會使用戶得到周六不營業的商店名稱。 標記還有助於Factiva對其9000個新聞源的文檔進行個性化處理,使工程師獲得偏重技術內容的搜索結果,而營銷部門則能夠獲得更與它們相關的內容。該公司的CEO克萊爾說,人們不願意在查找資料上花費時間,他們願意花時間對資料進行分析。 在微軟公司,研究人員正在探索返回特定事實而非整個文檔的技術。例如「瑪莉蓮·夢露生日」的查詢將返回「1926年7月1日」這樣的結果,而不會返回許多與此相關的網站。微軟公司AskMSR項目的資深研究人員埃立克說,借用圖書館借書的過程比喻,搜索引擎目前的理念仍然是,「讓我給您找一些對您有用的書」,而不是「我來為您查找您所需要的資料」。 通過識別基本主題和組合網站,Mooter公司希望能夠模仿人類大腦對信息的組織方法,它還試圖根據用戶訪問的鏈接對搜索結果進行「精益求精」。開發這樣的技術的成本是很高的,一些專家認為最好的工具可能是由Factiva和ChoicePoint等付費服務開發的。 在搜索技術創新方面我們不能忽略了Google。它在加利福尼亞、印度等地的數百名研究人員正在努力改進用戶的搜索體驗。該公司的技術主管克萊格說,由於在未來10年內搜索將發生翻天覆地的變化,作為業界領頭羊,Google必須不斷地創新。 |
推薦閱讀:
※圍棋可以超越以怨報德 甚至政治、歷史、黑白的「中和」
※湘古石像超越史前文明
※太陽的後裔能超越來自星星的你嗎?
※四、超越意識形態:超越宗教心智修鍊方式