搜索引擎知識

搜索引擎知識
發布時間:2009-04-17來源:
【概念】

搜索引擎(search engine)是指根據一定的策略、運用特定的計算機程序搜集互聯網上的信息,在對信息進行組織和處理後,為用戶提供檢索服務的系統。

從使用者的角度看,搜索引擎提供一個包含搜索框的頁面,在搜索框輸入詞語,通過瀏覽器提交給搜索引擎後,搜索引擎就會返回跟用戶輸入的內容相關的信息列表。

互聯網發展早期,以雅虎為代表的網站分類目錄查詢非常流行。網站分類目錄由人工整理維護,精選互聯網上的優秀網站,並簡要描述,分類放置到不同目錄下。用戶查詢時,通過一層層的點擊來查找自己想找的網站。也有人把這種基於目錄的檢索服務網站稱為搜索引擎,但從嚴格意義上講,它並不是搜索引擎。

【分類】

1、全文索引

全文搜索引擎是名副其實的搜索引擎,國外代表有Google,國內則有著名的百度搜索。它們從互聯網提取各個網站的信息(以網頁文字為主),建立起資料庫,並能檢索與用戶查詢條件相匹配的記錄,按一定的排列順序返回結果。

根據搜索結果來源的不同,全文搜索引擎可分為兩類,一類擁有自己的檢索程序(Indexer),俗稱「蜘蛛」(Spider)程序或「機器人」(Robot)程序,能自建網頁資料庫,搜索結果直接從自身的資料庫中調用,上面提到的Google和百度就屬於此類;另一類則是租用其他搜索引擎的資料庫,並按自定的格式排列搜索結果,如Lycos搜索引擎。

2、目錄索引

目錄索引雖然有搜索功能,但嚴格意義上不能稱為真正的搜索引擎,只是按目錄分類的網站鏈接列表而已。用戶完全可以按照分類目錄找到所需要的信息,不依靠關鍵詞(Keywords)進行查詢。目錄索引中最具代表性的莫過於大名鼎鼎的Yahoo、新浪分類目錄搜索。

3、元搜索引擎

元搜索引擎(META Search Engine)接受用戶查詢請求後,同時在多個搜索引擎上搜索,並將結果返回給用戶。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。在搜索結果排列方面,有的直接按來源排列搜索結果,如Dogpile;有的則按自定的規則將結果重新排列組合,如Vivisimo。

其他非主流搜索引擎形式:

1、集合式搜索引擎:該搜索引擎類似元搜索引擎,區別在於它並非同時調用多個搜索引擎進行搜索,而是由用戶從提供的若干搜索引擎中選擇,如HotBot在2002年底推出的搜索引擎。

2、門戶搜索引擎:AOL Search、MSN Search等雖然提供搜索服務,但自身既沒有分類目錄也沒有網頁資料庫,其搜索結果完全來自其他搜索引擎。

3、免費鏈接列表(Free For All Links簡稱FFA):一般只簡單地滾動鏈接條目,少部分有簡單的分類目錄,不過規模要比Yahoo!等目錄索引小很多。

【工作原理】

1、抓取網頁

每個獨立的搜索引擎都有自己的網頁抓取程序(spider)。Spider順著網頁中的超鏈接,連續地抓取網頁。被抓取的網頁被稱之為網頁快照。由於互聯網中超鏈接的應用很普遍,理論上,從一定範圍的網頁出發,就能搜集到絕大多數的網頁。

2、處理網頁

搜索引擎抓到網頁後,還要做大量的預處理工作,才能提供檢索服務。其中,最重要的就是提取關鍵詞,建立索引文件。其他還包括去除重複網頁、分析超鏈接、計算網頁的重要度。

3、提供檢索服務

用戶輸入關鍵詞進行檢索,搜索引擎從索引資料庫中找到匹配該關鍵詞的網頁;為了用戶便於判斷,除了網頁標題和URL外,還會提供一段來自網頁的摘要以及其他信息。

全文搜索引擎

在搜索引擎分類部分我們提到過全文搜索引擎從網站提取信息建立網頁資料庫的概念。搜索引擎的自動信息搜集功能分兩種。一種是定期搜索,即每隔一段時間(比如Google一般是28天),搜索引擎主動派出「蜘蛛」程序,對一定IP地址範圍內的互聯網站進行檢索,一旦發現新的網站,它會自動提取網站的信息和網址加入自己的資料庫。

另一種是提交網站搜索,即網站擁有者主動向搜索引擎提交網址,它在一定時間內(2天到數月不等)定向向你的網站派出「蜘蛛」程序,掃描你的網站並將有關信息存入資料庫,以備用戶查詢。由於近年來搜索引擎索引規則發生了很大變化,主動提交網址並不保證你的網站能進入搜索引擎資料庫,因此目前最好的辦法是多獲得一些外部鏈接,讓搜索引擎有更多機會找到你並自動將你的網站收錄。

當用戶以關鍵詞查找信息時,搜索引擎會在資料庫中進行搜尋,如果找到與用戶要求內容相符的網站,便採用特殊的演算法——通常根據網頁中關鍵詞的匹配程度,出現的位置/頻次,鏈接質量等——計算出各網頁的相關度及排名等級,然後根據關聯度高低,按順序將這些網頁鏈接返回給用戶。

目錄索引

與全文搜索引擎相比,目錄索引有許多不同之處。

首先,搜索引擎屬於自動網站檢索,而目錄索引則完全依賴手工操作。用戶提交網站後,目錄編輯人員會親自瀏覽你的網站,然後根據一套自定的評判標準甚至編輯人員的主觀印象,決定是否接納你的網站。

其次,搜索引擎收錄網站時,只要網站本身沒有違反有關的規則,一般都能登錄成功。而目錄索引對網站的要求則高得多,有時即使登錄多次也不一定成功。尤其象Yahoo!這樣的超級索引,登錄更是困難。

此外,在登錄搜索引擎時,我們一般不用考慮網站的分類問題,而登錄目錄索引時則必須將網站放在一個最合適的目錄(Directory)。

最後,搜索引擎中各網站的有關信息都是從用戶網頁中自動提取的,所以用戶的角度看,我們擁有更多的自主權;而目錄索引則要求必須手工另外填寫網站信息,而且還有各種各樣的限制。更有甚者,如果工作人員認為你提交網站的目錄、網站信息不合適,他可以隨時對其進行調整,當然事先是不會和你商量的。

目錄索引,顧名思義就是將網站分門別類地存放在相應的目錄中,因此用戶在查詢信息時,可選擇關鍵詞搜索,也可按分類目錄逐層查找。如以關鍵詞搜索,返回的結果跟搜索引擎一樣,也是根據信息關聯程度排列網站,只不過其中人為因素要多一些。如果按分層目錄查找,某一目錄中網站的排名則是由標題字母的先後順序決定(也有例外)。

目前,搜索引擎與目錄索引有相互融合滲透的趨勢。原來一些純粹的全文搜索引擎現在也提供目錄搜索,如Google就借用Open Directory目錄提供分類查詢。而象 Yahoo! 這些老牌目錄索引則通過與Google等搜索引擎合作擴大搜索範圍(注)。在默認搜索模式下,一些目錄類搜索引擎首先返回的是自己目錄中匹配的網站,如國內搜狐、新浪、網易等;而另外一些則默認的是網頁搜索,如Yahoo。

【搜索引擎的發展史】

1990年,加拿大麥吉爾大學(University of McGill)計算機學院的師生開發出Archie。當時,萬維網(World Wide Web)還沒有出現,人們通過FTP來共享交流資源。Archie能定期搜集並分析FTP伺服器上的文件名信息,提供查找分別在各個FTP主機中的文件。用戶必須輸入精確的文件名進行搜索,Archie告訴用戶哪個FTP伺服器能下載該文件。雖然Archie搜集的信息資源不是網頁(HTML文件),但和搜索引擎的基本工作方式是一樣的:自動搜集信息資源、建立索引、提供檢索服務。所以,Archie被公認為現代搜索引擎的鼻祖。

搜索引擎的起源:

所有搜索引擎的祖先,是1990年由Montreal的McGill University三名學生(Alan Emtage、Peter Deutsch、Bill Wheelan)發明的Archie(Archie FAQ)。Alan Emtage等想到了開發一個可以用文件名查找文件的系統,於是便有了Archie。Archie是第一個自動索引互聯網上匿名FTP網站文件的程序,但它還不是真正的搜索引擎。Archie是一個可搜索的FTP文件名列表,用戶必須輸入精確的文件名搜索,然後Archie會告訴用戶哪一個FTP地址可以下載該文件。 由於Archie深受歡迎,受其啟發,Nevada System Computing Services大學於1993年開發了一個Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。Jughead是後來另一個Gopher搜索工具。

發 展(1):

世界上第一個Spider程序,是MIT Matthew Gray的World wide Web Wanderer,用於追蹤互聯網發展規模。剛開始它只用來統計互聯網上的伺服器數量,後來則發展為也能夠捕獲網址(URL) 。

搜索引擎一般由以下三部分組成:

爬行器(機器人、蜘蛛)

索引生成器

查詢檢索器

發 展(2):

Excite 的歷史可以上溯到1993年2月,6個Stanford University(斯坦福大學)大學生的想法是分析字詞關係,以對互聯網上的大量信息作更有效的檢索。到1993年中,這已是一個完全投資項目,他們還發布了一個供webmasters在自己網站上使用的搜索軟體版本,後來被叫做Excite for Web Servers。

註:Excite後來曾以概念搜索聞名,2002年5月,被Infospace收購的Excite停止自己的搜索引擎,改用元搜索引擎 Dogpile

發 展(3):

1994年4月,斯坦福大學的兩名博士生,美籍華人楊致遠和David Filo共同創辦了Yahoo!。隨著訪問量和收錄鏈接數的增長,Yahoo目錄開始支持簡單的資料庫搜索。因為Yahoo!的數據是手工輸入的,所以不能真正被歸為搜索引擎,事實上只是一個可搜索的目錄。Yahoo!中收錄的網站,因為都附有簡介信息,所以搜索效率明顯提高。

註:Yahoo以後陸續有 Altavista、Inktomi、Google提供搜索引擎服務

Yahoo!--幾乎成為20世紀90年代的網際網路的代名詞。

發 展(4):

1995年,一種新的搜索引擎形式出現了——元搜索引擎(Meta Search Engine)。用戶只需提交一次搜索請求,由元搜索引擎負責轉換處理後提交給多個預先選定的獨立搜索引擎,並將從各獨立搜索引擎返回的所有查詢結果,集中起來處理後再返回給用戶。

第一個元搜索引擎,是Washington大學碩士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler。元搜索引擎概念上好聽,但搜索效果始終不理想,所以沒有哪個元搜索引擎有過強勢地位。

發 展(5):

智能檢索的產生:它利用分詞詞典、同義詞典,同音詞典改善檢索效果,進一步還可在知識層面或者說概念層面上輔助查詢,通過主題詞典、上下位詞典、相關同級詞典檢索處理形成一個知識體系或概念網路,給予用戶智能知識提示,最終幫助用戶獲得最佳的檢索效果。

例:

(1)查詢「計算機」,與「電腦」相關的信息也能檢索出來;

(2)可以進一步縮小查詢範圍至「微機」、「伺服器」或擴大查詢至「信息技術」或查詢相關的「電子技術」、「軟體」、「計算機應用」等範疇;

(3)還包括歧義信息和檢索處理,如「蘋果」,究竟是指水果還是電腦品牌,「華人」與「中華人民共和國」的區分,將通過歧義知識描述庫、全文索引、用戶檢索上下文分析以及用戶相關性反饋等技術結合處理,高效、準確地反饋給用戶最需要的信息。

發 展(6):

個性化趨勢是搜索引擎的一個未來發展的重要特徵和必然趨勢之一。一種方式通過搜索引擎的社區化產品(即對註冊用戶提供服務)的方式來組織個人信息,然後在搜索引擎基礎信息庫的檢索中引入個人因素進行分析,獲得針對個人不同的搜索結果。自2004年10月yahoo推出myweb測試版,到11月a9推出個性化功能,到2005年Googlesearchhistory基本上都沿著一條路子走,分析特定用戶的搜索需求限定的範圍,然後按照用戶需求範圍擴展到互聯網上其他的同類網站給出最相關的結果。另外一種是針對大眾化的,Google個性化搜索引擎,或者yahooMindSet,或者我們都知道的前台聚類的vivisimo。但是無論其中的哪一種實現方式,即Google的主動選擇搜索範圍,還是yahoo(http://my.yahoo.com),vivisimo的在結果中重新組織自己需要的信息,都是一種實驗或者創想,短期內無法成為主流的搜索引擎應用產品。

發 展(7):

網格技術(great global grid):由於沒有統一的信息組織標準對網路信息資源進行加工處理,難以對無序的網路信息資源進行檢索、交接和共享乃至深層次的開發利用,形成信息孤島。網格技術就是要消除信息孤島實現互聯網上所有資源的全面連通。

美國全球信息網格(Global Information Grid)

Robot(機器人)一詞對編程者有特殊的意義。Computer Robot是指某個能以人類無法達到的速度不斷重複執行某項任務的自動程序。由於專門用於檢索信息的Robot程序像蜘蛛(spider)一樣在網路間爬來爬去,因此,搜索引擎的Robot程序被稱為spider程序。

1993年Matthew Gray開發了 World Wide Web Wanderer,這是第一個利用HTML網頁之間的鏈接關係來檢測萬維網規模的「機器人(Robot)」程序。開始,它僅僅用來統計互聯網上的伺服器數量,後來也能夠捕獲網址(URL)。

1994年4月,斯坦福大學(Stanford University)的兩名博士生,美籍華人Jerry Yang(楊致遠)和David Filo共同創辦了Yahoo。隨著訪問量和收錄鏈接數的增長,Yahoo目錄開始支持簡單的資料庫搜索。因為Yahoo!的數據是手工輸入的,所以不能真正被歸為搜索引擎,事實上只是一個可搜索的目錄。雅虎於2002年12月23日收購inktomi,2003年7月14日收購包括Fast和Altavista在內的Overture,2003年11月,Yahoo全資收購3721公司。

1994年初,華盛頓大學(University of Washington )的學生Brian Pinkerton開始了他的小項目WebCrawler。1994年4月20日,WebCrawler正式亮相時僅包含來自6000個伺服器的內容。WebCrawler是互聯網上第一個支持搜索文件全部文字的全文搜索引擎,在它之前,用戶只能通過URL和摘要搜索,摘要一般來自人工評論或程序自動取正文的前100個字。

1994年7月,卡內基·梅隆大學(Carnegie Mellon University) 的Michael Mauldin將John Leavitt的spider程序接入到其索引程序中,創建了Lycos。除了相關性排序外,Lycos還提供了前綴匹配和字元相近限制,Lycos第一個在搜索結果中使用了網頁自動摘要,而最大的優勢還是它遠勝過其它搜索引擎的數據量。

1994年底,Infoseek正式亮相。其友善的界面,大量的附加功能,使之和Lycos一樣成為搜索引擎的重要代表。

1995年,一種新的搜索引擎形式出現了——元搜索引擎(A Meta Search Engine Roundup)。用戶只需提交一次搜索請求,由元搜索引擎負責轉換處理,提交給多個預先選定的獨立搜索引擎,並將從各獨立搜索引擎返回的所有查詢結果,集中起來處理後再返回給用戶。第一個元搜索引擎,是Washington大學碩士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler。

1995年12月,DEC的正式發布AltaVista。AltaVista是第一個支持自然語言搜索的搜索引擎,第一個實現高級搜索語法的搜索引擎(如AND、 OR、 NOT等)。用戶可以用AltaVista搜索新聞組(Newsgroups)的內容並從互聯網上獲得文章,還可以搜索圖片名稱中的文字、搜索Titles、搜索Java applets、搜索ActiveX objects。AltaVista也聲稱是第一個支持用戶自己向網頁索引庫提交或刪除URL的搜索引擎,並能在24小時內上線。AltaVista最有趣的新功能之一,是搜索有鏈接指向某個URL的所有網站。在面向用戶的界面上,AltaVista也作了大量革新。它在搜索框區域下放了「tips」以幫助用戶更好的表達搜索式,這些小tip經常更新,這樣,在搜索過幾次以後,用戶會看到很多他們可能從來不知道的的有趣功能。這系列功能,逐漸被其它搜索引擎廣泛採用。1997年,AltaVista發布了一個圖形演示系統LiveTopics,幫助用戶從成千上萬的搜索結果中找到想要的。

1995年9月26日,加州伯克利分校助教Eric Brewer、博士生Paul Gauthier創立了Inktomi,1996年5月20日,Inktomi公司成立,強大的HotBot出現在世人面前。聲稱每天能抓取索引1千萬頁以上,所以有遠超過其它搜索引擎的新內容。HotBot也大量運用cookie儲存用戶的個人搜索喜好設置。

1997年8月,Northernlight搜索引擎正式現身。它曾是擁有最大資料庫的搜索引擎之一,它沒有Stop Words,它有出色的Current News、7100多出版物組成的Special Collection、良好的高級搜索語法,第一個支持對搜索結果進行簡單的自動分類。

1998年10月之前,Google只是斯坦福大學(Stanford University)的一個小項目BackRub。1995年博士生Larry Page開始學習搜索引擎設計,於1997年9月15日註冊了google.com的域名,1997年底,在Sergey Brin和Scott Hassan、Alan Steremberg的共同參與下,BachRub開始提供Demo。1999年2月,Google完成了從Alpha版到Beta版的蛻變。Google公司則把1998年9月27日認作自己的生日。Google以網頁級別(Pagerank)為基礎,判斷網頁的重要性,使得搜索結果的相關性大大增強。Google公司的奇客(Geek)文化氛圍、不作惡(Don』t be evil)的理念,為Google贏得了極高的口碑和品牌美譽。2006年4月,Google宣布其中文名稱「谷歌」,這是Google第一個在非英語國家起的名字。

Fast(Alltheweb)公司創立於1997年,是挪威科技大學(NTNU)學術研究的副產品。1999年5月,發布了自己的搜索引擎AllTheWeb。Fast創立的目標是做世界上最大和最快的搜索引擎,幾年來庶幾近之。Fast(Alltheweb)的網頁搜索可利用ODP自動分類,支持Flash和pdf搜索,支持多語言搜索,還提供新聞搜索、圖像搜索、視頻、MP3、和FTP搜索,擁有極其強大的高級搜索功能。(2003年2月25日,Fast的互聯網搜索部門被Overture收購)。

1996年8月,sohu公司成立,製作中文網站分類目錄,曾有「出門找地圖,上網找搜狐」的美譽。隨著互聯網網站的急劇增加,這種人工編輯的分類目錄已經不適應。sohu於2004年8月獨立域名的搜索網站「搜狗」,自稱「第三代搜索引擎」。

Openfind 創立於1998年1月,其技術源自台灣中正大學吳升教授所領導的GAIS實驗室。Openfind起先只做中文搜索引擎,鼎盛時期同時為三大著名門戶新浪、奇摩、雅虎提供中文搜索引擎,但2000年後市場逐漸被Baidu和Google瓜分。2002年6月,Openfind重新發布基於GAIS30 Project的Openfind搜索引擎Beta版,推出多元排序(PolyRankTM),宣布累計抓取網頁35億,開始進入英文搜索領域。

2000年1月,兩位北大校友,超鏈分析專利發明人、前Infoseek資深工程師李彥宏與好友徐勇(加州伯克利分校博士後)在北京中關村創立了百度(Baidu)公司。2001年8月發布Baidu.com搜索引擎Beta版(此前Baidu只為其它門戶網站搜狐新浪Tom等提供搜索引擎),2001年10月22日正式發布Baidu搜索引擎,專註於中文搜索。Baidu搜索引擎的其它特色包括:百度快照、網頁預覽/預覽全部網頁、相關搜索詞、錯別字糾正提示、mp3搜索、Flash搜索。2002年3月閃電計劃(Blitzen Project)開始後,技術升級明顯加快。後推出貼吧、知道、地圖、國學、百科、文檔、視頻、博客等一系列產品,深受網民歡迎。2005年8月5日在納斯達克上市,發行價為USD 27.00,代號為BIDU。開盤價USD 66.00,以USD 122.54收盤,漲幅353.85%,創下了5年以來美國股市上市新股當日漲幅最高紀錄。

2003年12月23日,原慧聰搜索正式獨立運做,成立了中國搜索。2004年2月,中國搜索發布桌面搜索引擎網路豬1.0,2006年3月中搜將網路豬更名為IG(Internet Gateway) 。

2005年6月,新浪正式推出自主研發的搜索引擎「愛問」。2007年起,新浪愛問使用google搜索引擎。

2007年7月1日 全面採用網易自主研發的有道搜索技術,並且合併了原來的綜合搜索和網頁搜索。有道網頁搜索、圖片搜索和博客搜索為網易搜索提供服務。其中網頁搜索使用了其自主研發的自然語言處理、分散式存儲及計算技術;圖片搜索首創根據拍攝相機品牌、型號,甚至季節等高級搜索功能;博客搜索相比同類產品具有抓取全面、更新及時的優勢,提供「文章預覽」,「博客檔案」等創新功能。

【搜索引擎作用】

搜索引擎是網站建設中針對「用戶使用網站的便利性」所提供的必要功能,同時也是「研究網站用戶行為的

一個有效工具」。高效的站內檢索可以讓用戶快速準確地找到目標信息,從而更有效地促進產品/服務的銷售,而且通過對網站訪問者搜索行為的深度分析,對於進一步制定更為有效的網路營銷策略具有重要價值。

1、從網路營銷的環境看,搜索引擎營銷的環境發展為網路營銷的推動起到舉足輕重的作用

2、從效果營銷看,很多公司之所以可以應用網路營銷是利用了搜索引擎營銷

3、就完整型電子商務概念組成部分來看,網路營銷是其中最重要的組成部分,是向終端客戶傳遞信息的重要環節

【商務模式】

在搜索引擎發展早期,多是作為技術提供商為其他網站提供搜索服務,網站付錢給搜索引擎。後來,隨著2001年互聯網泡沫的破滅,大多轉向為競價排名方式。

現在搜索引擎的主流商務模式(百度的競價排名、Google的AdWords)都是在搜索結果頁面放置廣告,通過用戶的點擊向廣告主收費。這種模式最早是比爾·格羅斯(Bill Gross)提出的。他於1998年6月創立GoTo公司(後於2001年9月更名為Overture),實施這種模式,取得了很大的成功,並且申請了專利。這種模式有兩個特點,一是點擊付費(Pay Per Click),用戶不點擊則廣告主不用付費。二是競價排序,根據廣告主的付費多少排列結果。 2001年10月,Google推出AdWords,也採用點擊付費和競價的方式。2002年,Overture起訴Google侵犯了其專利。2004年8月,和Yahoo!(Yahoo!於2003年7月收購Overture)達成和解,向後者支付了270萬普通股(合3億美元不到)作為和解費。

AdSense是Google於2003年推出的一種新的廣告方式。AdSense使各種規模的的第三方網頁發布者進入Google龐大的廣告商網路。Google在這些第三方網頁放置跟網頁內容相關的廣告,當瀏覽者點擊這些廣告時,網頁發布者能獲得收入。AdSense在blogger中很受歡迎。同時,Google武斷地刪除一些帳號,引起部分人的不滿。類似的廣告方式,其他搜索引擎也先後推出。雅虎的廣告方式是YPN(Yahoo Publisher Network),YPN 除了可以在網頁上顯示與內容相關的廣告以外,還可以通過在 RSS 訂閱中來顯示廣告。微軟的廣告計劃叫AdCenter。百度也推出主題推廣。

【組成】

搜索引擎一般由搜索器、索引器、檢索器和用戶介面四個部分組成:

①搜索器:其功能是在互聯網中漫遊,發現和搜集信息;

②索引器:其功能是理解搜索器所搜索到的信息,從中抽取出索引項,用於表示文檔以及生成文檔庫的索引表;

③檢索器:其功能是根據用戶的查詢在索引庫中快速檢索文檔,進行相關度評價,對將要輸出的結果排序,並能按用戶的查詢需求合理反饋信息;

④用戶介面:其作用是接納用戶查詢、顯示查詢結果、提供個性化查詢項。

【國內著名搜索引擎網址】

1、百度 http://www.baidu.com/

2、雅虎 http://search.cn.yahoo.com/

3、Google http://www.google.cn/

4、搜客 http://www.soukee.com/

5、網易有道 http://www.youdao.com/

6、北京大學天網中英文搜索引擎 http://e.pku.edu.cn/

7、搜狐搜索引擎 http://www.sogou.com

8、新浪網 http://www.iask.com/

9、TOM搜索引擎 http://i.tom.com/

10、21CN.COM http://search.21cn.com/

11、飛客BT搜索引擎 http://bt.fkee.com/

12、Souyo http://www.souyo.com/

13、雅虎易搜 http://www.yisou.com/

14、麥布搜索引擎 http://www.mybu.net/

15、中華搜索 http://sou.china.com/

16、酷億 http://www.ku68.com

17、搜搜 http://www.soso.com/

18、易搜查http://yisoucha.com

19、北京搜索 http://www.beijingso.com/

20.比比貓 http://www.bbmao.com/

21.搜一下 http://www.tlans.cn

【國外著名英文搜索引擎大全及分類】

1、Google http://www.google.com

2、Yahoo http://www.yahoo.com

3、Live http://www.live.com

4、SearchMash http://www.searchmash.com/

5、ASK http://www.ask.com

6、Search http://www.search.com

7、Ask Jeeves http://www.askjeeves.com

8、AllTheWeb.com http://www.alltheweb.com

9、AOL Search http://aolsearch.aol.com (internal) http://search.aol.com/ (external)

10、HotBot http://www.hotbot.com

11、MSN Search http://search.msn.com

12、Teoma http://www.teoma.com

13、AltaVista http://www.altavista.com

14、Gigablast http://www.gigablast.com

15、LookSmart http://www.looksmart.com

16、Lycos http://www.lycos.com

17、Open Directory http://dmoz.org/

18、Netscape Search http://search.netscape.com

主要新聞搜索引擎

1、Google News http://news.google.com/

2、Yahoo News http://news.yahoo.com/

3、AllTheWeb News http://www.alltheweb.com/?cat=news

4、AltaVista News http://news.altavista.com/

5、Daypop http://www.daypop.com/

其它新聞搜索引擎

1、Ananova

http://www.ananova.com/

2、Columbia Newsblaster

http://www1.cs.columbia.edu/nlp/newsblaster/

3、Net2one

http://www.net2one.com/

4、Newsknife.com

http://www.newsknife.com

5、NewsNow

http://www.newsnow.co.uk/

6、NewsTrawler

http://www.newstrawler.com/

7、NewsTrove.com

http://www.newstrove.com/

8、Rocketinfo

http://www.rocketnews.com

9、World News Network

http://www.wn.com/

10、DailyEarth.com

http://dailyearth.com/

11、HeadlineSpot

http://www.headlinespot.com/

12、Kiosken

http://www.esperanto.se/kiosk/engindex.html

Blog 搜索引擎

1、Blogdex

http://blogdex.media.mit.edu/

2、Blogdigger

http://www.blogdigger.com/

3、Blogging Headline News

http://blogging-news.info

4、BlogStreet

http://www.blogstreet.com/

5、CRAYON (CReAte Your Own Newspaper)

http://www.crayon.net/

6、Fagan Finder: Weblogs, Journals, & RSS

http://www.faganfinder.com/blogs/

7、Feedster

Home

8、NewsIsFree

http://www.newsisfree.com

9、Syndic8.com

http://www.syndic8.com/

10、Technorati

http://www.technorati.com/

雜誌、期刊搜索引擎

1、eLibrary

http://ask.elibrary.com/

2、FindArticles.com

http://www.findarticles.com/

3、MagPortal

http://www.magportal.com/

主要購物搜索引擎

1、BizRate

http://www.bizrate.com

2、DealTime

http://www.dealtime.com

3、Froogle

http://www.froogle.com

4、Kelkoo

http://www.kelkoo.co.uk/

5、MSN Shopping

http://shopping.msn.com/

6、mySimon

http://www.mysimon.com/

7、NexTag

http://www.nextag.com/

8、PriceGrabber.com

http://www.pricegrabber.com/

9、Yahoo Shopping

http://shopping.yahoo.com/

其它購物搜索引擎

1、Buyer』s Index

http://www.buyersindex.com/

2、Dulance

http://www.dulance.com/

3、ePublicEye.com

http://www.epubliceye.com

4、PriceScan

http://www.pricescan.com/

專業搜索引擎

1、AddAll

http://www.addall.com/

2、CatalogCity.com

http://www.catalogcity.com/

3、Google Catalogs

http://catalogs.google.com/

4、Images/Audio/Video

5、AllTheWeb

http://www.alltheweb.com/

6、AltaVista

http://www.altavista.com/

7、Ditto(images only)

http://www.ditto.com/

8、Google Images (images only)

http://images.google.com

9、Kazaa Media Desktop (MP3 only)

http://www.kazaa.com/

10、Lycos Pictures and Sounds

http://multimedia.lycos.com/

11、MIDI Explorer (MIDI sound files only)

http://www.musicrobot.com/

12、The Music Finder (artists & songs, not files)

http://www.music-finder.net/

13、Picsearch (images only)

http://www.picsearch.com/

14、Singingfish (audio/video only)

http://www.singingfish.com/

Radio & TV Programs

15、SpeechBot

http://speechbot.research.compaq.com/

16、PublicRadioFan.Com

http://www.publicradiofan.com/

17、Radio-Locator

http://www.radio-locator.com/

18、TheFeedRoom

http://www.feedroom.com/

兒童搜索引擎

Ask Jeeves For Kids

http://www.ajkids.com/

Ask Jeeves For Kids

http://www.ajkids.com/

KidsClick!

http://www.kidsclick.org/

Yahooligans

http://www.yahooligans.com/

其它兒童搜索引擎及目錄

1、Awesome Library

http://www.awesomelibrary.org/

2、Diddabdoo

http://www.dibdabdoo.com/

3、Education World

http://www.education-world.com/

4、Fact Monster

http://www.factmonster.com/

5、Family Source

http://www.family-source.com/

6、Kids Search Tools

http://www.rcls.org/ksearch.htm

7、SearchEdu.com

http://www.searchedu.com/

8、Teach-nology.com

http://www.teach-nology.com/

9、TekMom』s Search Tools for Students

http://www.tekmom.com/search/

主要搜索工具欄

Ask Jeeves For Kids

http://www.ajkids.com/

Ask Jeeves For Kids

http://www.ajkids.com/

KidsClick!

http://www.kidsclick.org/

Yahooligans

http://www.yahooligans.com/

其它兒童搜索引擎及目錄

Awesome Library

http://www.awesomelibrary.org/

Diddabdoo

http://www.dibdabdoo.com/

Education World

http://www.education-world.com/

Fact Monster

http://www.factmonster.com/

Family Source

http://www.family-source.com/

Kids Search Tools

http://www.rcls.org/ksearch.htm

SearchEdu.com

http://www.searchedu.com/

Teach-nology.com

http://www.teach-nology.com/

TekMom』s Search Tools for Students

http://www.tekmom.com/search/

【搜索技巧】

在類別中搜索

許多搜索引擎(如Yahoo)都顯示類別,如計算機和Internet、商業和經濟。如果您單擊其中一個類別,然後再使用搜索引擎,您將可以選擇搜索整個Internet還是搜索當前類別。顯然,在一個特定類別下進行搜索所耗費的時間較少,而且能夠避免大量無關的Web站點。

當然,您或許還想搜索整個Internet,以搜索特定類別之外的信息。

使用具體的關鍵字

如果想要搜索以鳥為主題的Web站點,您可以在搜索引擎中輸入關鍵字「bird」。但是,搜索引擎會因此返回大量無關信息,如談論羽毛球的「小鳥球(birdie)」或烹飪game birds不同方法的Web站點。為了避免這種問題的出現,請使用更為具體的關鍵字,如「ornithology」(鳥類學,動物學的一個分支)。您所提供的關鍵字越具體,搜索引擎返回無關Web站點的可能性就越小。

使用多個關鍵字

您還可以通過使用多個關鍵字來縮小搜索範圍。例如,如果想要搜索有關佛羅里達州邁阿密市的信息,則輸入兩個關鍵字「Miami」和「Florida」。如果只輸入其中一個關鍵字,搜索引擎就會返回諸如Miami Dolphins足球隊或Florida Marlins棒球隊的無關信息。一般而言,您提供的關鍵字越多,搜索引擎返回的結果越精確。

使用布爾運算符

許多搜索引擎都允許在搜索中使用兩個不同的布爾運算符:AND和OR。

如果您想搜索所有同時包含單詞「hot」和「dog」的Web站點,只需要在搜索引擎中輸入如下關鍵字:

hot AND dog

搜索將返回以熱狗(hot dog)為主題的Web站點,但還會返回一些奇怪的結果,如談論如何在一個熱天(hot day)讓一隻狗(dog)涼快下來的Web站點。

如果想要搜索所有包含單詞「hot」或單詞「dog」的Web站點,您只需要輸入下面的關鍵字:

hot OR dog

搜索會返回與這兩個單詞有關的Web站點,這些Web站點的主題可能是熱狗(hot dog)、狗,也可能是不同的空調在熱天(hot day)使您涼爽、辣醬(hot chilli sauces)或狗糧等。

留意搜索引擎返回的結果

搜索引擎返回的Web站點順序可能會影響人們的訪問,所以,為了增加Web站點的點擊率,一些Web站點會付費給搜索引擎,以在相關Web站點列表中顯示在靠前的位置。好的搜索引擎會鑒別Web站點的內容,並據此安排它們的順序,但其他搜索引擎大概不會這麼做。

此外,因為搜索引擎經常對最為常用的關鍵字進行搜索,所以許多Web站點在自己的網頁中隱藏了同一關鍵字的多個副本。這使得搜索引擎不再去查找Internet,以返回與關鍵字有關的更多信息。

正如讀報紙、聽收音機或看電視新聞一樣,請留意您所獲得的信息的來源。搜索引擎能夠幫您找到信息,但無法驗證信息的可靠性。因為任何人都可以在網上發布信息。

搜索引擎怎樣判斷網頁所使用的語言?

人們喜歡以他們所知道的語言列出的搜索結果,這對搜索營銷人員是十分重要的。當一個搜索者輸入上面圖中的搜索請求時,只有用中文寫的網頁將被顯示在搜索結果裡面。

在有些國家,例如日本和中國,大部分搜索者想要結果限制在母語上。但是在其他地方例如瑞典,搜索可以採用瑞典語和英語來進行。不同國家的搜索者有不同的語言偏好。

對搜索營銷人員而言,重要的是搜索引擎知道網頁所使用的語言,如果網頁沒能被正確地識別,可能就會從本應發現它的搜索者面前消失,從而降低你的引薦訪問。

那麼搜索引擎是怎樣判斷網頁所使用的語言呢?這裡有很多不同的方法:

1、 語言meta標籤

很多網頁通過一個HTML標籤來表明網頁使用的語言,例如<META http-equiv=」content-language」 content="ja"> 表示使用的是日語,看起來簡單,搜索蜘蛛程序讀取標籤,於是搜索引擎知道是什麼語言了。但是相對多的語言meta標籤是完全錯誤的,沒有標籤,句法錯誤,以及語言編碼錯誤等等。搜索引擎確實查看這些標籤,但是它們很少只從這些標籤來判定網頁的語言。

2、字元編碼

計算機文件(包括HTML網頁)需要「對譯本(Key)」正確翻譯文件中的字元(字母,數字等等)。這種對譯本被稱為字元編碼。由網頁中meta標籤里聲明,例如<META http-equiv=content-type content="text/html; charset=GBK">。

網站瀏覽器和搜索蜘蛛程序假定網頁按照西方語言編碼,因此使用這些語言寫的網頁不需要這個標籤。為了瀏覽器顯示正確,亞洲、阿拉伯和古代斯拉夫語的文本確實需要這個標籤。因此,當搜索引擎看到針對這些語言的表情,它對正確顯示網頁的語言有了很高的保證。

3、內容分析

搜索引擎通過研究內容中的字元模式來最終判定網頁的語言,哪怕是短到只有兩句話的網頁,內容分析的精確度也非常高。Meta標籤只有在內容分析後還不確定的情況下才被使用。

多數情況下,搜索引擎會自行正確地判斷網頁的內容,對於只有很少幾個詞的網頁,要保證網頁被正確識別,正確的編碼語言和meta語言標籤很重要。

搜索引擎為什麼沒有收錄我的網站?

網站沒有被收錄主要有幾方面的原因:

1、網站的設計上存在問題;

2、上線時間較短,搜索引擎還沒有來的及收錄;

3、網站因某種原因被搜索引擎懲罰。

4、網站內容更新不及時

5、網站宣傳不夠

【搜索引擎與網路推廣】

1、頭部內容與網站推廣的關係

在一個網頁中,<head></head>之間,就是一個頁面的頭部信息部分,Google的蜘蛛優先抓取網頁時的頭部文件信息的描述,和關鍵字描述,百度的蜘蛛的喜歡程度不如Google。如何優化這部分的內容信息。<META content="關鍵字" name=keywords>關鍵字這個代碼放到頭部中去,文字長度一般介於150個字元左右,<meta content="網站描述" name="Description">網站描述也放到頭部中去,長度可以多關鍵字約大一些,約300個字元左右。<title>標題</title>頁面標題最好能反應當前的內容描述。優化這一部分內容,可以提高網站在Google里的收錄。

2、頁面內容與網站推廣的關係

頁面內容是指訪問網站是生成的頁面內容,通常是指生成的html代碼文件時<body></body>之間的內容。百度的蜘蛛更喜歡這裡的東西,而且這裡面除去Html代碼標記後的前300個字元通常顯示為搜索引擎的檢索時的描述內容,也是用戶檢查網站內容的關鍵之一。優化這一部分內容,可以提高網站在百度里的收錄

3、頁面超級鏈接與網站推廣之間的關係(最重要的)

頁面超級鏈接,就是網路蜘蛛遊歷整個網站的線索,W3C標準里,就有一條頁面超級鏈接失效到一定程序,就不能通過W3C認證;同樣,失效的超級鏈接也是網路蜘蛛對網站遊歷時,遊歷的一種標準。超級鏈接有兩種情況,A同域下的鏈接,Google的蜘蛛比較喜歡這種鏈接方式。B不同域的鏈接,百度比較喜歡這種方式。要想優化這部分內容Google採用Sitemap.xml文件提交,百度最好採用一個站長地圖文件鏈接到主頁。這裡介紹一個免費工具(在線sitemap生成工具,http://huluwa.cn/sitemap.aspx,以生成google所需的Sitemap.xml文件和百度所需的Html文件。不過需要安裝Java虛擬機。生成這兩個文件後都到到網站根目錄,Sitemap.xml到Google去提交,Sitemap.html在網站的頁面上做一鏈接就可以了。)

4、蜘蛛的工作周期與網站的推廣的關係

百度的工作周期相對來說比google短一些,百度大約在10天左右重新訪問網站一次,Google大約在15天左右重新訪問一次網站。由於一天之內不能遊歷全球所有的網站,如果推廣網站時,能到更多的網站上提交相應的網站信息,也是加快蜘蛛收錄網站內容的重要環節。

5、搜索引擎的自定義排名

  這是搜索引擎公司益利的主要手段,搜索引擎公司由於可以自定義排名,和可以過濾一些關鍵字、詞和網站,這樣可以造成網站無法收錄到搜索引擎的資料庫中。如果長期內,你的網站在搜索引擎中沒有什麼變化,可以考慮調整你網站里的字、詞和網站里的內容。

【搜索引擎的技術發展趨勢】  搜索引擎經過幾年的發展和摸索,越來越貼近人們的需求,搜索引擎的技術也得到了很大的發展。搜索引擎的最新技術發展包括以下幾個方面:

一、提高搜索引擎對用戶檢索提問的理解

為了提高搜索引擎對用戶檢索提問的理解,就必須有一個好的檢索提問語言,為了克服關鍵詞檢索和目錄查詢的缺點,現在已經出現了自然語言智能答詢。用戶可以輸入簡單的疑問句,比如「how can kill virus of computer?」。搜索引擎在對提問進行結構和內容的分析之後,或直接給出提問的答案,或引導用戶從幾個可選擇的問題中進行再選擇。自然語言的優勢在於,一是使網路交流更加人性化,二是使查詢變得更加方便、直接、有效。就以上面的例子來講,如果用關鍵詞查詢,多半人會用「virus」這個詞來檢索,結果中必然會包括各類病毒的介紹、病毒是怎樣產生的等等許多無效信息,而用「how can kill virus of computer?」,搜索引擎會將怎樣殺病毒的信息提供給用戶,提高了檢索效率。

二、對檢索結果進行處理

1、基於鏈接評價的搜索引擎

基於鏈接評價的搜索引擎的優秀代表是Google(http://www.google.com),它獨創的「鏈接評價體系」是基於這樣一種認識,一個網頁的重要性取決於它被其它網頁鏈接的數量,特別是一些已經被認定是「重要」的網頁的鏈接數量。這種評價體制與《科技引文索引》的思路非常相似,但是由於互聯網是在一個商業化的環境中發展起來的,一個網站的被鏈接數量還與它的商業推廣有著密切的聯繫,因此這種評價體制在某種程度上缺乏客觀性。

2、基於訪問大眾性的搜索引擎

基於訪問大眾性的搜索引擎的代表是direct hit,它的基本理念是多數人選擇訪問的網站就是最重要的網站。根據以前成千上萬的網路用戶在檢索結果中實際所挑選並訪問的網站和他們在這些網站上花費的時間來統計確定有關網站的重要性排名,並以此來確定哪些網站最符合用戶的檢索要求。因此具有典型的趨眾性特點。這種評價體制與基於鏈接評價的搜索引擎有著同樣的缺點。

3、去掉檢索結果中附加的多餘信息

有調查指出,過多的附加信息加重了用戶的信息負擔,為了去掉這些過多的附加信息,可以採用用戶定製、內容過濾等檢索技術。

三、確定搜索引擎信息搜集範圍,提高搜索引擎的針對性

1、垂直主題搜索引擎

網上的信息浩如煙海,網路資源以十倍速的增長,一個搜索引擎很難收集全所有主題的網路信息,即使信息主題收集得比較全面,由於主題範圍太寬,很難將各主題都做得精確而又專業,使得檢索結果垃圾太多。這樣以來,垂直主題的搜索引擎以其高度的目標化和專業化在各類搜索引擎中佔據了一系席之地,比如象股票、天氣、新聞等類的搜索引擎,具有很高的針對性,用戶對查詢結果的滿意度較高。作者認為,垂直主題有著極大的發展空間。

2、非www信息的搜索

提供FTP等類信息的檢索

3、多媒體搜索引擎

多媒體檢索主要包括聲音、圖像、視頻的檢索。關於圖片搜索引擎的原理,《淺談圖片搜索引擎的實現》http://blog.minidx.com/2007/12/19/265.html 中提出了具有跨時代意義設計思路。

四、將搜索引擎的技術開發重點放在對檢索結果的處理上,提供更優化的檢索結果

1、純凈搜索引擎

這類搜索引擎沒有自己的信息採集系統,利用別人現有的索引資料庫,主要關注檢索的理念、技術和機制等。

2、元搜索引擎

現在出現了許多的搜索引擎,其收集信息的範圍、搜索機制、演算法等都不同,用戶不得不去學習多個搜索引擎的用法。每個搜索引擎平均只能涉及到整個www資源的30-50%(search engine watch數據),這樣導致同一個搜索請求在不同搜索引擎中獲得的查詢結果的重複率不足34%,而每一個搜索引擎的查准率不到45%。

元搜索引擎(metasearch enging)是將用戶提交的檢索請求到多個獨立的搜索引擎上去搜索,並將檢索結果集中統一處理,以統一的格式提供給用戶,因此有搜索引擎之上的搜索引擎之稱。它的主要精力放在提高搜索速度、智能化處理搜索結果、個性搜索功能的設置和用戶檢索界面的友好性上,查全率和查准率都比較高。目前比較成功的元搜索引擎有metacrawler、dopile、ixquick、搜客等。

3、集成搜索引擎

集成搜索引擎( All-in-One Search Page),亦稱為「多引擎同步檢索系統 」(如百度http://www.baidu.com)是在一個WWW頁面上鏈接若干種獨立的搜索引擎,檢索時需點選或指定搜索引擎,一次檢索輸入,多引擎同時搜索,用起來相當方便。

集成搜索引擎無自建資料庫,不需研發支持技術,當然也不能控制和優化檢索結果。但集成搜索引擎製作與維護技術簡單,可隨時對所鏈接的搜索引擎進行增刪調整和及時更新,尤其大規模專業(如FLASH、MP3等)搜索引擎集成鏈接,深受特定用戶群歡迎。

4、垂直搜索引擎

垂直搜索引擎是相對通用搜索引擎的信息量大、查詢不準確、深度不夠等提出來的新的搜索引擎服務模式,通過針對某一特定領域、某一特定人群或某一特定需求提供的有一定價值的信息和相關服務。其特點就是「專、精、深」,且具有行業色彩,相比較通用搜索引擎的海量信息無序化,垂直搜索引擎則顯得更加專註、具體和深入。

五、搜索引擎的分類

網頁 音樂(翻唱 MP3)影視(電影 電視) 視頻 播客 軟體 BT下載 硬體 圖片 壁紙 相冊 小說 文學 文檔(論文 述職報告 思想彙報 演講稿 入黨申請書 作文 個人簡歷 畢業論文 法律論文 經濟論文 教育論文 會計論文 計算機論文 畢業論文集 情書 調查報告 求職信 商業計劃書 實習報告 就職演說 自薦信 企劃方案 企業管理 年終總結) 新聞(資訊) 百科(知識 經驗) 教育 人物 學校 專業 論壇 社區 博客 詞典 翻譯 地圖 動漫 Flash 遊戲 娛樂 笑話 汽車 家電 手機 廣告 購物 商業 黃頁 房產 招聘 財經 股票 基金 法律 國學 圖書 政府 目錄 學術 代碼 公交 實用查詢等幾十個分類。

六、搜索引擎的最後一步

10年前我們要查閱資料,請教問題,更多想到的是請教專家,圖書管查閱等傳統方式。常常為了一個簡單的問題而到處尋師,在圖書館翻著類似我的電腦桌抽屜里的檢索卡片,苦苦尋找。曾幾何時,互聯網的普及與興起,搜索引擎的出現,逐漸改變著我們的生活習慣和思維方式。很多問題「baidu一下,你就知道。」 就像這裡用的「曾幾何時」這一詞,中文不好的我只有模糊的理解,還以為有「曾經」的意思,想用為第一句。於是百度知道搜索了一下,出自宋"王安石《祭盛侍郎文》:「補官揚州,公得謝歸。曾幾何時,訃者來門。」 才知是才過了不久的意思。

搜索引擎(search engine)是一個系統,能從大量信息中找到所需的信息,提供給用戶。互聯網出現到現今,信息量可以說成密指數的增長,大量信息就像Google的原本含義一樣「1的後面跟著100個0」,這個數比宇宙所有的基本粒子的數量總和還要大。在這浩如煙海的信息中怎麼才能找到自己需要的信息呢?搜索引擎就像一隻神奇的手,從雜亂的信息中抽出一條清晰的檢索路徑。

事物的發展往往遵循著合久必分,分久必合的規律,每一次的合與分都是代表著更高級更先進。同樣搜索引擎從最初的Archie可以用文件名查找整個互聯網中FTP文件的系統,發展到Yahoo早期一種手工錄入的分行業的目錄檢索。隨著搜索技術的發展,元標記搜索、全文搜索重新又把整個互連網的信息整合起來提供給用戶,目前的Baidu、Google提供的就是一種整個互聯網的全文搜索,這種整合信息的搜索也稱為水平搜索。這種水平全文搜索固然可以把網路中的所有相關信息提供給用,但這種「所有」不代表著是用戶所需的「所有」,往往夾雜著許多垃圾信息。問題出現就伴隨著去解決,如果平常使用搜索引擎比較全面,你會發現Baidu、Goolge都有了「更多」的選項,其中出現了大學搜索、新聞搜索、圖書搜索、圖片搜索等等這些專業化,行業化的搜索,也稱為垂直搜索。當前垂直搜索正在逐漸走向豐富化、專業化、行業化,將越來越滿足人們的搜索需求。比如很多人在搜索問題時會到百度知道里搜索,因為那裡更有針對性;搜索天氣會到天氣搜索中等等。

那麼搜索引擎的下一步發展是什麼呢?讓我們回想一下搜索引擎的定義:一個系統,能從大量信息中找到所需的信息,提供給用戶。根據技術的不斷發展和事物規律暢想一下,垂直搜索發展到一定程度會出現信息的單一專業化太強,整體信息綜合化不好,而人們需要的不但要有專業信息,同樣也要有整體聯想信息。隨著人工智慧、神經網路、網格計算等搜索技術的發展,我們又將有一個能整合互聯網信息,智能的提供用戶確實所「需」的信息,而不簡單只是所「要」的信息,因為很多時候搜索時,自己都不知道要什麼。

再回的現在的搜索引擎,它就像一隻神奇的手,從雜亂的信息中抽出一條清晰的檢索路徑。這個引擎提供給用戶的最後一步是什麼?是一條清晰的檢索路徑。好的,注意這是一條檢索路徑,在這條路徑的上的檢索和信息提取是什麼呢,是我們的閱讀和大腦的判斷。也就是做搜索引擎的最後一步是我們的大腦。得到的這條路徑清晰但也並不簡短,需要我們進行快速的瀏覽,呵呵,繞來繞去,得出一個結論,快速閱讀也是搜索引擎中的一部分。

隨著搜索市場競爭的白熱化,搜索引擎不僅開始深挖自己的戰壕,還開始打起了口水戰,而山寨搜索引擎在高舉著「整合」的大旗,開始大搖大擺地進入這個本來只有巨頭壟斷的市場。國人充分發揮著其無比的想像力,準備讓國內的互聯網「步入搜索新時代」。下面就讓我們看看什麼是山寨搜索引擎writtes by 7118579

「百google度」- baigoogledu.com

最早的山寨搜索引擎,曾經名噪一時。最早確定了山寨搜索引擎的模式,而且訪問量很高,但功能簡單,而且讓用戶需要不停的兩邊拖拉才能看到完整的結果。

「百穀虎」- baigoohoo.com

由於某家新聞媒體的報道,最近聲名大振,高舉著「山寨」大旗,讓國人開始了解什麼是山寨搜索引擎,名字極富創意。可惜由於搜索結果被並排擠在一起,似乎沒有什麼實際使用價值。

「熊熊搜索」- bearsou.com

似乎比較低調的山寨搜索,首頁整合了非常多的信息,甚至包含了天涯和VeryCD的熱門,搜索結果的體現也更人性,似乎還整合了百度知道的結果,不過功能太多,略顯凌亂。

「山寨文化」在每個人的心目中可能都有著不同的感覺,但隨著這股風越刮越烈,可見草根對「山寨」的內涵還是有相當的認同,百度和谷歌的嘴仗打的不亦熱乎,都指責對方結果不公正,山寨搜索卻硬要把這兩個冤家放在一起。也許很多人對「山寨搜索」嗤之以鼻,但是對於普通網民來說,是誰的搜索並不重要,是我們需要的結果才是最重要的么。如果是你,你會選擇誰呢?

搜索引擎優化(Search Engine Optimization,簡稱SEO) 搜索引擎優化即Search Engine Optimization,用英文描述是to use some technics to make your website in the top places in Search Engine when somebody is using Search Engine to find something,翻譯成中文就是「搜索引擎優化」,一般可簡稱為搜索優化。與之相關的搜索知識還有Search Engine Marketing(搜索引擎營銷),Search Engine Positioning(搜索引擎定位)、Search Engine Ranking(搜索引擎排名)等。

搜索引擎的未來展望

隨著互聯網的發展,網上可以搜尋的網頁變得愈來愈多,而網頁內容的質素亦變得良莠不齊,沒有保證。所以,未來的搜索引擎將會朝著知識型搜索引擎的方向發展,期以為搜尋者提供更準確及適用的資料。目前,網上的百科全書如雨後春筍般發展起來;另一方面,近年來亦有不少公司嘗試在搜尋方面改進,務求更符合用戶的要求。當中諸如Copernic Agent之類的搜尋代理就是其中之一。

在台灣,威知資訊(WebGenie)是利用文字探勘(Text Mining)技術發展搜尋引擎產品的公司,利用人工智慧演算法,可達成目前搜尋引擎所缺乏的簡易人機互動模式,諸如關聯字提示、動態分類字提示等[1],算是較另類的搜尋引擎產品。

推薦閱讀:

SEO優化網站如何布局關鍵詞
模糊搜索&自動糾錯——Fuzzy Query by Levenshtein Automata
發布知音引擎,搜狗為何能在人工智慧技術上屢佔先機?
搜索引擎營銷的形式分為幾種?
如何讓搜索引擎免費收錄您的博客

TAG:知識 | 搜索 | 搜索引擎 | 索引 |