網路資源大搜索
一、信息查詢的相關知識
(一)什麼是搜索引擎
搜索引擎的主要任務是搜索其他網站上的信息,並將這些信息進行分類並建立索引,然後把索引的內容放到資料庫中,當用戶向搜索引擎提交搜索請求的時候,搜索引擎會從資料庫中找出匹配的資料反饋給用戶,用戶再根據這些信息訪問相應的網站,從而找到自己需要的資料。
(二)搜索引擎的分類
按照數據收集方式的不同,搜索引擎主要分為兩類,一類是目錄索引搜索引擎,另一類是全文檢索搜索引擎:
1.目錄索引搜索引擎(Search Index/ Directory)
目錄索引搜索引擎中的數據是各個網站自己提交的,它就像一個電話號碼薄一樣,按照各個網站的性質,把其網址分門別類排在一起,大類下面套著小類,一直到各個網站的詳細地址,一般還會提供各個網站的內容簡介。用戶不使用關鍵字也可進行查詢,只要找到相關目錄,就完全可以找到相關的網站(注意:是相關的網站,而不是這個網站上某個網頁的內容)。這類搜索引擎往往也提供關鍵字查詢功能,但在查詢時,它只能夠按照網站的名稱、網址、簡介等內容進行查詢,所以它的查詢結果也只是網站的URL地址,不能查到具體的頁面。由於這類搜索引擎的數據一般由網站提供,因此它的搜索結果並不完全準確,並不是嚴格意義上的搜索引擎。
2.全文檢索搜索引擎(Search Engine)
這類搜索引擎通過一種稱為「蜘蛛」的程序自動在網路上提取各個網站的信息來建立自己的資料庫,並向用戶提供查詢服務,是一種真正意義上的搜索引擎。如AlaVista、Google、Excite、Hotbot、Lycos等。
全文檢索搜索引擎資料庫中的數據來源分兩種:一是定期搜索,也就是每隔一段時間搜索引擎就主動派出「蜘蛛」程序,對一定IP地址範圍內的互聯網站進行檢索,一旦發現新的網站,就會自動提取網站的信息和網址加入自己的資料庫。二是網站提交的信息,即網站所有者主動向搜索引擎提交地址,搜索引擎會在一定時間內派出「蜘蛛」程序搜索所提交的網站的相關信息,並存入自己的資料庫中。總的說來,這些數據都是「蜘蛛」程序搜索到的網頁上的具體內容,其搜索結果也能精確到具體網頁。
其實,如今的搜索引擎和目錄索引已經開始相互融合,全文檢索搜索引擎也提供目錄索引服務。而像Yahoo!這樣的目錄索引也開始和Google的搜索引擎合作,從而擴大搜索範圍。
二、搜索引擎的使用方法
(一)搜索引擎的基本使用方法
雖然互聯網上的搜索引擎非常多,但其具體使用方法卻比較接近,只是在具體使用過程中稍有不同而已。
前面我們介紹過,搜索引擎有全文檢索和目錄索引兩種類型,所以這裡也我們分兩方面來討論如何正確使用這兩種不同類型的搜索引擎。
1.目錄索引搜索引擎的簡單使用 這裡我們以非常著名的搜索引擎Yahoo中國(http://cn.yahoo.com/)為例進行說明。
Yahoo中國是一個典型的目錄索引型的搜索引擎網站,它的主界面如圖1所示。可以看到,在網頁前面的部分提供搜索功能,而後面一部分則提供目錄索引(如圖2所示)。它的搜索功能分為兩部分,一部分為搜索Yahoo內部的索引資料庫,而另一部分則是通過Google的搜索引擎提供網頁搜索功能。
圖1 雅虎中國的首頁
2.用目錄列表查找信息
使用目錄列表進行搜索的方式適於我們查找那些不知道關鍵詞的資料,比如我們想查看一下有Yahoo中國中收錄了哪些電腦方面的雜誌,就可以通過目錄列表進行查詢。
圖2 雅虎中國的目錄服務
例如我們要查找有關電腦方面的雜誌。打開Yahoo中國後,在圖2所示的界面上,可以看到Yahoo把其收錄的網站分為幾個大類,其中有一個「新聞與媒體」的分類,點擊此鏈接可以進入小分類列表,在這裡可以看到「新聞與媒體」又被分為「各地新聞與媒體」、「交通運輸」等幾個分類,其中也包括「電腦與國際網路」這個小分類,再點擊「電腦與國際網路」這個鏈接,可以看到裡面又分為報紙、雜誌等項目,點擊超級鏈接「雜誌」,即可看到已經被Yahoo收錄的電腦和互聯網方面的雜誌網站。通過這種方法,我們可以找到一類相關的網站信息,而無需輸入任何關鍵字進行搜索。 3.關鍵字搜索目錄列表中的內容
下面我們以如何搜索《電腦愛好者》雜誌為例進行說明。前面我們講過,在Yahoo中國的首頁上有一個信息檢索框(圖3),我們只需要在「檢索框」中輸入關鍵字,然後按一下回車或者點擊「檢索」按鈕進行查詢,搜索引擎即會把搜索結果反饋給我們。當我們在檢索框中輸入「電腦愛好者」並回車後,即可返回相關的信息。通過這種方法,我們能夠非常輕鬆地找到需要的信息。
圖3 雅虎中國的檢索框
4.全文檢索搜索引擎的使用
談到搜索引擎,尤其是談到中文搜索引擎,我們不得不提到百度搜索引(http://www.baidu.com)。百度搜索引擎是採用的是「蜘蛛」程序,所以用它搜索出來的結果能夠精確到每個具體的頁面。百度問世之後,以其友好的界面、簡便的操作、快速的搜索在極短的時間內搶佔了國內市場,目前搜狐、新浪、263等使用的都是百度的搜索引擎。
百度搜索引擎的首頁如圖4所示,其基本使用方法非常簡單,只需要在搜索框中輸入希望查詢的信息,然後按一下回車或者點擊「百度搜索」按鈕即可把相關網頁提供給我們。如我們輸入「電腦愛好者」,百度會反饋給我們如圖5所示的頁面。
圖4 百度的首頁
圖5 搜索結果
(二)搜索引擎的高級使用方法
1.試著用整句話搜索
比如說,我們想在網上查詢一下什麼是搜索引擎,如果把關鍵字確定為「搜索引擎」,搜索的結果將會將會讓我們大跌眼鏡——基本上都是一些搜索引擎註冊、哪個網站是搜索引擎之類。如果我們換個關鍵字,直接用「什麼是搜索引擎」進行搜索就可以快速找到相關的內容。
2.學會使用多個關鍵字
只使用一個關鍵字尤其是常用的字進行搜索得到的結果對於用戶來說將是一個天文數字,比如我們想在互聯網上下載金庸先生的武俠小說《笑傲江湖》,如果只用「笑傲江湖」作為關鍵字進行搜索,百度會告訴我們:「找到了242887 篇有關『笑傲江湖』的頁面」,其中包括大量的網路遊戲、論壇之類的信息,我們真正想找的小說不知排到了第幾頁,這時我們就可以使用多個關鍵字進行搜索。對於多個關鍵字的使用規則,各個搜索引擎有所不同,有的需要在關鍵字之間用「AND」或者「+」號進行連接,而百度搜索引擎只需在各個關鍵字之間空一個空格就可以了。那麼我們到底用什麼關鍵字進行搜索呢?不妨回想一下,既然是小說,當然是以章節進行分頁的,所以我們可以用「笑傲江湖 第一章」作為關鍵字進行搜索,得到的搜索結果只有1071個,而關於這部小說鏈接就排在第一位上。
3.學會使用邏輯搜索
所謂邏輯搜索,指的是我們把關鍵詞通過某種表達式提交給搜索引擎,讓搜索引擎按照我們的意思進行搜索,從而更加準確地查找到相關資料。其實我們前面介紹的使用多個關鍵字也是一種邏輯搜索,它屬於邏輯「與」。常用的邏輯搜索還有邏輯「非」、邏輯「或」。在百度搜索引擎當中,邏輯非用「-」號表示,但在「-」號之前需要留一個空格。比如我要搜索關於武俠小說的頁面,但希望搜索結果中不包括關於「古龍」的資料,其關鍵字就可以確定為「武俠小說-古龍」,但在某些網站上可能會在「古龍」這個詞之間插入一個空格,所以我們還需要再排除包含「古 龍」這個詞的網頁,即關鍵字應設置為「武俠小說-『古龍』」。
百度搜索引擎的邏輯「或」用「|」來表示,如果關鍵字為「A|B」,則表示希望找到「或者包含關鍵字A、或者包含關鍵字B」的網頁。比如我們想查找關於古龍先生的資料,如果用「古龍」作關鍵字,則會丟失以「古 龍」為關鍵字的網頁,反之亦然。這裡我們就可以使用邏輯「或」進行搜索,即把關鍵字設置為古龍|「古 龍」。
4.學會使用引號進行精確搜索
如果我們輸入的關鍵字中包含空格,比如著名武俠小說作家的名字「古龍」,由於網站在收錄其作品時往往會在其名字中間加上一個空格,如果我們關鍵字輸入「古 龍」,百度會認為這是兩個關鍵詞,那麼連「對付古墓2代惡龍的絕招」這樣的信息都會出現在搜索結果中。為了避免這種結果,我們需要用英文的雙引號將其括起來,即「古 龍」,告訴搜索引擎這是一個詞,而不是兩個關鍵字,其搜索結果將會更加準確。此外,有時搜索引擎會自動把把我們提交的關鍵字進行拆分,這樣搜索的結果就不會非常準確,使用引號把中間沒有空格的關鍵字括起來還能告訴搜索引擎不對關鍵字進行拆分,進行精確搜索。這一點對於搜索中文影響不是很大,但對英文搜索時關係非常大。比如我們輸入的關鍵字為Computer Adventure Games,基本上等同於「Computer」and 「Adventure」and「Games」,它會對這三個詞進行搜索,而且這三個詞在同一個網頁中的順序對於搜索結果沒有影響,而如果使用「computer adventure games」作為關鍵字進行搜索,則要求這三個單詞必須嚴格按照給定的順序進行排列,而且不能分開,否則就不符合搜索條件。如果合理使用引號,能夠非常準確地快速找到真正需要的資料。
5.學會使用「百度快照」
由於網頁內容的頻繁更新,有時在搜索引擎中能夠搜索到相關連接,但點擊鏈接後會發現該網頁已經被刪除了。為了避免這種情況,百度提供的「百度快照」功能,把網頁儲存在自己的伺服器中,這樣即使網站已經把這個網頁刪除了,用戶也能正常瀏覽。「百度快照」在搜索到的每個鏈接的簡介後面,如圖6所示。
圖6 百度快照的鏈接
三、快速高效搜索的注意事項
前面我們簡單講述了搜索引擎的基本用法和高級用法,但對於每個搜索引擎來說,具體使用方法不盡相同,而且如果想快速、高效地搜索出需要的資料,也不是簡單地了解幾個技巧就可以的,在這一部分,我們將告訴您一些使用搜索引擎時應該注意的事項。
1.選擇好關鍵字
其實所有的搜索技巧都是在如何確定關鍵字上做文章,好的關鍵字是搜索成功的關鍵。關鍵字代表著我們要搜索資料的特徵,所有在關鍵字的要具有唯一性。但單個關鍵字所代表的往往是一類信息的特徵,所以在確定關鍵字的時候,最好把幾個關鍵字合起來使用。比如我們想查找關於「申花」企業的資料,只用「申花」做關鍵字進行搜索,會把這方面的資料淹沒在一大堆申花隊踢足球的新聞之中,其實我們只要用「申花 -足球」作關鍵字,把體育方面的資料排除在外,剩下的資料將會準確得多。再如我們想了解某個軟體的使用方法,不妨用「某軟體使用方法|技巧」作為關鍵字進行搜索,就可以排除那些關於這個軟體下載信息的資料。
2.確定好搜索引擎
前面我們說過,搜索引擎分為兩類,在搜索之前我們首先就應該明白這兩種搜索引擎各自的優缺點,根據自己要查詢的資料選擇使用。如果我們只想查詢某一類信息,比如電腦類的報刊雜誌有哪些,不妨使用目錄索引,這裡提供的信息非常可靠,而且幾乎沒有垃圾信息。但如果我們想查詢具體的資料,就需要到搜索引擎上進行搜索。其次,要根據自己所需要的資料類型確定搜索引擎。比如我們只想查詢一般資料,在任何一個搜索引擎上都可能查找到,但如果我們想查詢一些特殊資料,比如圖片之類,最好是到專門的搜索引擎上進行搜索。第三,在查詢一般資料時,也要確定使用哪個搜索引擎。比如我們要查找英文原版資料,那最好是到國外的搜索引擎上查詢,如果要查找中文資料,在國外的搜索引擎上恐怕是很難找到的。
3.避免常見的錯誤
有時我們到搜索引擎搜索時,會發現居然沒有找到需要的資料,這時我們要首先確定自己是不是犯了一些低級的、但卻又常常被人忽視的錯誤。一是使用了錯別字,如把「以德治國」輸入為「以德制國」;二是使用了太常見的關鍵字,比如用「手機」作為關鍵字進行搜索會找到海量的和手機相關的網頁,所以這時應該嘗試著使用更多的關鍵字進行搜索;三是使用多義詞作為關鍵字,比如用「Java」作為關鍵字進行搜索,反饋給我們的結果將包括一個叫java的小島、一種著名的咖啡和一種計算機語言。
其實掌握搜索引擎的使用方法和掌握其他知識一樣,需要一個積累過程,在真正使用的時候,可以先確定一個關鍵字搜索一下,然後看一看用這個關鍵字搜索時有多少無關信息、這些無關信息的大致特徵是什麼,然後再進一步確定關鍵字另行搜索,這樣的搜索結果往往比閉門造車一次性地使用多個關鍵字搜索要好得多。只要我們平時有意識地在使用搜索引擎時加以注意,是很容易掌握的。
四、特殊資料的搜索方法
前面我們討論的只是一些常規則資料的搜索方法,下面我們將結合具體實例和各個搜索引擎講述一下特殊資料的搜索方法。所謂特殊資料,指的是網站中一些通過常規搜索很難查詢的資料,比如MP3、圖片、FTP等。
1.搜索MP3
「搜刮」(http://www.sogua.com/)是專業搜索MP3的網站,在它的主頁上有一個搜索框,如圖7所示,提供MP3搜索、試聽搜索、FLASH搜索等功能,我們在搜索MP3時,在「MP3搜索」下面的檢索框內輸入歌手的名字或者歌曲的名字,然後按回車按鈕,網站就可以從網上為我們搜刮到所有關於這個信息的歌曲。搜索結果中不僅給出了歌曲的名字,還給出了文件大小、所需協議、響應時間等信息。
國外搜索MP3的網站還有http://www.3pmmp3.com/、http://www.audiofind.com/、http://www.mp3.com/、http://www.seekmp3.com/等多家網站,如果要搜索外文歌曲,到這些搜索引擎上去查找,效果一定不錯。
圖7 搜刮主頁上的搜索框
2.搜索圖片
提到圖片搜索,一些資深網友自然而然地會想到Google(http://www.google.com/)的圖片搜索, Google的主頁上專有一個「圖像」連接,如圖8所示,點擊這個鏈接後,在檢索框內輸入關鍵字,然後點擊「Google搜索」按鈕,即可找到相關資料。比如我們在這裡輸入關鍵字「老虎」後,就可以搜索到和老虎相關的圖片,並以縮略圖的形式提供給用戶,點擊相應鏈接即可顯示出該圖片。此外,如果使用Google的高級圖像搜索功能,還可以進一步設置關鍵字的匹配程度、圖片的類型和大小,甚至還可以指定在某個網站內進行搜索,從而進一步提高搜索精度。
圖8 Google的圖片搜索功能
除了Google,網上還有一些專門搜索圖片的網站,如http://www.gograph.com/、http://www.art.com/、http://www.picsearch.com/等。
3.FTP搜索
FTP搜索是專門搜索FTP伺服器上文檔的搜索引擎,北大天網FTP搜索引擎(http://bingle.pku.edu.cn/)就是這樣一個網站,通過它可以查詢教育網內FTP伺服器上的文檔,比如程序、源代碼、MP3、電影等。在使用時,在檢索框內輸入需要搜索的關鍵字,比如我們想查找Winzip壓縮解壓程序,就可以在檢索框中輸入winzip,然後在搜索類型中選擇「程序」,最後點擊「FTP搜索」按鈕,就可以找到很多下載鏈接。
五、用搜索軟體輕鬆搜索
搜索引擎為我們在互聯網上查找資料提供了極大的方便,但搜索引擎本身也有著諸多不足,比如搜索引擎網站多,性能不一,在查找某個資料時可能需要登錄多個搜索引擎進行查找;重複搜索結果多,需要一頁頁進行查找;搜索到的結果是無法訪問的死鏈接等等。所以網上的先哲們在搜索網站的基礎上開發了一些搜索軟體,這些搜索軟體一般都集成很多搜索引擎,在使用時把關鍵字同時提交到這些搜索引擎上進行搜索,然後把結果進行整理之後提交給我們,這樣就實現了同時在多個搜索引擎上進行搜索和智能搜索,所以,這種搜索軟體也深受廣大網友的喜愛。 1.搜索奇兵
搜索奇兵採用多線程技術,能夠同時搜索各大著名搜索引擎並將搜索結果統一顯示在一個頁面中。顯示的搜索結果將過濾掉重複的結果、死鏈接和已經不存在的個人免費主頁,過濾無法訪問網站、自定義過濾國內外免費域名、自定義過濾長時間沒有更新的頁面,並具有搜索引擎以外先進的第三方排名方法,提供給用戶精確的搜索結果。它的下載地址是http://www.worldfax.net/,軟體大為1296KB。軟體的界面非常樸素,如圖9所示,使用也非常簡單,只要在檢索框內輸入關鍵字,再根據需要點擊「中文搜索」或者「英文搜索」即可進行搜索,當全部搜索完成後,會對搜索結果加以驗證,確定是否有死鏈接、何時更新、是否有重複標題等,然後將最終結果顯示在搜索列表中。
圖24 搜索奇兵的界面
2.Copernic
下載地址:http://www.soft163.com/download/list.asp?id=721 軟體大小:3241KB
Copernic是一款非常優秀的搜尋工具,使用多個強大的搜索引擎如Yahoo、Lycos等,而且分為健康、圖片、新聞、軟體等63類來精細搜尋,它可將搜尋出來的站點進行列表,然後通過內置瀏覽器或默認瀏覽器進行訪問,也可將整個網站下載過來,或將它通過電子郵件傳送給別人。
3.颶風搜索通
下載地址:http://www.renliang.com 軟體大小:1135KB
颶風搜索通是ZDNet 的五星級搜索工具,整合了近百個著名搜索引擎,而且還可以自動添加搜索引擎,分為網站、網頁、 軟體、音樂、MP3、證券、新聞、購物、拍賣、遊戲等數十個分類搜索。採用多線程並行運作,同時開啟多個搜索引擎,高效實用,完全兼容用戶搜索習慣和結果瀏覽方式。它只是簡單地把這些搜索引擎集中到同一個軟體里,在軟體的主窗口中同時打開不同的搜索引擎進行搜索,所以沒有對搜索到的結果進行整理的功能,但可以對搜索結果進行校驗。
下載無極限
網路世界無限精彩,許許多多的內容都讓人目不暇接,軟體、遊戲、圖片、Flash、電影……很多內容都是非常希望能保留下來的,而這就涉及到了下載。
網路下載可以通過很多方式來實現,下面,我們就來介紹一下比較常見的HTTP方式、FTP方式等下載網路資料的方法
一、HTTP方式下載
採用此種方式的軟體眾多,具有代表性的有FlashGet、Netant、NetVampire等。下面我們就以FlashGet的使用做一個簡單說明,其他的軟體的使用都是大同小異的。
FlashGet軟體可以在各大下載軟體的網站找到,安裝過程極其簡單,光點Next就可以了。安裝完畢後,你可以通過以下幾種方法啟動FlashGet:
(1)快捷菜單啟動:每當通過瀏覽器需要下載文件的時候,請用滑鼠右鍵點擊該下載鏈接,彈出快捷菜單;
(2)瀏覽器圖標快速啟動:安裝FlashGet完畢後,IE瀏覽器工具欄上多了一個FlashGet圖標,FlashGet將其圖標集成到瀏覽器的工具按鈕中,點擊之即可快速啟動! 如圖1所示。
圖1
接下來就出現了大家所熟悉的FlashGet懸浮窗 ,把下載鏈接拖拽進去即可。
下載方式
(1)點擊下載
當你從瀏覽器中點擊相應的鏈接進行下載。FlashGet可以監視瀏覽器中的每個點擊動作,一旦它判斷出你的點擊符合下載要求,就會攔截住該鏈接,並自動添加至下載任務列表中進行下載。
(2)手動下載
從FlashGet的主菜單中選擇「任務」→「新建下載任務」。在URL一欄中手動輸入鏈接,然後確定即可完成手動下載。如圖2所示。
圖2
通過狀態圖標清單,可以很容易查看出當前的下載任務處於一種什麼樣的下載狀態。
通過「圖表/日誌」圖標可以反映下載文件的具體進行狀態。在這裡每一個小圓點代表著文件的一個組成部分,灰色的小圓點表示未下載的部分,紅色的小圓點表示已下載的部分。下載時你會發現這些小圓點正逐漸由灰色變成紅色。如果你發現文件中好幾個部分同時變為紅色,這表明FlashGet利用好幾個線程同時進行下載。當所有的小圓點都變成紅色,文件也就下載完畢了。
我們可以用到FlashGet的文件管理功能,它使用了類別的概念來管理已下載的文件,每種類別可指定一個對應的磁碟目錄,當下載任務完成後可將下載文件拖放至合當的類別目錄中進行歸類整理,讓凌亂的文件從此變得井然有序。
FlashGet與Internet連接的默認方式是直接連接。如果不能下載,則很有可能是必須通過代理伺服器才可訪問Internet,這就需要在FlashGet中設置代理伺服器信息,點擊「添加」按鈕, 在彈出的設置窗口中填入代理伺服器的信息,如圖3所示。
注意,由於FlashGet支持一個代理伺服器列表,不同的任務可以使用不同的代理伺服器,所以我們可添加多個代理伺服器,而將用得最多的代理伺服器設置為默認伺服器,在該項伺服器前的方框中打上「√」便可。
圖3
(本文摘自《電腦愛好者精品文庫》之"網海揚波"欄目。更多精彩,敬請關注。)
推薦閱讀:
※網路中的情感有幾分真
※供應商分享:展會、網路營銷經驗之談
※網路言論自由與刑事犯罪(張明楷)
※飛星紫微斗數飛星紫微斗數網路家族文集--梁 26
※PPT?解讀《網路與信息安全產業白皮書(2015年)》