ê

網路資源概論

搜尋引擎(Search Engines)
搜尋引擎–Google
搜尋引擎–Openfind台灣網路資源搜尋
查詢結果

回網路資源目錄

搜尋引擎(Search Engines)

搜尋引擎查詢的方式,可以分為關鍵字查詢和概念式查詢兩種:

1. 關鍵字搜尋(keyword search)

搜尋引擎多半是根據文件的標題(Title)、MetaTag中的描述來決定索引關鍵字;有些則是以文件的前數百個字或是前幾行中出現頻率最高的字詞當作索引關鍵字;有些則是計算整篇文件中字詞的出現次數,找出出現次數最高的字詞來當作索引關鍵字。AltaVista可說是關鍵字搜尋引擎的代表。

使用者查詢關鍵字索引式的搜尋引擎時,必須自己界定所有相關的關鍵字或片語,才能找到完整、相關的資料。當使用者輸入關鍵字或片語時,搜尋引擎便根據使用者輸入的單字或片語去比對關鍵字索引,再將符合的輸出為結果。為提高查詢結果的精確度,關鍵字查詢式的搜尋引擎都提供複雜的查詢技巧和限制查詢範圍的方法。

2. 概念式搜尋(concept search)

這類搜尋引擎先將資料庫中的文件加以分類整理,當使用者輸入關鍵字查詢時,搜尋引擎先根據使用者輸入的字或詞搜尋相關之概念(concept),決定搜尋的範圍,再將相關的結果呈現給使用者。換句話說,概念式搜尋所查詢的是字義而不是字形。Excite是概念搜尋的典型代表。由於概念式搜尋已將相關的關鍵字組合成概念,因此不需要太複雜的查詢策略,通常只要輸入明確的關鍵字即可。

如果所要查詢的資料非常明確時,建議先利用概念式搜尋找到相關的資料,再利用關鍵字索引做廣泛的搜尋。

如果所要查詢的資料不太容易界定歸類,建議直接利用關鍵字搜尋引擎,但是最好能儘量將相關的關鍵字一一輸入查詢,才能得到較完整適用的資料。

 

搜尋引擎的個性

您是否有鍾愛的搜尋引擎,還是隨心情看天氣,每次用不同的搜尋引擎呢?您是怎樣決定使用那一個搜尋引擎的?在About.com的Web Search專欄中, Chris Sherman說搜尋引擎也跟人一樣,是有個性的,有優點也有缺點,有令人讚賞的特質,也有令人氣憤的缺點。您知道您經常用的搜尋引擎是什麼個性嗎?[1]

Alta Vista是飽學之士(The Motley Savant)。

如果您向一位博學多聞的學者請教一個問題,肯定不會失望,一定可以得到很多豐富的資訊。沒錯,Alta Vista正是如此,因為Alta Vista建有超大型的網頁索引資料庫,可以滿足使用者完整搜尋的需求,所以無論您丟什麼關鍵字給Alta Vista,都可以得到不少的結果;實在一點的說法是,大多數時候所得到的查詢結果是超乎您想像的多。

資料庫夠大是Alta Vista的優點,也是缺點。因為利用搜尋引擎找資料,不在找到的資料量多,而在相關度高。想想看在這麼大的資料庫中如何找到符合需要的資訊,每個搜尋引擎都有一套相關性的計算方法,Alta Vista也不例外,而且迭有更新。最新推出的raging search就結合傳統的相關性分析方法和連結分析來判斷查詢結果。

總言之,Alta Vista是完整蒐集各方面資訊的很好選擇,但是如果希望找到的是較為精準的資訊,不妨試試其他的搜尋引擎。

Excite是導遊(The Concierge)。

當您問飯店旅遊櫃台的先生,這個城市有何可看之處,他會先瞭解您有興趣的是美術館還是登山,再提供您建議。

Excite正是這樣,不只是將使用者輸入的查詢字詞到資料庫做比對,更嘗試瞭解使用者的資訊需求,分析查詢策略,做概念對映(concept match)。所以,Excite在查詢有關事件、地名、公司機構或是球隊等團體資訊時,最是好用。

當我們需要人工智慧提供查詢建議時,Excite確實可以發揮最高效益,若只是做一般關鍵字查詢,還是試試其他的搜尋引擎吧!

Hotbot是人氣先生(Mr. Popularity)。

HotbotAlta Vista一樣,建有大型資料庫,不同的是Hotbot查詢結果之前列有Top 10 sites,這十筆不是最符合查詢策略的資料,卻是最受歡迎的十筆熱門資訊。Hotbot是利用Direct Hit人氣引擎(Popularity engine)的技術,來找出這十個最熱門的網頁。基本假設是越受歡迎的連結其內容越相關,所以是以連結點閱的次數計算相關性。下次用Hotbot時,別忘了進Top 10 sites去看一下同好們都點閱那些網頁。

但是每個人的興趣需求各不相同,除了十大熱門網頁外,Hotbot更提供既深入又廣泛的資訊,是完整搜尋的好工具。所以,如果您不僅想要找相關的資訊,更想知道別人都逛那些網頁,Hotbot是不錯的選擇。

Go(Infoseek)是參考館員(The Reference Librarian)。

Go(Infoseek)就像是圖書館的參考館員,無論您問多麼困難多麼模糊的問題,她都可以提供很豐富的資訊來源,而且有很多是您壓根兒沒想到的。Go提供兩種查詢結果,一個是人工評選的網站指南,另一個是相關網頁。Go會將同一網站的網頁聚集,只顯示一筆,以more result from URL來進一步顯示,也提供結果再查詢(search within results)的功能,就像參考館員在一旁建議如何縮小查詢範圍以得到更精確的資訊。所以,如果您還沒有慣用的搜尋引擎,也許可以試試Go

Lycos是機器人(Part Man, Part Machine)。

Lycos是老資格的搜尋引擎之一,由傳統的機器自動編制的索引經由Open Directory計畫轉型為人工編輯的指南。換句話說,Lycos的查詢結果是由編輯親自檢視分類的網頁。人工分類還是比電腦分類來得強,所以Lycos的查詢結果通常會比其他搜尋引擎要令人滿意。所以,如果您希望查詢結果能依照專家編輯的主題分類來呈現,Lycos是您可以嘗試的選擇。

Yahoo則是收藏家(The Eccentric Collector)。

Yahoo是網站指南,意味著其內容完全是由編輯人工檢視歸類的。可以很方便地沿著分類架構逐層瀏覽找到相關的網站。Yahoo的查詢服務是比對網站目錄中有沒有符合需求的分類主題,然後按分類架構條列出查詢結果。如果沒有辦法在分類目錄中找到符合的主題,Yahoo會自動切換去查 Inktomi 資料庫(類似Hotbot的資料庫),可以找到符合需求的網頁資訊,而且所查到的網頁遠超過Yahoo所建網站目錄下的網頁資訊。但是與Hotbot不同的事,Yahoo的查詢結果不會先列出熱門網頁。儘管Yahoo非常有名,但是其資料庫還是比其他搜尋引擎的規模小多了,而且連結的更新速度也不夠快。所以,Yahoo是想要某一特定主題有那些網站的好工具,卻不是完整資訊搜尋的好建議。

除了上述這六個搜尋引擎外,在國外頗受好評的Northern Light和第二代搜尋引擎的新寵Google,他們的個性又是如何呢?

Northern Light是學科專家。

如果Go(Infoseek)是參考館員,那麼Northern Light則是當之無愧的學科專家。Northern Light會將查詢結果依主題整理放在資料夾中,使用者可以按主題打開資料夾瀏覽相關資訊,而且每個網站只列出一筆,但是找到符合的網站時可以點選More results from this site來查看其他相關網頁,所運用的仍然是資料夾的主題聚集觀念。

Google專業顧問。

採用連結分析來計算查詢結果的相關度,查詢結果幾乎都能令使用者,甚至是剛好就是使用者想要找的資訊。就像是專業顧問根據顧客的需求量身訂做一般。 

[1]:Chris Sherman, "If Search Engines Were People, " Retrieved August 10, 2000 from the World Wide Web: http://websearch.about.com/internet/websearch/library/weekly/aa052199.htm

 

Top

 

授課教師:謝寶煖
  pnhsieh@ntu.edu.tw