ê

整合式搜尋引擎

整合式搜尋引擎
完整搜尋之整合式搜尋引擎–Dogpile
完整搜尋之整合式搜尋引擎–Copernic

回網路資源目錄

整合式搜尋引擎

整合式搜尋引擎,英文名稱很多,如meta search engines、paralell search engines、multithreaded search engines、mega search engines[1]、"all-in-one" search sites。

綜合性搜尋引擎,如 Alta VistaGoogle 等,都是查詢自建的資料庫,輸入相同的關鍵字,每個搜尋引擎送回來的結果都不一樣。一般而言,不同搜尋引擎所得到的查詢結果中約有60﹪的資料是相同的,而有40﹪是完全不同的。由於每個搜尋各有專擅,且資料庫大小不一,所以使用者都會利用兩個以上的搜尋引擎來蒐集資訊。因此,整合式搜尋引擎確實有其存在價值。

整合式搜尋引擎就是要節省使用者一一連結到不同搜尋引擎中一一鍵入關鍵字的時間,提供多個搜尋引擎的查詢服務,只要鍵入一次查詢策略就可以得到多個搜尋引擎的查詢結果,而且將查詢到的結果剔除重複再呈現在螢幕上,確實是值得推薦的網路資源搜尋工具。

整合式搜尋引擎有方便好用的優點,也有缺點。首先,整合式搜尋引擎所查到的結果通常是該搜尋引擎能查詢到的一小部分而已。換句話說,整合式搜尋引擎送回來的查詢結果顯示某個搜尋引擎是0筆時,並不表示那個搜尋引擎資料庫中真的沒有符合的資訊。這種情況可能是幾個原因造成的。首先整合式搜尋引擎會限定每個搜尋引擎的查詢時間,時間到就切斷連結停止查詢,然後將查詢結果回報,因此回報呈現的筆數可能遠少於實際可查得的筆數。整合式搜尋引擎也會限定每個搜尋引擎查詢的筆數。此外,整合式搜尋引擎能否正確地將查詢策略轉譯成各個搜尋引擎的查詢語法,也是查詢結果多寡與精確程度高低的重要因素。整合式搜尋引擎必須到不同搜尋引擎去查詢資料,而每個搜尋引擎可以支援的查詢功能不同,所以整合式搜尋引擎沒辦法提供複雜查詢功能,通常只有布林邏輯和片語查詢。所以,整合式搜尋引擎只有在使用者能夠很明確地定義關鍵字或片語時,才能真正發揮效益。

新一代的整合式搜尋引擎,如 Dogpile 等,已經針對上述問題提出解決方案,透過選項的方式讓使用者自行設定欲搜尋的搜尋引擎(甚至是搜尋的優先順序)、搜尋的時間以及搜尋的筆數。

 

一、整合式搜尋引擎的種類

我們可以進一步依搜尋深度將整合式搜尋引擎分成三大類:

  1. 選擇性搜尋之整合式搜尋引擎:
    通常會限制每個搜尋引擎查詢的時間或筆數,適合做探索性的搜尋。
    例:BriefingIxquickMetaCrawlerProFusion網路燈塔搜尋引擎集成
  2. 完整搜尋之整合式搜尋引擎:
    通常不會限制每個搜尋引擎查詢的時間或筆數,可以完整地搜尋各個搜尋引擎。
    例:DogpileCopernic
  3. 整合式搜尋引擎之分類目錄:
    按照主題類目聚集專業的搜尋引擎。
    例:Search.com、The BigHub.com、USE IT!

目前普受矚目的整合式搜尋引擎中,只有 DogpileProFusion 可以完整地查詢各個搜尋引擎,不會因為時間或筆數限制而漏失掉有用的資訊。然而除了網路版的整合式搜尋引擎外,另有一種下載型的整合式搜尋引擎亦不容忽視。Copernic(http://www.copernic.com/)可說是下載型整合式搜尋引擎的翹楚,將程式下載到個人電腦加以安裝,不僅可以依個人興趣專長設定欲查詢的搜尋引擎,更可以依個人喜好設定查詢結果的排序與呈現方式。如果是付費的版本還可以設定Track持續追蹤相關主題的網路資源,掌握最新資訊。接下來就依前述準則介紹較具特色的幾個整合式搜尋引擎。

 

二、整合式搜尋引擎的選用

整合式搜尋引擎量不在少數,由 Yahoo!的分類可以看到119個All-in-One Search Page網站,只是很多只能算是搜尋引擎集成,也就是說只是將各個搜尋引擎的查詢框(search boxes)剪貼在一起,方便使用者點選查詢,而不用一一連結,如網路燈塔搜尋引擎集成

有些整合式搜尋引擎蒐集了數十個搜尋引擎,其規模大小不一,從時間和成本效益的角度來看,不見得蒐集的搜尋引擎愈多就是好,應進一步了解其所蒐集搜尋引擎的規模與特色。我們應該怎樣判斷整合式搜尋引擎的適用性呢?下列因素可以做為選擇時的參考:

所涵蓋的搜尋引擎。只收錄搜尋引擎,還是包括分類目錄和專業搜尋引擎?
一次可以同時查詢的搜尋引擎個數。可不可以自行指定欲查詢的搜尋引擎和查詢的優先順序順序?
轉譯複雜查詢策略的能力。是否能夠成功地將片語和布林邏輯轉譯成各搜尋引擎可辨讀的查詢語法?
每個搜尋引擎查詢結果的筆數限制。大部份的整合式搜尋引擎是預設查詢十筆,可不可以自行設定查詢的筆數?最多可以設定多少筆?可不可以不限制筆數做完整查詢?
每個搜尋引擎查詢時間的限制。整合式搜尋引擎為發揮效率,通常會設定每個搜尋引擎查詢的時間,如果時間到即切斷連結,將所查得的筆數回饋為查詢結果。可不可以自行設定查詢的時間多寡,或者是要求沒有回饋的搜尋引擎再查詢一次?通常每個搜尋引擎的查詢時間只有幾秒鐘,頂多只能查詢到搜尋引擎資料庫10﹪的結果,僅能做為探索性搜尋,判斷搜尋引擎的適用性。因此不宜以整合式搜尋引擎回饋的查詢結果為該搜尋引擎的完整查詢結果。
查詢結果呈現方式。有些整合式搜尋引擎是依搜尋引擎個別表列,有些則將所有查詢結果彙整後依相關程度或是主題分類表列。
查詢結果是否刪除重複?
查詢結果是否刪除無效連結?

[1] Laura Cohen, "Searching the Internet: Recommended Sites and Search Techniques,"
   <http://library.albany.edu/internet/search.html> (9 Mar. 2001)

 

Top

 

授課教師:謝寶煖
  pnhsieh@ntu.edu.tw