ê

網路資源概論

網路資源何其多
網路資源如何找
分類目錄 vs 搜尋引擎
網站分類
實用查詢技巧

回網路資源目錄

實用查詢技巧

每個網路資源搜尋工具都會提供一些查詢功能,幫助我們找到更精確的資源。如果我們在上網找資料前能先瞭解這些基本的查詢概念和術語,可以更快速更有效率地利用各式各樣的網路資源搜尋工具和搜尋引擎,來找到所需的資訊。

 

常用的查詢技巧

1.   自然語言查詢

如果上網找資料也能像與人對話一樣,直接以英文陳述句或問句來表達資訊需求,對使用者來說,應該是最直接最自然的。自然語言查詢就是利用智慧代理分析使用者輸入的問句,粹取關鍵字並判斷關鍵字間的布林關係,再送到搜尋引擎資料庫進行查詢比對,再回饋查詢結果。

目前有很多搜尋引擎都提供自然語言查詢,有些是利用Ask Jeeves來提供自然語言查詢。大部分搜尋引擎是以問句來區別一般查詢或自然語言查詢,所以問號是千萬不能省略!以Alta VistaGoogle為例,輸入「Where is a good place to stay in Seatle?」,查詢結果會顯示忽略不列入搜尋的頻繁字彙(stop words)。

 

 

2.   關鍵字查詢

請選用名詞做為關鍵字。形容詞和副詞可以修飾名詞,那是在寫文章時,上網搜尋資料請愛用名詞。而且只要選用精確的名詞就好了,不必要加上形容詞和副詞來製造霧堿搌嶊漁蘆G。例如:想要上網找有關彼得兔的資料,請直接輸入「彼得兔」,不用很辛苦的輸入「超可愛的彼得兔」。因為搜尋工具的原理是將輸入的關鍵字送到資料庫中去比對。比對的方式有兩種:AND,完全符合,每一個字都出現才算符合;第二種是OR,部份符合,只要輸入的關鍵字中任一個出現都算符合。加上形容詞修飾的查詢結果會如何,看倌何妨自己上網試試看!您就會發現為什麼搜尋工具想的總是和我們有些許出入。

到底一次該輸入多少個關鍵字呢?有人說最多不要超過八個。輸入的關鍵字愈多,表示搜尋工具要執行的比對愈多,我們就等愈久才能看到查詢結果。如果可以善用往後課程中介紹的各項查詢技巧的話,關鍵字可以是三個不算多,五個不算少。

 

3.   預設OR

有些搜尋引擎如Alta VistaExciteGo (Infoseek)GoToWebCrawler等,當使用者輸入兩個以上的字詞時,是預設以OR來結合這兩個查詢字詞。如果輸入knowledge management,則搜尋到的結果最前面的是在網頁中同時出現knowledgemanagement兩個字的,其次則是有出現knowledge或是有出現management的網頁。換句話說,直接輸入關鍵字查詢預設OR的搜尋引擎,所得到的查詢結果會很多,但是精確度則較低。所以,如果是利用預設OR的搜尋引擎查詢資料時,應善用接下來要介紹的查詢策略來提高查詢結果的精確度。但是如果輸入關鍵字的同義異詞,進行完整搜尋時,只要直接輸入關鍵字即可。

既然搜尋工具的運作原理是關鍵字比對,想當然耳,搜尋工具是完全沒有同義字詞的觀念(少部份概念查詢和支援同義字查詢的搜尋引擎除外)。所以如果我們輸入「台大」,有些搜尋工具是找不到「台灣大學」、或是NTU、National Taiwan University的。這時為了要完整地蒐集相關資訊,就得它傻瓜我聰明,把所有的同義字都列出來,以OR連結進行搜尋。

 

4.   預設AND

有些搜尋引擎,如GoogleHotBotNorthern Light等,則是預設AND,將使用者輸入的關鍵字以AND組合查詢,如果輸入knowledge management,則查詢結果中必須是knowledgemanagement同時出現在網頁中才算。換句話說,預設AND的搜尋引擎,查詢結果精確度較高,資料量相對較少。

 

5.   +包含

只要在關鍵字前加上個加號(+),就表示這個關鍵字一定要出現在查詢結果中。例如:+clinton +lewinsky,就表示找到的網頁中要有小柯也要有魯文斯基。所以,+號可以提高查詢結果的精確度。

6.   -不包含

只要在關鍵字前加上個減號(-),就表示這個關鍵字一定不可以出現在查詢結果中。例如:+clinton lewinsky,就表示找到的網頁中要有小柯,但是不要有魯文斯基。所以,-號可以排除不相關的資料,提高查詢結果的精確度。  

 

7.   片語查詢

有人會誤以為利用搜尋工具查詢資料只能輸入單字,其實很多時候輸入片語查詢的結果更為精確。片語查詢(Phrase Searching)是一項很好用但常常被忽略的查詢策略。將兩個以上的關鍵字加上引號,當做片語來查詢可以縮小查詢範圍,找到更精確的資訊。搜尋引擎執行片語查詢時,是依照輸入字詞的文字順序,找到完全符合的字詞。例如:輸入"knowledge management"(搜尋引擎通常是以引號代表片語查詢),只會找到knowledge management兩個關鍵字緊臨出現的相關資訊,而不會找management knowledge,也不會找只有knowledge、只有knowledge的資料,更不會找到knowledgemanagement距離遙遠的資訊。但,並不是每個搜尋引擎都提供片語查詢的功能!

有些搜尋引擎,如 GoogleAlta Vista,為提高查詢結果的精確度,則是採用自動片語查詢,只要使用者輸入兩個以上的關鍵字,即自動去比對自建之片語字典,如果比對成功就執行片語查詢,如果比對失敗就執行一般查詢。

大家都知道中文電腦化最麻煩的就是斷詞,「下雨天留客天」是中文之美,可是要用電腦查詢時就不那麼美了。因為中文不像英文有單字的觀念,所以只要輸入關鍵字,搜尋工具就會逐一比對輸入的每個字,片語查詢就剛好可以用來做斷詞,告訴搜尋工具「"泰迪熊"」是一個名詞,只有三個字按順序一起出現才算符合。中文搜尋工具有些是以引號有些是用空格來做斷詞,請參考往後課程內容介紹或是各搜尋工具之說明。

 

8.   近似查詢

近似查詢(Proximity Searching)是透過限定兩個關鍵字之間的距離來縮小查詢範圍。大部份搜尋引擎是以NEAR來執行近似查詢,例如:輸入knowledge NEAR management的意思是,knowledgemanagement中間最多可以夾若干個單字,每個搜尋引擎的預設值不同,有些是5個單字,有些是10個單字。

項功能在執行網頁全文檢索時特別好用。因為用布林邏輯AND可能限制太多,找不到資訊;用OR又可能太鬆,找到完全沒有相關的資料。近似查詢剛好介在兩者之間,可以視關鍵字之間的出現關係,限定關鍵字之間出現的距離,查到較多、較相關的資訊。

有些搜尋引擎沒有提供片語查詢,而有近似查詢時,更可以近似查詢來發揮片語查詢的功能,例:solar NEAR energy。在人名查詢時也很好用,有近似查詢功能時(如Lycos的進階查詢),在名與姓中間加NEAR/2,提供更大的彈性查詢不同寫法的人名,例如:輸入George Near/2 Bush,搜尋引擎會將各種寫法一網打盡,查詢:

George Bush

George Herbert Walker Bush

Bush, George

 

9.   欄位查詢

網頁是由數個部份所組成的,包括標題、URL、文本、連結、圖像等,因此有些搜尋引擎提供欄位查詢(Field Searching)的功能,不僅提高查詢結果的精確度,節省查詢時間,更提供網站管理者和使用者很多寶貴的資訊。前面所介紹的各項查詢策略都是查詢網頁,如果能針對網頁標題進行查詢,精確度肯定更高,因此很多搜尋引擎便提供標題查詢的功能,例如:輸入title:knowledge management,表示查詢網頁標題中有出現knowledge management這兩個關鍵字的網頁,如果輸入title:”knowledge management”,則是表示查詢網頁標題中有出現knowledge management這個片語的網頁。

目前以Alta Vista之欄位查詢功能最為強大,茲以AltaVista為例,說明欄位查詢之功能。

anchor:text

查詢網頁中包含特定字或片語的超連結(hyperlink)

例:anchor:“click here to visit gardon.com”

可以找出有提供超連結到gardon.com的所有網頁。利用此功能可以知道有多少網頁超連我們所建的網站。

applet:class

限定查詢含特定Java applet的網頁。

例:applet:morph

可以找到有利用變形技術morph applet的所有網頁。

domain:domainname

限定查詢特定領域名稱的網頁。

domain:tw可以找台灣的網頁。

domain:edu可以限定只查詢教育單位的網站,在查詢課程或入學相關資訊時非常有用。

host:name

限定查詢特定電腦主機的網頁。

例:host:www.moe.edu.tw只找教育部主機的資料。

image:filename

限定查詢特定的影像檔。

Image:teddy bear可以找到有泰迪熊圖片的網頁。

like:URL text

查詢與指定的URL相似或相關的網頁。

例:like:www.abebooks.com

可以找到和abebooks一樣的網路上的舊書店。

例:like:www.lib.nccu.edu.tw可以找到和政治大學圖書館一樣的大學圖書館網站。

link:URL text

查詢連結到指定URL的網頁。

例:link:www.lib.nccu.edu.tw

可以找到所有連結到政治大學圖書館網站的網頁。

text:text

限定查詢含有特定詞彙的網頁,剔除影像檔的說明、連結或URL中出現該特定詞彙。

例:text:knowledge management

可以找到有出現knowledge management這個字的網頁。

title:text

限定查詢文章標題中含有特定詞彙的網頁。

例:title:knowledge management

可以找到文章標題有出現knowledgemanagement的網頁。

例:title:"knowledge management"

可以找到文章標題有出現knowledge management片語的網頁。

註:Yahoo是以t:來執行網頁標題檢索。

url:text

限定查詢URL中含有特定字詞的網頁。

例:url:knowledge 

可以找到完整的URL中有出現knowledge的網頁,換句話說:可能是主機名稱,路徑名稱或是檔案名稱中有出現knowledge的都符合。

 

10.   布林查詢

當我們上網找資料時應該已經很清楚自己想要找的資訊是什麼,這時可以先釐出幾個重要概念,或者是關鍵字和片語,再善加利用布林查詢(Boolean Searching)來找到更精確相關的資訊。

布林查詢是利用布林運算式(Boolean Expression)將我們要查詢的範圍明確地加以縮小或擴大,使查詢出來的結果更加準確。換句話說,當我們上網找資料時,要打進兩個以上的關鍵字做為查詢字串時,就應該考慮是不是可以加入『AND』、『OR』、『NOT』的運算元,以增加查詢的精確度。每個搜尋引擎通常會有自己獨特的語法或符號(如&|)來執行布林運算,可以從Help中找到正確的使用方法。

¨        AND,是「且」的意思。所以在兩個關鍵字中加上AND,可以縮小檢索範圍,得到較精確的結果。例如:花木蘭AND迪士尼,可以找到與迪士尼電影花木蘭相關的資訊;dogs and cats,可以找到同時介紹貓和狗的資訊。
當我們所要查詢的關鍵字或是概念,在不同學域或行業有不同的意義時,可以用AND來界定範圍。

¨        OR,是「或」的意思。所以在兩個關鍵字中加上OR,可以擴大檢索範圍,得到較多、較廣泛的結果。例如:綠島OR蘭嶼,可以找到與綠島有關的資訊,也可以找到與蘭嶼有關的資訊,更可以找到同時介紹綠島和蘭嶼的資訊。
通常為了將相關資料一網打盡,我們會在同義詞之間加上OR來查詢,例:台灣OR福爾摩沙。而有些搜尋引擎就是預設以OR來執行兩個以上關鍵字的查詢,所以如果我們希望輸入的兩個關鍵字是要同時出現在網頁或索引中,應該用AND連接。

¨        NOT,是「非」的意思。所以關鍵字之前加上NOT,表示要剔除有關該關鍵字的資料。例如:台灣NOT台北,會找到台北以外的有關台灣的資料。
當我們以較大範圍的關鍵字或概念進行查詢,發現有不相關的小範圍關鍵字或是概念時,可以用NOT來釐清,例:寵物NOT貓。或者是兩個關鍵字或是概念經常並列談論,但我們只想研究其中一個概念時,也可以用NOT來剔除沒有興趣的概念,例:狗NOT貓。

11. 切截查詢(truncation searching)

若以英文關鍵字查詢,經常面臨單複數和字型變化的問題,切截查詢(Truncation Searching)就是利用萬用字元(wild card symbol)來幫我們克服這樣的問題,一次查詢同一個字根不同的變形字。搜尋引擎通常是以*來執行切截查詢,

例如輸入bank*

可以查到:bank

                    banks

                    banking

                    bankers

                    bankruptcy

每個搜尋引擎可能用不同的語法或符號來執行切截的功能,例如:bank*bank!bank#bank$,可以利用Help來確定。

中文搜尋則可以用切截功能來查詢機構名稱的變異或是相關的資訊,例:輸入「*管理*研究所」,可以找到所有與管理相關的研究所,如資訊管理、企業管理、傳播管理或是管理科學。輸入「研**會」,則可以找到「研考會」、「研究發展考核委員會」,將團體機構的簡稱與全稱一網打盡。

12.  大小寫相異

有些搜尋引擎是以單字的字首大寫來區辨專有名詞。例如:輸入Bill Clinton就只會找到有關柯林頓總統的資訊,如果輸入bill clinton,則所找到的就不見得是柯林頓總統的資料了,還可以找到一些不相關的資訊。

13.  模糊查詢

模糊查詢(Fuzzy Searching)是當使用者輸入一個關鍵字時,搜尋引擎不僅查詢所輸入的關鍵字,同時也自動去查詢與所輸入關鍵字意義相同的字詞。有些西文搜尋引擎可以自動查詢單複數或是英美不同的拼法,以及過濾掉一些頻繁字彙(stop words)再進行查詢。中文搜尋引擎的模糊查詢大概就屬同音和容錯功能的發揮。

¨        同音:中文字輸入的一大困擾是,用注音輸入常會有同音的錯別字發生,還有很多時候,我們會唸但是不確定怎麼寫時,同音功能就可以幫我們解決這樣的問題。例如:我們可以試試看「沙士比亞」或「精成武」。對了,利用同音查詢外國人名或地名的翻譯,效果很不錯的。

¨        容錯:有點類似以自然語言檢索,系統會自動過濾掉某些字,如"""為何"…,並以其他輸入字詞進行檢索。甚至有些中文搜尋引擎可以執行概念查詢,例如輸入AIDS,不僅可以查到AIDS,還可以查到免疫不全症候群等相關資訊。

14.  限定範圍查詢

有些搜尋引擎更進一步提供限定範圍查詢的功能,以限定日期、資料類型、語文等方式來縮小檢索範圍,以得到更精確、更符合需求的資訊。通常當我們找到的資料量太大時,就可以進一步利用限定查詢的方法來過濾掉不相關的資料類型或語文,或者所需的資訊有時間性時,亦建議採用限定查詢功能。搜尋引擎提供的限定範圍有:

¨        語文:限查詢特定語文的資料,大部份的搜尋引擎,尤其是表單選項式的搜尋引擎都提供限定語文查詢的功能,如果我們不是要了解某一主題的全球發展趨勢,建議每次查詢都能限定語文,甚至是在個人化時即設定查詢的語文。。

¨        日期:有些搜尋引擎提供日期範圍的選擇,可以將查尋範圍縮小到特定日期之內,如Hotbot可以限制查詢上星期、上兩星期、上個月、上三個月、上六個月、前一年、前兩年的資訊。。這種方法可以知道搜尋引擎的資料更新頻率有多快,例如限定搜尋最近一個月的資訊,如果搜尋引擎找不到,那就表示該搜尋引擎資料庫的更新速度太慢了。但是網頁的日期資訊並不可靠,一般搜尋引擎是以最近更新日期為日期。

¨        分類:僅針對特定的主題分類進行查詢,大部份的搜尋引擎和網站分類指南都提供這項功能。

¨        地域:可以針對某一地區或國家進行查詢。有些搜尋引擎則是針對不同地區或國家設計個別的搜尋引擎,如Yahoo就有Local Yahoo!s

¨        網站類型:可以限制只查詢wwwFTPBBSGopherUsenet等。

¨        領域名稱:可以僅查詢政府網站(.gov)、教育學術網站(.edu)、商業網站(.com)、非營利機構網站(.org)等。

¨        資料類型:可以限制搜尋文本、圖形、影像、聲音等不同資料類型。

關鍵字的選擇

上網查資料不外是尋找有關某一個主題的相關資訊,所以搜尋成不成功,就決定於如何描述這個主題。換句話說,選擇適當的關鍵字是上網搜尋的關鍵。

大部份的使用者所選用的關鍵字都太少了。根據研究指出,大部份的人平均只輸入1.5個關鍵字,換句話說,很多人常常是只輸入一個關鍵字到搜尋引擎去查詢相關資料,想想看,以一個關鍵字去查詢上億的網頁資訊,豈不是大海撈針嗎?

就從現在開始,讓我們把上網搜尋當做一回事,好好想想關鍵字怎麼來,再上網吧!

 

5W1H

記者先生小姐們常用的5W(what、who、where、when、why、how),在構建關鍵字時是很有用的。

What:

有興趣的主題是什麼,可以從什麼角度或是立場來切入,把相關的關鍵字或是片語都列出來。例如,想要查詢有關AIDS的資料,是要從醫學的角度來探討?從心理學的角度來探討?還是從社會政策的角度來探討呢?同樣的,精卵捐贈是要從醫學的角度來探討?從法律的層面來考量?還是從倫理學的立場來省思?

Who:

是否涉及特定的群體或是個人?有特定的人名的話,請把人名也列出來,這個人名有沒有不同的寫法或是拼法?

Where:

是否限於特定的國家地區?台灣?亞洲?美國?很多搜尋引擎都可以地區或國家限定查詢範圍的。

When:

是否從特定的時間剖面來探討?或特定時間點以後才有的事件或情況?如果所查詢的資料有時間性,可忘了加上時間限制!

How:

是不是有特定的方法,有的話,也應將其列為關鍵字,有時在查詢結果太多時,可以關鍵字再查詢。例如:我們想要利用搜尋工具來查詢有關知識管理的定義,此時關鍵字就不只是「知識管理」、knowledge management,還應該把「定義」、definition也列為關鍵字。

Why:

這個研究主題有什麼重要的涵義或影響?為什麼會有這種現象發生?

由於查詢的問題和主題不同,當然不是每次的查詢,都會用到這5W1H,但是每次都把5個W和一個H想一遍還是比較保險。

 

Top

 

授課教師:謝寶煖
  pnhsieh@ntu.edu.tw