ê

網路資源概論

搜尋引擎(Search Engines)
搜尋引擎–Google
搜尋引擎–Openfind台灣網路資源搜尋
查詢結果

  回網路資源目錄

搜尋引擎–Google

Google
http://www.google.com/

Google是Stanford大學的兩位博士候選人Larry Page和Sergy Brin在1998年開發成功的第二代搜尋引擎,其創新、超強的相關演算法,讓使用者覺得找到的正好就是所需要的,因而一推出就造成轟動。

Google這個字在普通字典上可能查不到,因為它是玩弄文字遊戲的結果,實際是googol的意思。而googol是指10的100次方,也就是1後面加上100個零,代表天文數字,而Larry和Sergy就是用google來表示網路資訊的浩瀚無邊。

Google目前索引了十億三千萬筆的網頁,在其英文版網站首頁中明確標示其所索引的網頁數量,也是唯一一家在首頁清楚標示其資料庫容量的搜尋引擎。

 

第一次進Google

如果你是第一次進Google,不妨觀察一下,當你連到網站主頁 (http://www.google.com)時,出來的是什麼畫面!

理論上貼心的Google會自動依domain name的性質,判斷該使用者所使用的語言,然提供該語言的介面。所以大家進去看到的應該是中文畫面。

 

Google的首頁

這是我一定要好好介紹的。Google國際版的首頁非常的e世代!會因應全球或是美國的重要時事,而設計首頁圖案,因為最近沒有什麼特別的大事,所以大家看到的畫面是標準版。為了證明我沒有騙人,有興趣的同學可以連到我首頁上,看雪梨奧運時Google的精心傑作(奧運看Google)。

 

資料庫容量

Google在網站主頁上標示目前索引了十億三千萬的網頁,夠驚人了吧!這可是唯一一家在首頁清楚標示其資料庫容量的搜尋引擎,因為它的數量無人能敵,很多搜尋引擎是遍尋Help都找不到資料庫大小。不過這中間有點trick,因為Google是採用連結分析,所以有些網頁即使Google自己沒建庫,透過連結也可以搜尋到,但是這驚人的十億數字可以讓我們感受到網路資源的浩瀚無邊。(偷偷告訴大家,Search engine Watch中說Google真正索引的網頁有六億,還是挺嚇人的)

 

查詢介面

Google有簡易查詢、進階查詢和分類目錄三種查詢介面。

Google的首頁簡單得讓人懷疑這真是傳聞中勇奪多項第一的搜尋引擎,然而簡明沒有眼花撩亂廣告的首頁正是第二代搜尋引擎的特色。Google的簡易查詢有不同語文的版本,可以依據連線電腦的國家代碼自動顯示該國語文的介面。Google雖然有中文介面,如果想要搜尋英文網頁(不管是國內還是國外),還是得輸入英文關鍵字才能找到;換句話說,介面是中文的,但是若要找的是英文資料,就得輸入英文關鍵字,要找中文就輸入中文關鍵字。當然輸入英文關鍵字,也可以找到國內網站中的英文網頁,換句話說,是以網頁語文為主,而是網站所在國家。

 

查詢功能

(一) 簡易查詢

Google網站首頁(http://www.google.com/

Google in Your Language:

如果你進入的首頁是英文的國際版,只要點選畫面下方功能列之Google in Your Language,選擇Chinese(Traditional)(繁體中文),即可切換成中文的畫面。 

Preference:

每次都要再切換成中文實在太繁了,那就點選查詢框旁邊的Preference(偏好),就可以讓Google每次都按照你的喜好來為你服務。可以設定那些呢: 

  1. 介面語言:介面語言設定可以將Google的查詢介面設定成英文、繁體中文、簡體中文等15種語文,一經設定存檔後,Google就會以設定的語文來顯示網頁,包括查詢說明和各種訊息都是以設定的語文來顯示。所以中文使用者可以由網站首頁的語言設定,讓Google成為中文的搜尋引擎,詳見中文Google之說明
  2. 查詢語言:查詢語言設定可以限定Google只搜尋特定語言的網頁,如英文和繁體中文。
  3. 查詢結果呈現的筆數:查詢結果呈現的筆數可以設定為10、20、30、50、100;如果使用者沒有設定,Google的預設值是每頁呈現10筆查詢結果。
  4. 查詢結果是否另開視窗:勾選則查詢結果會另開一視窗,這樣就不能用瀏覽器的「上一頁」功能。好處是可以開多個視窗。
  5. 要不要過濾色情:那就由你自個兒決定囉!

上述設定一但存檔後(別忘了按右上角的 save preference),Google就會把它記起來,每次進Google,都會以所設定的語言來顯示和查詢資料。所以當您的資訊需求改變時,可得記得要重設,否則找到的資訊可能不符合您的需求。

好手氣(I'm Feeling Lucky)

可以直接連結到Google推薦的網頁,節省逐頁瀏覽查詢結果的寶貴時間。在查詢組織機構時最為好用,例如,想找台灣大學的網站,只要輸入「台灣大學」,然後點選「好手氣」按鈕,直接就連到台大的首頁。如果是一般的關鍵字查詢,「好手氣」會直接連結到編輯推薦的最適網頁,而這個最適網頁通常是經由連結分析所得最多人點閱的相關網頁。例如輸入"knowledge management"點選「好手氣」,就可以連結到最多人推薦連結的知識管理網站WWW Virtual Library on Knowledge Management (http://www.brint.com/km/)。所以,如果我們很確定每個組織或公司建有網站,只是我一時忘了它的網址時,就是利用Google好手氣的最佳時機。 

 

(二) 國際中文版

Google國際中文版首頁 (http://www.google.com/intl/zh-TW/)

Google公司在2000年9月12日宣布推出繁體及簡體兩種中文版本,以支援全球中文的查詢服務,為中文搜尋引擎市場開闢新局面。

為了提供全球一致的搜尋服務,中文使用者可以由網站首頁(http://www.google.com)的語言設定,讓網頁內的指示和各種訊息都以繁體中文呈現。值得注意的是,Google將所有英文以外的語言版本都列為國際版,其網址是(http://www.google.com/intl/zh-TW/),而不是直接加上.tw。

中文版Googl中可以直接選擇欲查詢的語言,相當方便。但是其他的設定還是得回到網站首頁(http://www.google.com)去設定。

 

(三) 進階查詢

Google進階查詢

在首頁之查詢框左邊點選Advanced search或中文版的進階搜尋。

Google的進階查詢是表單式介面,可以限定網頁中要出現特定字詞,或是不出現特定字詞。也可以限定主機或領域名稱,可以指定語文。也可以根據網頁特性來查詢(Page-Specific Search),如搜尋連結到某一特定網頁的所有網頁,或搜尋與某一網頁類似的所有網頁。

此外,Google也提供專業搜尋(Topic-Specific Search),如搜尋美國政府機構網站或是美國大學網站。

大學搜尋(Universities: Stanford, Brown, BYU, & more)可以搜尋各大學的共通資訊,如入學許可,也可以限定查詢範圍為某一大學的網站。所以,你想要出國嗎?妳想要遊學嗎?善用Google的大學搜尋,可一次找到各大學的入學申請、獎學金、課程、校友會等與大學相關的資訊,非常好用,搜尋速度快且資訊品質高。

 

(四) 查詢PDF檔

這是Google的另一項特殊功能,一般搜尋引擎是無法搜尋隱藏的PDF檔,Google則是預設查詢結果包含PDF檔案,在其結果中以[PDF]來表示,同時提供純文字版的選項[Text version],相當方便。

如果你不想找PDF檔的話也沒有關係,只要在關鍵字之後空一格,打上 -inurl:pdf(還記得嗎?減號表示不要出現)就可以了。

例如::"knowledge management" -inurl:pdf

 

(五) 分類目錄(Web Directory)

Google之主題目錄 http://directory.google.com

Google之Web Directory是將Open Directory Project的2萬名志工編輯所篩選的網頁,應用Google的檢索技術加以整理,再將結果依重要性排序呈現(亦提供傳統字順排列之選擇)。等於是結合主觀的人工判斷和客觀的排序演算法,所得的結果。

Google將每個主題之重要網頁列在最前面,以綠色長條圖表示其相關性程度,長條圖的綠色部份愈長,表示愈相關,是網友們認為值得一看的網頁。

Google Web Directory除了列出分類架構和細目之外,還提供Related Category做交互參照,以Knowledge flow為例,除了在Reference大類下有相關資源外,在Business大類也可以找到。

只要輸入簡單的搜尋字詞就可以搜尋到相關的資訊。Google是預設以AND進行檢索,例如:輸入"cheap airline tickets "所找到的資訊是三個字都同時出現在網頁中,而且三個字之間的距離越近,相關程度越高。所以,想要去西雅圖度假,只要輸入vacation seattle就可以了。Google不區分大小寫,也不支援字根或切截功能。Google的另一項特色是結合網頁搜尋和精選網頁,所以輸入搜尋字詞後,按Google搜尋(Google Search)是搜尋網頁資訊,如果按好手氣(I'm Feeling Lucky)就會出現精選網頁。

 

結果呈現

Google的查詢結果首先列出查詢結果顯示筆數、查詢結果總數、查詢詞彙和花費時間。查詢結果顯示筆數可以自行設定,可以選擇每頁顯示10、20、30、50或100筆,如果沒有設定Google的預設是每頁顯示10筆。然後列出分類架構(Category),可直接點選瀏覽分類目錄。每筆查詢結果顯示標題、摘要、網址、檔案大小、頁庫存檔和類似網頁查詢等項目。

Google查詢結果的呈現方式中,較具特色的是分類(Category)、頁庫備份(Cached)和類似網頁(Similar Pages)。每筆查詢結果均列出其分類架構,可以作為放大或縮小查詢結果的參考,而且可以直接點選進入多層次之分類目錄瀏覽。各網站網頁之連結穩定性很難控制,有些網頁建索引時是有效的,可是網友上網查詢連結時卻失敗。此時,點選Cached可以顯示索引當時的有效網頁。Google Scout技術可以搜尋類似的網頁,只要在查詢結果中點選Similar Pages,就可以搜尋到相同的網頁。

頁庫存檔(cached)

Google的特色。我們都知道搜尋引擎是派機器人(spider)到Internet上去拜訪網站,讀取網頁資訊,所以查詢結果中難免有些網頁在機器人去拜訪時還活得好好的,等到我們上Google查詢到它時,它卻已遭主人廢棄了,這時我們只能看著連結失敗的畫面惋惜。Google的設計者知道我們有這樣的遺憾,所以將機器人讀回來的網頁以Cached選項,提供連結,以備不時之需。所以頁庫存檔又稱為spider version。這還有一個好處,如果上回上網看到的結果和今天不一樣,我們也可以選Cached,試試看spider version更新了沒有,因為頁庫存檔資料多數時候是趕不上時時更新的網站的更新速度的。

對於撥接上網的使用者,如果您不很介意新穎性的話,頁庫存檔下載速度極快,常常比原始網站快很多,而且內容都有處理,查詢字詞都用不同的顏色標明;另外還有標題,包括存檔的複製時間及日期,提醒這只是存檔而已。是可以嘗試的快速下載資料的方法。

但是不是所有的網頁都有cached選項,因為有些網主會要求刪除存檔。 

群組結果(Results clustering)

Google群組查詢結果,確保同一個網站的網頁不超過兩頁,想要瀏覽同一網站的更多網頁,請在第二頁點選More results from XXXXV。 

查找類似網頁(Find similar)

點選每筆查詢結果最後一項Google Scout,就可以查找類似網頁。 

結果再查詢(Search within results) 

其他特色

Google Tootbar(http://toolbar.google.com/) 

可以把Google按鈕加到瀏覽器的工具列上。在網路漫遊時,你可以隨時利用Google的搜尋引擎檢索網路資料,只要在輸入框內鍵入欲查詢字即可。如果是要搜尋網路上的資料,請按Search;若只是要檢索目前所在網站內的資料,則請點選Search site。可惜,此功能目前並不支持中文檢索。

PageRank是Google用來衡量網頁相關性的技術,主要是利用連結的次數(對外連結及被其他網頁連結)來決定。長條圖的綠色愈長,表示網頁相關性愈高,值得一看。

Page Info則能提供你更多關於目前正在瀏覽網頁的相關資訊。共提供三種功能:

  1. Cached Version of Page:讓你瀏覽當初Google機器人造訪該網站所讀取回來的網頁。
  2. Similar Pages:找到類似網頁。
  3. Backward Links:讓你知道有那些網頁連結至目前瀏覽的網頁

點選Up能讓你快速連結到上一層目錄,例如目前你所瀏覽的網頁是:http://www.ntu.edu.tw/new-version/chinese/Administration/A400000/A400000.html,點選Up,網頁就可以連接到http://www.ntu.edu.tw/new-version/chinese/Administration/A400000/,再點一次,則是連結到http://www.ntu.edu.tw/new-version/chinese/Administration/。

Highlight則能讓你選擇要不要在網頁上把所搜尋的字用黃色註記。只要把要註記的文字鍵於輸入框後點選Highlight即可。

你也可以利用Google Toolbar搜尋畫面上資料,同樣在輸入框內輸入欲查詢的文字後,點選工具列最右方的功能(如圖示standford)即可。

點選畫面左方的Google圖示,即可連結到Google首頁,並可利用下拉選單選擇要切換到進階查詢畫面或是分類目錄。

個人化Google 

Google可以按照個人偏好來設定查詢介面和功能,這是Google的特色,也是讓Google真正發揮最大效益的方法。

Google提供過濾功能(Safe Search Filtering)篩檢色情資訊,Google也可以設定顯示語文和搜尋語文,包括繁體中文和簡體中文。

 

Top

 

授課教師:謝寶煖
  pnhsieh@ntu.edu.tw