回網路資源目錄
搜尋引擎–Google
Google
http://www.google.com/
Google是Stanford大學的兩位博士候選人Larry
Page和Sergy Brin在1998年開發成功的第二代搜尋引擎,其創新、超強的相關演算法,讓使用者覺得找到的正好就是所需要的,因而一推出就造成轟動。
Google這個字在普通字典上可能查不到,因為它是玩弄文字遊戲的結果,實際是googol的意思。而googol是指10的100次方,也就是1後面加上100個零,代表天文數字,而Larry和Sergy就是用google來表示網路資訊的浩瀚無邊。
Google目前索引了十億三千萬筆的網頁,在其英文版網站首頁中明確標示其所索引的網頁數量,也是唯一一家在首頁清楚標示其資料庫容量的搜尋引擎。
第一次進Google
如果你是第一次進Google,不妨觀察一下,當你連到網站主頁
(http://www.google.com)時,出來的是什麼畫面!
理論上貼心的Google會自動依domain
name的性質,判斷該使用者所使用的語言,然提供該語言的介面。所以大家進去看到的應該是中文畫面。
Google的首頁
這是我一定要好好介紹的。Google國際版的首頁非常的e世代!會因應全球或是美國的重要時事,而設計首頁圖案,因為最近沒有什麼特別的大事,所以大家看到的畫面是標準版。為了證明我沒有騙人,有興趣的同學可以連到我首頁上,看雪梨奧運時Google的精心傑作(奧運看Google)。
資料庫容量
Google在網站主頁上標示目前索引了十億三千萬的網頁,夠驚人了吧!這可是唯一一家在首頁清楚標示其資料庫容量的搜尋引擎,因為它的數量無人能敵,很多搜尋引擎是遍尋Help都找不到資料庫大小。不過這中間有點trick,因為Google是採用連結分析,所以有些網頁即使Google自己沒建庫,透過連結也可以搜尋到,但是這驚人的十億數字可以讓我們感受到網路資源的浩瀚無邊。(偷偷告訴大家,Search
engine Watch中說Google真正索引的網頁有六億,還是挺嚇人的)
查詢介面
Google有簡易查詢、進階查詢和分類目錄三種查詢介面。
Google的首頁簡單得讓人懷疑這真是傳聞中勇奪多項第一的搜尋引擎,然而簡明沒有眼花撩亂廣告的首頁正是第二代搜尋引擎的特色。Google的簡易查詢有不同語文的版本,可以依據連線電腦的國家代碼自動顯示該國語文的介面。Google雖然有中文介面,如果想要搜尋英文網頁(不管是國內還是國外),還是得輸入英文關鍵字才能找到;換句話說,介面是中文的,但是若要找的是英文資料,就得輸入英文關鍵字,要找中文就輸入中文關鍵字。當然輸入英文關鍵字,也可以找到國內網站中的英文網頁,換句話說,是以網頁語文為主,而是網站所在國家。
查詢功能
(一) 簡易查詢
Google網站首頁(http://www.google.com/)
可以直接連結到Google推薦的網頁,節省逐頁瀏覽查詢結果的寶貴時間。在查詢組織機構時最為好用,例如,想找台灣大學的網站,只要輸入「台灣大學」,然後點選「好手氣」按鈕,直接就連到台大的首頁。如果是一般的關鍵字查詢,「好手氣」會直接連結到編輯推薦的最適網頁,而這個最適網頁通常是經由連結分析所得最多人點閱的相關網頁。例如輸入"knowledge
management"點選「好手氣」,就可以連結到最多人推薦連結的知識管理網站WWW
Virtual Library on Knowledge Management (http://www.brint.com/km/)。所以,如果我們很確定每個組織或公司建有網站,只是我一時忘了它的網址時,就是利用Google好手氣的最佳時機。
(二) 國際中文版
Google國際中文版首頁 (http://www.google.com/intl/zh-TW/)
Google公司在2000年9月12日宣布推出繁體及簡體兩種中文版本,以支援全球中文的查詢服務,為中文搜尋引擎市場開闢新局面。
為了提供全球一致的搜尋服務,中文使用者可以由網站首頁(http://www.google.com)的語言設定,讓網頁內的指示和各種訊息都以繁體中文呈現。值得注意的是,Google將所有英文以外的語言版本都列為國際版,其網址是(http://www.google.com/intl/zh-TW/),而不是直接加上.tw。
中文版Googl中可以直接選擇欲查詢的語言,相當方便。但是其他的設定還是得回到網站首頁(http://www.google.com)去設定。
(三) 進階查詢
Google進階查詢
在首頁之查詢框左邊點選Advanced search或中文版的進階搜尋。
Google的進階查詢是表單式介面,可以限定網頁中要出現特定字詞,或是不出現特定字詞。也可以限定主機或領域名稱,可以指定語文。也可以根據網頁特性來查詢(Page-Specific
Search),如搜尋連結到某一特定網頁的所有網頁,或搜尋與某一網頁類似的所有網頁。
此外,Google也提供專業搜尋(Topic-Specific Search),如搜尋美國政府機構網站或是美國大學網站。
大學搜尋(Universities: Stanford, Brown, BYU, & more)可以搜尋各大學的共通資訊,如入學許可,也可以限定查詢範圍為某一大學的網站。所以,你想要出國嗎?妳想要遊學嗎?善用Google的大學搜尋,可一次找到各大學的入學申請、獎學金、課程、校友會等與大學相關的資訊,非常好用,搜尋速度快且資訊品質高。
(四) 查詢PDF檔
這是Google的另一項特殊功能,一般搜尋引擎是無法搜尋隱藏的PDF檔,Google則是預設查詢結果包含PDF檔案,在其結果中以[PDF]來表示,同時提供純文字版的選項[Text
version],相當方便。
如果你不想找PDF檔的話也沒有關係,只要在關鍵字之後空一格,打上
-inurl:pdf(還記得嗎?減號表示不要出現)就可以了。
例如::"knowledge management" -inurl:pdf
(五) 分類目錄(Web Directory)
Google之主題目錄 http://directory.google.com
Google之Web Directory是將Open
Directory Project的2萬名志工編輯所篩選的網頁,應用Google的檢索技術加以整理,再將結果依重要性排序呈現(亦提供傳統字順排列之選擇)。等於是結合主觀的人工判斷和客觀的排序演算法,所得的結果。
Google將每個主題之重要網頁列在最前面,以綠色長條圖表示其相關性程度,長條圖的綠色部份愈長,表示愈相關,是網友們認為值得一看的網頁。
Google Web Directory除了列出分類架構和細目之外,還提供Related
Category做交互參照,以Knowledge flow為例,除了在Reference大類下有相關資源外,在Business大類也可以找到。
只要輸入簡單的搜尋字詞就可以搜尋到相關的資訊。Google是預設以AND進行檢索,例如:輸入"cheap
airline tickets "所找到的資訊是三個字都同時出現在網頁中,而且三個字之間的距離越近,相關程度越高。所以,想要去西雅圖度假,只要輸入vacation
seattle就可以了。Google不區分大小寫,也不支援字根或切截功能。Google的另一項特色是結合網頁搜尋和精選網頁,所以輸入搜尋字詞後,按Google搜尋(Google
Search)是搜尋網頁資訊,如果按好手氣(I'm Feeling Lucky)就會出現精選網頁。
結果呈現
Google的查詢結果首先列出查詢結果顯示筆數、查詢結果總數、查詢詞彙和花費時間。查詢結果顯示筆數可以自行設定,可以選擇每頁顯示10、20、30、50或100筆,如果沒有設定Google的預設是每頁顯示10筆。然後列出分類架構(Category),可直接點選瀏覽分類目錄。每筆查詢結果顯示標題、摘要、網址、檔案大小、頁庫存檔和類似網頁查詢等項目。
Google查詢結果的呈現方式中,較具特色的是分類(Category)、頁庫備份(Cached)和類似網頁(Similar
Pages)。每筆查詢結果均列出其分類架構,可以作為放大或縮小查詢結果的參考,而且可以直接點選進入多層次之分類目錄瀏覽。各網站網頁之連結穩定性很難控制,有些網頁建索引時是有效的,可是網友上網查詢連結時卻失敗。此時,點選Cached可以顯示索引當時的有效網頁。Google
Scout技術可以搜尋類似的網頁,只要在查詢結果中點選Similar
Pages,就可以搜尋到相同的網頁。
頁庫存檔(cached)
是Google的特色。我們都知道搜尋引擎是派機器人(spider)到Internet上去拜訪網站,讀取網頁資訊,所以查詢結果中難免有些網頁在機器人去拜訪時還活得好好的,等到我們上Google查詢到它時,它卻已遭主人廢棄了,這時我們只能看著連結失敗的畫面惋惜。Google的設計者知道我們有這樣的遺憾,所以將機器人讀回來的網頁以Cached選項,提供連結,以備不時之需。所以頁庫存檔又稱為spider
version。這還有一個好處,如果上回上網看到的結果和今天不一樣,我們也可以選Cached,試試看spider
version更新了沒有,因為頁庫存檔資料多數時候是趕不上時時更新的網站的更新速度的。
對於撥接上網的使用者,如果您不很介意新穎性的話,頁庫存檔下載速度極快,常常比原始網站快很多,而且內容都有處理,查詢字詞都用不同的顏色標明;另外還有標題,包括存檔的複製時間及日期,提醒這只是存檔而已。是可以嘗試的快速下載資料的方法。
但是不是所有的網頁都有cached選項,因為有些網主會要求刪除存檔。
群組結果(Results clustering)
Google群組查詢結果,確保同一個網站的網頁不超過兩頁,想要瀏覽同一網站的更多網頁,請在第二頁點選More
results from XXXXV。
查找類似網頁(Find similar)
點選每筆查詢結果最後一項Google Scout,就可以查找類似網頁。
結果再查詢(Search within results)
其他特色