但是每個搜尋引擎所採用的相關性演算法不同,HotBot是以字詞出現的頻率和位置為主要考慮因素。Go(Infoseek)對出現在網頁標題和metatags,給予額外的權重。Lycos則是給予網頁標題和文件標題較高的權重,但是不考慮metatags。Excite甚至不索引metatags中的字詞。
大部分的搜尋引擎是根據上述準則建立相關性演算公式,排序查詢結果,不管有沒有相關性評分標示,幾乎都是相關性越高的排在越前面。所以,瀏覽搜尋引擎查詢結果時,查詢筆數的多寡並不是那麼的重要,重要的是前10筆、前20筆、前50筆是不是符合。如果50筆都不符合,就表示查詢策略值得檢討。值得注意的是,有些搜尋引擎(如Google)是採用連結分析,可能會發生一種情況,查詢結果可能不是那麼符合,但是文件中可以連結到其他非常符合的網站或網頁。
直接點閱(Direct Hit/Popularity Ranking)
有些搜尋引擎提供直接點閱熱門或精選網站的功能。這些搜尋引擎多半是根據網頁的點閱率等人氣指數來評選熱門網站。這項功能的基本假設是人氣指數,如果有一定數目的人執行與我們相同的搜尋,這些同好在搜尋之後,點閱率最高而且停留時間最久的網站,應該也是我們會感興趣的網站。HotBot的Top
10 Sites,就是根據人氣指數篩選出10個最相關的熱門網站。少就是美,10個優質相關網站的價值可能遠勝於成千上萬筆的查詢結果。而Google的「好手氣(I'm
Feeling Lucky)」則是精選網站。
直接到達(Real Names Results)
有些搜尋引擎提供"Real Names"連結,可以快速精確地找到公司機構的網站,是不錯的網站查尋服務。中文分類目錄蕃薯藤的更多搜尋中,可以選擇直接到達,執行Real
Name查詢,例如:要找政治大學,無論輸入政大、NCCU或政治大學都可以直接連結到政大的首頁。
群組結果(Results Clustering)
您是不是曾經經歷這樣的景象,在搜尋引擎的查詢結果中,一整頁其實都來自同一個網站。有些搜尋引擎為方便瀏覽,會先將查詢結果加以群組,以精簡查詢結果,增加查詢結果的可讀性和多元性。HotBot和Alta
Vista是每個網站只顯示一筆查詢結果,也可以選擇某一網站,瀏覽符合的所有網頁資料。Northern
Light則提供資料夾,將查詢結果依主題、資料類型、來源或語文加以群組。
顯示筆數
大部分的搜尋引擎是預設每頁顯示十筆,如果能一次看到更多筆不是更有助於判斷嗎?大部分的搜尋引擎在進階查尋或表單選項中,都會提供顯示筆數的特定功能。
顯示方式
有些搜尋引擎可以讓使用者選擇只要顯示網頁標題,或是連摘要一起顯示。是一個網站只顯示一筆資料,還是每筆都顯示。
檔案大小
有些搜尋引擎的查詢結果提供網頁的檔案大小,方便使用者超連結時參考。
顯示日期
有些搜尋引擎的查詢結果,除了網頁介紹外,還提供網頁的建置日期或更新日期。雖然網頁日期不全然可信,但是顯示日期不僅有助於判斷所查得資料的新穎性,更可以判斷搜尋引擎資料庫的更新速度。
每個搜尋引擎對網頁日期的處理方式不同。有些搜尋引擎對於沒有提供日期的網頁,一律以機器人拜訪該網頁的日期取代。有些搜尋引擎如Northern
Light則不顯示網頁日期。
Google並未在查詢結果中列出日期,但點選cached,可以知道機器人拜訪該網頁的日期。
分類目錄通常都不顯示網頁日期。其實如果能加上整理或更新的日期,對使用者也是很有用的。
依日期排序
聽起來很不錯,查資料總是希望能找到最新的資訊。但是日期在網路上可是個大問題,因為網頁日期應該有網頁建立日期和最近更新日期之分。事實上,根據Go的工程師在1998年的估計,只有70﹪的網站主機能夠提供正確的日期資訊,20﹪則是只能回報目前日期,無法得知網頁是何時建立或何時更新的。而剩下的10﹪是根本找不到日期資訊。
很多專業人士還是很希望查詢到的網頁資訊能依日期排序。在眾搜尋引擎中,Go和Northern
Light提供日期排序的選擇,將最新的資訊排在最前面。
Go在Web Search查詢結果的頂端,點選"Sort
By Date"。Northern
Light則是在進階查詢的畫面中,在選擇Select Date Range時,可勾選Sort
results by date。
值得一提的是,如果有興趣的是新聞話題,建議利用提供News
Search,或乾脆利用新聞專業搜尋引擎。
庫頁備份(Spidered Version)
網頁更新的速度非常之快,有的時候搜尋引擎傳回來的資料,和實際連結進去看到的有所不同;還有很多時候在搜尋引擎找到一篇正合我意的文章,不幸卻已遭廢棄或不知喬遷何處。如果搜尋引擎能提供其機器人搜尋回來的版本,就不會有遺珠之憾了。
Google就提供了這項貼心的服務,只要點選Cached,就可以看到Google的機器人當初讀取回來的網頁內容,也就是索引版的網頁內容,而且還會將我們輸入的查詢字詞標示起來。在Cached網頁最上端會提醒user,這可能不是最新版,若要看最新版,請點選current
page。
查詢結果的精煉
修正查詢策略
初步的搜尋可能產生三種結果,第一種結果是完全不符合,第二種結果是查到的資料很多,但是符合的很少,第三種結果是查詢到的結果很少,但很符合。