2007年11月19日 星期一

Some Fundamental Concepts of Information Retrieval

AuthorPatrick Wilson


TitleSome Fundamental Concepts of Information Retrieval


CitationDrexel Library Quarterly 14:2(1978):10-24


Topic:說明資訊檢索中關鍵概念


Purpose:理解人如何處理資訊


Methodology:現象描述


Finding:資訊組織應以多面向分析,而非單一的使用主題相關來聚及資訊。


Summary


     文件中所包含的面向有兩種,一為關於某件事之資訊,一為關於某件事的正確資訊。前者可以稱為弱資訊(week)後者可以稱為強資訊(strong),而強資訊其實是一種特殊形式的弱資訊。文件本身所包含的只有文字(context),擁有相同文字的文件並不代表其擁有相同的資訊。資訊的產生端賴於使用者自身的詮釋。人在接收資訊時有兩個要素,第一是理解所要傳達的資訊,第二是相信該資訊為真。即便我不相信你所提供的資訊,但是我仍從中得到一些了解。必須要正確的推斷文字所代表的涵義才能接收到資訊。我們用思考來推斷文字的涵義。


    資訊檢索系統所提供的資訊可以分為不確定真假及確定為真兩種類型的資訊。提供前者的系統應該稱為內容檢索(content retrieval),而後者才可稱為資訊檢索(information retrieval)


    在分類及索引中,我們利用「關於」來描述文件所包含的主題。決定文件的主題是相當複雜的,因為一份文件可能由多個主題所構成,或者是其主題曖昧不清,造成定義上的困難,因此界定「關於」操作型定義就更為重要。而MARON提出的以使用者最常使用的檢索詞來表示文件的主題。必須要利用文件本身的結構來整理組織知識。


    資訊檢索系統中所討論的相關概念基本上是指值得檢索的資訊。分別相不相關的資訊只是將資訊分為是否應被檢索而已。但是這種相關概念是不完整的,沒有任何因子可以單獨影響相關性,相關性的決定應該視檢索及檢索者而定。決定檢索價值的因素也相當多元,而且多是因人而異。因此目前較為有效的方式是以主題相關決定相關性。


    需求(need)則是達成目標的要件,在達成目標之後需求也就自然消滅了。而以消極層面而言,需求指的是可以促進達成目標的物件,其目的在於減少達成目標的成本。亦即若我的需求無法滿足,我可能會退而求其次尋求其他的方法來達成較低層次的目標。而需求本身可以是知覺或不知覺的,前者是主觀的心理狀態,後者則是對於所缺乏資訊的不知覺。需求只有在提供真正需要的物件時被滿足,而使用者的需求滿足與否則要視其是否認為已被提供所需的物件。在誤訊(misinformation)的情況下,使用者的需求也有被滿足的可能性,這彰顯出需求滿足的主觀性。因此在資訊檢索系統中,可用性評估會有過於主觀的疑慮。


    資訊的描述即是該文件主要用途(primary use)的描述。而資訊的延伸用途(further use)則要視其主要用途的方向所延伸。在資訊檢索系統中,文件的主要用途是來自於作者對於該主題論述的資訊,亦即相同主題的文件可能有不同思考面向。必須以相同延伸使用的層面來聚集文件,而非以傳統的相同主題方式。只是透過描述主要用途的索引詞提供檢索,並從而驗證其相關性,對於資訊的分析是相當不足的。


    當前的資訊檢索系統仍只能回應主題相關的需求,對於自然語言檢索、資訊內容的分析、資訊的用途等方面多是缺乏的,未來的努力方向應朝此邁進。


Comment


    本文成文的年代相當早,但是對於現象的分析仍頗為精闢。其主要論點在於資訊檢索系統並無法判斷資訊的內容,而只能從關鍵字匹配的角度提供資訊給使用者。此一方向大大削弱了資訊本身的廣度,單一字詞描述資訊的侷限性太大了,過度壓縮了資訊量。此一現象亦發生在分類法之中,亦即綜合性書籍只有一類號代表。


     為了解決主題相關的侷限性,層面分析法目前已逐漸受到重視。透過多面向的描述資訊,可以將資訊較為有效的組織起來,並提供使用者更為簡便的檢索。同時在相關的概念發展之下,主題相關已經不在是唯一個相關關係,諸如情境相關、心理相關的與使用者高度連結的相關概念亦已發展而出。


0 回應:

張貼留言

留言前請選擇身分別名稱/網址

選匿名的話,最新回應一整排Anonymous很難看