2007年10月17日 星期三

Enriching Traditional Cataloging for Improved Access to Information

TitleEnriching Traditional Cataloging for Improved Access to Information:


Library of Congress Tables of Contents Projects.


AuthorByrum, John D., & Williamson, David W. (2006).


CitationInformation Technology and Libraries 25(1): 4-11


摘要:


BEAT小組是由國會圖書館各單位人員自願組成,目的是改善書目紀錄的效用。其最早的研究是將「TOC(目次)加入書目紀錄。而關於TOC的研究有以下幾點:1.在兩千本書中,加入TOC後,社會科學類以及人文科學類有兩倍及三倍被檢索出的機率。2.TOC在加入書目敘述之後會平均提供15個豐富的主題詞彙3.31本書所有的TOC中提供超過600個描述主題的詞彙,平均一本書包含19.5個詞。4.加入摘要以及TOC的紀錄提升了20~30%的檢索機率。Pappas and Herendeen的研究指出(1)TOC幫助使用者決定針對資訊需求的特定書名的相關性。(2)在線上環境中,TOC中的字詞由分辨以及檢索相關物件的功能改善了檢索的效率(3) 透過提供表示內容的資訊,TOC補充了主題編目以少量的檢索點描述整個內容的困境。Yu and Youn也指出主題檢索已經被關鍵字檢索取代。主題檢索者的檢索策略首先應該是挑選關鍵字而非主題詞。


提供TOC資訊:BEAT首先嘗試透過經由E-CIP的程序實現此一目標。出版商在出版前提供電子檔供編目,然後在出版後書上便附有適合的編目資訊。在1993時提供了TCEC讓編目人員在編輯E-CIP時可以插入TOC的內容。其流程為:操作TCEC跟出版商提供的ACCII電子文本,編目人員標示出TOC的位置,然後程式將其著錄在MARC中的505段。其遵守AACR對著錄TOC的規範並採用ISBD的標點法。在使用TCEC時必須考慮1.加入章節名稱是否改善自然語言關鍵字檢索?2. .加入章節名稱是否比題名跟著錄來源更能表達內容?3.是否需要大量人力準備TOC的資料?4.如果TOC很長又很多,會不會減低505段的資訊價值?第二個ECIPTOC計劃是為ECIP建立一個網路TOC記錄。 上述兩者的結果是可以透過檢索HTML編寫的TOC來進入線上目錄。


數位TOC(D-TOC)為了發展有效豐富書目的方法,數位TOC的產生取代了舊有影印紙本的方式。透過掃瞄跟OCR辨識之後,並以HTML編碼儲存於LC的伺服器。在HTML編碼的時候,同時讓MARCTOC檔相互連結,兩者都可以在LC的線上目錄使用。網路使用者可以透過數位TOC連結到LC的館藏目錄,LC便於此時提供相關的資訊,讓網路使用者重回圖書館。使用者在搜尋引擎檢索到TOC,在點選連結之後,HTMLTOC會展現其內容以及書目紀錄的連結,如是使用者可以連結到圖書館的OPAC進行檢索相關的資料。同時書目紀錄頁面的作者、主題、分類號等可以用超連結進行類似的檢索,供使用者做虛擬的瀏覽。


選擇TOC的標題的準則為可以代表該物件的研究價值並包含編者、傳記、參考資料等。其必須包含有意義的字句,並不超過五頁。數位TOC處理的語言將越來越多元化。


ONIX-TOC是從出版商提供依循ONIX規範的XML檔中抽出TOC的部份。其過程為LC會定期收到出版商的ONIX檔:首先檢查ISBN是否存在,若否則直接存取下一筆資料,而後檢查三組標籤是否存在,分別為,若存在則抽出標籤中的TOC資料然後比對LC資料庫中是否有符合的ISBN,此時會有三個問題:1.ISBN重複2.紀錄重複3.紀錄無ISBN。符合的MARC檔會被抽出題名、主題詞、控制號,後者用來做為與書目資料的超連結。之後軟體會在HTMLACCIITOC檔中加上

標籤來插入HTML標頭跟註腳。經過品質檢查後,儲存於伺服器中。如此循環,直至ONIX檔結束。ONIX-TOC讓使用者可以進一步取得書目資料,而編目人員可以在MARC856段著錄TOC的網址。


傳統鍵入TOC需要$40D-TOC需要$10來掃描連結資料、透過OCRD-TOC需要$2E-CIP插入TOC需要$3ONIX僅需$0.8


ONIX檔會因為其所包含的資訊而有所變動,其所設定的對象是書店而非圖書館。BEAT利用出版商提供的ONIX檔中的資料來延伸其ONIX計畫。LC目前處理3ONIX檔,1.12.02.1版。新的版本雖然經常產生,但是出版商仍然沿用舊的版本。ONIX3.0將於2006年推出,其大至上與2.1版相同,但是移除了不適用的標籤。ONIX標準的改變並不是針對其本身,而是針對其編碼。這使得此標準更為穩定。


因為書目紀錄只能提供TOC檔所在的網路位置,因此BEAT便研發了一個可以將網路TOC檔植入書目紀錄的軟體。軟體之資訊來自於ONIX-TOCD-TOC的原始資訊,然後將TOC資料抽出,並一行一行的填入505段。此一作法使得書目紀錄可以提供完整的TOC資訊,但是由於TOC檔的多樣性,仍會產生一些細微的錯誤。


BEAT的計畫展現了如何在數位時代中利用傳統工作。圖書館員必須體認到不論是傳統的框架作業或是數位環境作業,研究者不單單只把目錄當作資訊來源,而是把它當作通往更多資訊的閘道。思考如何運用既有的線上目錄來加強提供使用者更多的資訊將是最重要的課題。


心得:


TOC加入書目紀錄中對我而言是一個全新的概念,但是經過思考之後,的確,TOC多多少少可以表現出一本書的主題意義,畢竟TOC代表的就是一本書的內容。其所提及的,必然是跟書有關的。因此在書目中加上TOC的內容,對於使用者而言定能增加其利用資訊的效能。


利用XML也是一個值得思考的問題。傳統HTML只能標示資訊的排版,並無法表達資訊的內容。透過DFD的制定,一個規格化的XML標準對於資訊的交換會有很大的幫助。就如同文中的ONIX檔案,即是因為有標示出”TOC”內容的標籤,才能夠透過程式自動擷取TOC之內容,以供其他用途使用。


加入TOC來豐富書目紀錄的概念,只是國會圖書館在思考如何在舊有的傳統目錄中求新求變之中所產生的產物。其目的在於提供使用者更多有用的資訊,同時也是吸引使用者利用圖書館。這一點是值得我們學習的。我們必須擁有創新思考的能力,才能在傳統中求突破。

0 回應:

張貼留言

留言前請選擇身分別名稱/網址

選匿名的話,最新回應一整排Anonymous很難看