2007年12月28日 星期五

期末作業海

雖然12月一開始就說作業很多



到現在我也才完成一個報告 惰性跟時間管理是學習的兩大敵人



管理心理學----已口頭 剩書面-01/23



資訊科學----什麼都沒有--01/21口頭 01/22書面



資訊組織----什麼都沒有---01/02口頭 01/18書面



自動分類與索引 ---什麼都沒有--01/17口頭 01/24書面





不過我後三科題目都一樣 ...可是我還是什麼都沒看





想來想去還是因為沒有修研究方法 根本不知道自己要做什麼



老師也沒說報告的深度跟廣度要如何



所以就很怕做出來的東西會被笑







我除了期末報告海以外 還要在01/10以前改完280份傳播學考卷....哪改得完啊 我要外包



HeartRails Graph



真煩 我還是去看少年快報好了 又是星期五了

2007年12月19日 星期三

Accounting for users' inflated assessments of on-line catalogue search performance and useful

 

AuthorCharles R. Hildreth


TitleAccounting for users' inflated assessments of on-line catalogue search

performance and usefulness: an experimental study


CitationInformation Research, 6 (1).2001


Summary


    使用者在使用線上目錄等電腦檢索系統時,往往在檢索結果不佳時,依然表現出高度的滿意度,此為誤判現象(false positive)。使用者導向的研究方法的基礎建立於使用者是檢索結果的最佳判斷者的假設上,因此有必要重新檢視檢索結果品質及系統效能彼此間的關係。  WEBOPAC的易於始用性往往較為受使用者關注。本實驗比較WEBOPACETEXT-OPAC間的檢索效能、好用度、系統實用性、成功檢索。旨在討論以下問題:1.使用者為何經常過份評價OPAC.2.什麼會影響使用者對於檢索效能、好用度、系統實用性的判斷3. 檢索效能、好用度、系統實用性與檢索結果的關連4.使用者的特性與檢索效能、好用度的關連5.檢索介面與檢索問題難易對於成功檢索的影響6.檢索問題難易度的影響7.WEBOPAC的好用度會不會不受檢索問題難易影響8.誰能從新科技獲益?


    CRANFIELD實驗建立在兩個假設上1. 認為使用者想要檢索到大量的相關文獻同時拒絕大量的不相關文獻2.文獻的相關是客觀的。但是其以回現率及準確率評估系統屬於系統導向的研究方法,並沒有考慮到使用者互動的問題。而其後的COOPER提出效用的概念用來評估系統,此則是使用者導向的開端。Soergel認為使用者可能因為不佳的結果而產生滿足,因此效用不足以評估系統。Tessier則指出了滿意的四個面向:1.使用者的主觀經驗2.圖書館整體3.參考服務4.個人與圖書館的互動。DeloneMcLean指出六個反應系統效能的因素1.系統品質2.資訊品質3.使用4.使用者滿意度5.個人影響6.組織影響(系統效能的多面向)。當前利用登錄檔分析、調查表、面談、錄影觀察以及傳統的回現率及精準率來評估系統。滿意度因為其高度的變動性在測量上也相當困難,而且各家研究者之間並沒有統一的定義,使用者特性也常被忽略。Applegate指出了誤判現象,其將使用者滿意度分成三種:1.物質滿足2.情緒滿足,前者可以透過回現率及精確率計算,而後者則是使用者主觀的表達。在線上目錄出現之後,研究發現使用者經常滿足於不佳的檢索結果。


    本實驗比較兩種不同介面的OPAC,一為GUI/WEB,一為TEXT/MENU,並將檢索任務難易度分為簡單/難兩種,將實驗對象分成四組,各為GUI/簡單、GUI/難、TEXT/簡單、TEXT/難。OPACuniversity of tulsa的館藏目錄,兩者只有介面上的差異,擁有相同的資料庫及索引。每組實驗各有十六人要完成十六種主題檢索。使用者事先並沒有經過任何訓練。使用者必須將所檢索到的索書號記錄在工作單上,並在檢索完成以後填寫問卷。問卷是為了調查系統好用度、實用度、檢索結果滿意度,其使用4-5點的likert scale來進行填寫,同時包含了使用者基本資料。


    實驗假設:1.WEBOPAC的檢索效能會比TEXTOPAC來得好2.簡單檢索的效能會比難的檢索效能來的高,無論是WEBOPAC/TEXTOPAC3.使用者滿意度會反映在檢索滿意度上4.系統好用度等非檢索效能因素會影響使用者的滿意度5.WEBOPAC會比較好用6.WEBOPAC會比較有用7.WEBOPAC的檢索滿意度會較高8.檢索難易度會影饗系統好用度9.檢索難易度會影響檢索滿意度。


    檢索評分由專家重複檢索一次問題集,決定所有相關的書目,並將實驗之檢索結果分為相關(2),可能相關(1),不相關(0)


    實驗比較了四個獨立變數1.檢索結果2.檢索滿意度3.系統好用度4.系統實用性


    檢索滿意度與系統好用度、系統實用度有所關聯,系統好用度與系統實用度也有所關聯,因此可以推論系統好用度以及系統實用度比檢索效能對檢索滿意度有更大的影響。


    本實驗著眼於1.獨立變數(介面以及檢索難易度)與相依變數(檢索評分、檢索滿意度、系統好用度、系統實用性)的互動2.相依變數的關連3.使用者特性與相依變數的關連。而實驗結果指出1.檢索難易度較系統介面對於檢索結果有較大的影響2.WEBOPAC有較高的好用度3.檢索滿意度與檢索結果及系統實用度無關4.網路搜尋經驗會影響檢索滿意度及系統實用度5.檢索效能對於檢索滿意度的影響很低6.系統好用度及實用度會影響使用者滿意度。


    檢索難易度及檢索介面都會影響檢索效能,而系統介面決定了系統好用度。其次,檢索效能對於檢索滿意度的影響很低。WEBOPAC比較容易使用並且成功檢索,這可能部分說明了使用者為何經常產生誤判現象,滿足於不佳的檢索結果。


    而前述之假設可在此驗證:1.WEBOPAC的檢索效能會比TEXTOPAC來得好:可能2.簡單檢索的效能會比難的檢索效能來的高,無論是WEBOPAC/TEXTOPAC:是的3.檢索效能會反映在滿意度上:不是4.系統好用度等非檢索效能因素會影響使用者的滿意度:是的5.WEBOPAC會比較好用:是的6.WEBOPAC會比較有用:可能7.WEBOPAC的檢索滿意度會較高:不是8.檢索難易度會影饗系統好用度:是的9.檢索難易度會影響檢索滿意度:不是。


    實驗的對象並不具有代表性,因此可能無法在另一個社群呈現相同的結果。檢索結果的評分化,本質上是相關的判斷,但是並沒有考慮到未被檢索的相關資料。系統好用度與系統實用度必須要擁有不同的測量方式。必須發展出測量滿意度與檢索結果和檢索效能


心得:


    一般而言,滿意度應該與檢索結果品質畫上等號,越高的滿意度就代表了越高的檢索品質。本文的觀念對我而言無疑是一個嶄新的思考角度,其實驗證明了使用者滿意度與檢索品質其實只有低度相關,相反的,影響滿意度的因素反而是非檢索功能的層次,例如好用度以及實用度。本文所指的誤判現象在電腦科技發達之後更為明顯,使用者往往因為電腦圖形化介面的親和力、直觀性而過份評價其功能。於其中應該思考的是系統的本質,以其使用者需求的本質。發展出可以客觀評價系統且能兼容使用者主觀判斷的評估模式對於系統評估而言是未來發展的方向。


2007年12月17日 星期一

The State of Retrieval System Evaluation

AuthorSalton, G.


TitleThe State of  Retrieval System Evaluation


CitationInformation Processing &Management 28:4(1992):441-49


Topic 說明當前系統評估之現況


Purpose:讓人對於系統評估之研究有一概括的理解,並從而思考未來研究的方向


Methodology:文獻分析


Finding


Summary


    雖然系統評估的研究已經發展已久,但仍有不少專家對於其所使用的研究方法產生質疑,其中COOPER認為傳統的系統評估是基於變化極大的相關判斷以及許多主觀的因素,令人無法信服,另外回現率及準確率的使用也受人質疑,因此有人認為實驗室所產生的結果無法套用的現實生活之中。一般評估系統多使用1.求全率,指檢索到相關文獻的能力2.精確率,指排除非相關的文獻的能力,來測量系統效能,這建立於認為使用者想要檢索到大量的相關文獻同時拒絕大量的不相關文獻的假設上。但是此一概念與效用理論並不相容。Cooper認為所謂相關的文獻有時是沒有用的,使用者可能會因為一篇相關文獻而過度評價低回收率的系統。而事實上,只有少數的使用者會關注於檢索到所有相關的文獻上。傳統回收率跟準確率的雙指標有比較上的困難,另外也無法詳細的呈現檢索集的規模與已檢索的數量。但是SwetE-measureCooper的預期檢索長度等測量值均有計算上的困難,因此回收率及準確率仍然是目前檢索評估的主流工具。


    大部分的檢索評估研究都是在實驗室裡進行的,現實世界裡很難進行與實驗室相同的實驗。因此有以下批評:1.檢索要求無法表現真實的使用者需求,相關的判斷也無法與現實相同2.每個人的相關判斷都不盡相同3.回收率建立於所有相關的文獻上,而事實上對於無法檢索到的相關文獻只能使用估測值4.查詢詞與文獻測試集規模過小。


    Cranfield實驗是第一個以固定的查詢及文件集配對的大規模實驗,其比較了三種索引語言:單一詞彙語言(single term language)、簡單概念索引語言(simple concept index language)與控制詞彙索引(controlled term index),並應用了切截、同義詞、類同義詞等技術,其結果證明了單一詞彙語言的效能最佳。單一詞彙語言完全反映了自然語言的專指程度,既廣且深。而簡單概念索引語言的高度專指性造成了檢索效能低落。SwansonHarter認為該實驗有兩個問題:1.使用者比較喜歡使用關鍵字比對2.該實驗並未包含大量相關但未被檢索出的文獻。但是即使在相關的判定上有所缺失,以及無法準確的推估未檢索到的相關文獻,但是基於同樣的基礎上,比較不同索引語言的效能仍是有效的。


    SMART系統評估以CRANFIELD的測試集為基礎,目的在於證明內容分析會增加檢索系統之效能,但實驗結果發現加權關鍵字加上切截後的檢索結果較佳,而內容分析之檢索結果卻較預期的差。


    雖然SmartCranfield的測試結果是互補的,但並不廣為接受,其原因在於小型實驗測試與現實檢索的差異性。


    Stairs全文系統的評估報告指出其準確率為0.79,回收率為0.20,其使用無權重的關鍵字及布林邏輯進行檢索,研究指出回收率0.20已達全文檢索系統的最大值。McCarnLewis認為使用者自行擁有準確率的門檻,這意指系統應該提供讓使用者縮小檢索範圍的機制來提供更為準確的檢索。在實驗環境中查詢詞的擴展或窄化可以改變回現率及準確率,但在現實中是不可行的。系統評估必須建立在值得信賴的相關判斷以及可信的相關文獻數量。而SMART系統沒有特別強調回收率及準確率,但在其大規模的測試集的實驗下,不同索引語言是具有被比較的基礎。而過去的系統評估多關注於查詢詞與文獻測試集的關係,未來的研究方向則是應從使用者的相關回饋來呈現系統與人的互動。


Comment:


    本文旨在分析當時的系統評估研究,同時指出未來的研究方向應該朝自動分類索引邁進。本文所分析之研究仍多屬於系統導向的研究方法,多以回現率及精確率來測量系統效能,忽略了使用者與系統互動的部份。但是由於使用者導向的研究方法變數過於龐大,且因人而異,對於整體環境無法一體適用,因此目前對於系統評估的方式仍然是以回現率以及精確率為主。


    目前必須思考出能夠量化的相關評估指標,從而發展出可以使用單一測量值比較系統效能的研究方法,當前雙指標的反比關係對於系統比較上一直存在著根本上的謬誤。


 

The Cranfield Tests on Index Language Devices

 

AuthorCleverdon, Cyril.


TitleThe Cranfield Tests on Index Language Devices


CitationASLIB Proceedings 19:6 (1963):106-30


Topic:索引方式的比較


Purpose:決定索引方式之優劣


Methodology:實證研究


Finding:自然語言單詞具有最高的檢索效能


Summary


CRANFIELD I實驗是為了測試國際十進分類法(Universal Decimal Classification)、面向分類法(Facet Classification)、依字母順序排列之主題索引(alphabetical subject catalog),以及單詞組合索引法(uniterm system of coordinate indexing)等四種索引系統的操作效能,而實驗結果顯示四者的效能均不相上下。而其測量值分別為1.求全率,指檢索到相關文獻的能力2.精確率,指排除非相關的文獻的能力。造成上數結果的原因在於四種索引系統為了同時提高求全率和精確率所設計出之複雜產品,所以會應用相同的概念來增加系統效能。


 CRANFIELD II則是為了測試索引方法的效能,其中文件以三種方式製作索引:1.使用自然語言單詞記錄索引詞2.單詞觀念結合之主題3.給予主題相關權重。實驗的第一步是決定各個文件與各個問題相關程度,其分為1.完整回答問題的2.高度相關的,可激發額外聯想3.有用的,概論式導引4.最小興趣的。而在實驗中,使用誤引率(fallout ratio)(檢索到不相關的文獻/所有不相關的文獻)可以比較不同規模的文件集效能。


 實驗中測試了三種索引語言:單一詞彙語言(single term language)、簡單概念索引語言(simple concept index language)與控制詞彙索引(controlled term index),並應用了切截、同義詞、類同義詞,總共產生了33種不同的索引方式。實驗結果證明了在CRANFIELD I時提出求全率及準確率具有反比的關係,因此要直接用這兩個測量值來比較系統效能是相當困難的。


 SaltonSMART系統測試基本上與CRANFIELD實驗的目的是一樣的,均為了測試不同索引方法的效能。而其不同點在於該程式能夠呈現一可信的相關排序,同時使SALTON可以計算常態化求全率,擺脫傳統雙指標比較方法。而實驗結果顯示單一詞彙語言表現最好,控制詞彙索引居次,簡單概念索引語言則效能最差。在任何環境下,最有效的索引方式是在同義詞上進行控制,而使用未經控制所結合的自然語言單一詞彙。實驗的結果可以視為一種巧合,其原因可能在於索引詞彙的專指程度,單一詞彙語言完全反映了自然語言的專指程度,雖然透過同義詞及切截雖然會降低專指程度,但會增加其檢索效能。而簡單概念索引語言的高度專指性造成了檢索效能低落。控制詞彙索引則同時表現了前述兩個現象。


專指性與索引詞彙的數量以及索引的窮盡程度有關,前者代表著檢索效能在索引詞彙達到一定數量時為最佳,而後者則代表索引辭所涵蓋的範圍,高度窮盡會降低檢索效能。


自然語言單詞加上切截功能和同義字控制在索引工作上具有最高的檢索效能。


Comment


本文雖然成文於1960年代,但是卻是研究系統分析時重要的文獻。其研究方法很明顯是系統導向的,其只關注查詢詞與文獻及之間的關係。而其研究結果發現自然語言單詞的索引方式的效能遠大於控制詞彙以及自然語言片語的效能,此一結果無疑對圖資界是一種震撼,因為圖資界長久以來認為唯有組織資訊才能夠有效的取用資訊,而其方法就是使用控制詞彙來聚集文獻。沒有任何加工的自然語言單詞的效能高於控制語言索引,這不正是說明了圖資界的努力是白忙一場?


但是因為其對於圖資界的衝擊過大,所以也招來諸多批評,其中對於未檢索的相關文獻數則最被人質疑。


CRANFIELD實驗是有史以來第一個大規模實驗,雖然其系統導向的研究方法在今日來看已有些不合時宜,但是其樹立的里程碑卻是不可抹滅的。今日,我們可以透過融合使用者層面的研究方法,並且加入資訊科技的應用,對於系統評估定將有更進一步的發展。


2007年12月13日 星期四

看的到吃不著 的HULU invitation

hulu是一個新的影音網站



跟YOUTUBE不一樣的是它的影片是原裝的 由電視公司提供



我在一兩個月前興致勃勃的跑去申請 前幾天收到了試用通知



正當我幻想著可以在電腦前面看高畫質辛普森家庭的時候







...他擋IP







Unfortunately this video is not currently available in your country or region.

We apologize for any inconvenience.



就機掰 網路不就是該無遠弗屆的嗎 限定個屁



然後我就去找了個美國PROXY來試試



...他擋proxy...



Sorry,this video is currently unavailable.We apologize for any inconvenience.



然後我上網看了看到底要怎樣才能看



有個人說用"Security Tunnel"可以連 可是要錢 一個月要300 那我不如去圖書館排隊



然後又看到有人說澳洲有個AnchorFree的VPN可以用



我抓了以後 要連的時候就...







流量爆了...



正當我想放棄的時候 我忽然想到大陸人常用的TOR 二話不說也抓來灌







一樣視為PROXY...而且很慢





就機掰 浪費我時間









...我真的很想看辛普森家庭

2007年12月9日 星期日

期末報告DEADLINE剖析

資訊學研討

01/21 序號 17

Title:語意網應用(初探)(淺談)(剖析)(嘴砲)...

Topic:說明第二代網路語意網如何改變當前的資訊檢索

Purpose:為了瞞混過關

Methodology:嘴砲



老師對我的題目說了「自求多福」跟「好自為之」



最後一個禮拜報告 所以要1/14結案



應該是用大量的嘴砲學以及少量的應用層面作為主軸



--本科目前還剩兩篇文獻還沒翻譯



資訊組織研討

12/26 序號 5---初估會DELAY1個禮拜所以應該是01/02

Title:未定...[很想繼續用語意網 怕會被同學打 再看著辦]

Topic:語意網與資訊組織之關連

Purpose:兩者間的比較或淵源

Methodology:嘴砲



這個看來是最快要交的一篇 這邊應該可以聚焦在資訊組織上 反正語意網最原本的概念就是資組



可能就組織的方式做全面性的概論 最後在嘴砲一些願景



--本科還有一篇口頭 兩篇書面文獻



管理心理學

12/26 序號 2

Title:傑克威爾許管理哲學之我見

Methodology:抄書

這個也很緊迫 書已經借了 可是還不知道怎麼開始寫



不過應該不難...吧 就把書跟講義做連結好了



「xxx這一管理行為 無獨有偶的與管理心理學中的XXX原則及XXX效應如出一轍 .....」



--本科還有一次分組報告



自動分類索引

01/18 序號 9

Title:語意網技術概論

Topic:XML大雜燴

Purpose:說明標記語言的進化 以及語意網之組織

Methodology:打算用大量的技術名詞跟程式碼來矇騙視聽大眾 以期在課堂中收瞌睡之效



這個題目可以說是最早訂的 幹 可是通通都拖到現在 都沒用 OTZ 人真是惰性的動物



技術就技術啦 老嘴砲也很空虛 可是我RDF SCHEMA語法看不懂



--本科還有兩次作業





----



只剩兩個禮拜就要交了 做高中生程度的報告可能會被同學看不起 老師可能也會叫我重做



可是我以前很少做報告............



機掰 我這三天要好好玩個痛快 幹 然後開始埋首書堆



----

書單

語意網技術導論

語意網的概念、方法、應用 -碩論

Semantic Web technologies : trends and research in ontology-based systems

The semantic Web : a guide to the future of XML, Web services, and knowledge management

Towards the semantic web : ontology-driven knowledge management

傑克.威爾許的4E領導學

致勝 威爾許給經理人的二十個建言

傑克.威爾許簡單講

傑克.威爾許如是說 勝在影響力

再造奇異 傑克.威爾許傳奇


2007年12月6日 星期四

開心的課

每個禮拜四



是我去上學的原動力



因為這堂課在下午 是一個完完全全符合我作息的時間 雖然我偶爾還是會打哈欠



早上九點 會睡著 晚上六點 會恍神



午後的授業 格外令人愉悅



而且課堂的氣氛完完全全跟別的不一樣



其他課就是充滿了一股肅殺之氣 大家都好像想拼個你死我活一般 連個屁都不敢放 然後到最後就睡著了



除了沉重還是沉重



可今天這堂就不同了 老師逗趣 同學也捧場 課堂氣氛熱絡的不得了



雖然同學明明就是那幾個 感覺就一整個不一樣



另外一點 就是這一堂是個電腦課 不不 應該是說比較偏計算邏輯的課



我數學雖然不好 可是能沾到電腦的邊我就心滿意足了



而且老師會閒聊 [幹 這不就跟我高中去補習班最後只是為了聽老師講笑話一樣嗎?]



可是撇開閒聊 課也是講的很穩紮穩打



這堂課真好 雖然也是要期末報告







老師說明年可能會開團去大陸 那我是不是拼死拼活也要過完碩一?







......幼稚









老闆叫我下禮拜去改考卷跟放影片



我終於有事做了!!不然這錢領的真不安心



可以挑錯字跟語病 還要加眉批



「同學 你這邊前後文矛盾 而且論點重複 」



「贅字太多 又不是字多分數就多」



可是有2百多份....







期末報告題目大概定了 可是都沒做



老師聽完我要做的題目說了「好自為之」跟「自求多福」這兩句成語 我不知道她是什麼意思



真煩 剩三個禮拜就要生出來 感覺同學都很強 糗斃了



「你在幹嘛啊」 「整理期末報告啊」 「幹你寫完了喔!不是上禮拜才定題目」 「啊我一開學就開始寫了啊」



是怎樣 我渾渾噩噩招誰惹誰了!





唉...

2007年12月5日 星期三

Metadata Interoperability and Standardization: A Study of Methodology

 

AuthorChan, L. M., & Zeng, M. L.


TitleMetadata Interoperability and Standardization: A Study of Methodology, Part I


CitationD-Lib Magazine, 12(6),2006


Summary


    在數位圖書館及機構典藏的快速發展之下,METADATA的種類及標準也亦趨多元。METADATA的多元複雜性造成了使用者的負擔,應該研究其互通性讓使用者可以一次就完成其檢索工作。


    METADATA規格是為了描述特定資源的架構,而METADATA元素集有兩個基本的元件:1.語意上的:元素本身的意涵2.內容上的:元素的值。多數的METADATA標準僅提供了元素集,並沒有提供METADATA的編碼格式。


    互通性是指系統間彼此可以無損失的交換資訊,這是在發展METADATA時極為重要的原則。使用統一的METADATA標準可以提供最大的互通性,圖書館所使用的MARC即為一例,但是這只能在一開始進行數位圖書館計畫時實施,一但各界自行發展之後,各種因應個別團體需求的METADATA也就如雨後春筍般而建立。


    在應用METADATA時則有四種方式a.建立標準並紀錄之,應用在一個或多個計畫b.建立以多個標準為基礎的個人檔(profile),以其元素集紀錄之。c.多個資料庫以多個標準間的元素比對的整合方式交換紀錄。d.儲存庫自行應用新的標準個人檔來合併既有的多種紀錄。實作互通性有三個層次:1.標準層次2.紀錄層次3.典藏層次。而不同的層次有不同的關注焦點:1.標準層次-關注於標準中的元素2.紀錄層次-關注於元素間的映對3.典藏層次-關注於將字串值與特定元素連結。


    以標準層次來達成互通性有幾個方向:1.衍生:從既有的標準改良之以符合自身的需求,可以保持架構基礎的一致性,翻譯、簡化、增修均屬之。2.應用個人檔:在一既有之標準下應用個人檔來滿足同一團體間不同的需求,即是在既有的框架之下重新定義元素,可以維持一定的互通性。3.交流:複製既有標準的元素或映對之,讓兩者間的元素語意可以互相對照。而其問題在於元素間的關係,如一對多、多對一、一對一、一對0等。4路由交流:在多種標準互相交流時,會產生複雜的映對工作,而路由交換則是以映對路由標準來減輕此一工作。即是各標準只映對路由標準。5.Metadata框架作業:在METADATA山頭並立時,透過框架作業可以達成有效數位保存,其目的在於將各個標準之元素分類以有效聚集類似的元素。6.METADATA註冊:確認並登記既有之標準,如此可避免疊床架屋的標準發展以及增加現有標準間的互通性,可分為1.跨領域註冊2.主題領域註冊3.特定計畫註冊4.特定標準註冊。


    在網路時代,維持標準間的互通性將更為重要。.記錄層次廣泛的轉換紀錄、重複使用記錄、整合記錄。典藏層次則是透過OAI協定來統整紀錄。


Comment


    本文認為METADATA間的互通性是目前發展METADATA中最為重要的一個環節。的確,因為每一個團體對於著錄資訊的需求都不一樣,因此都會發展出各自的標準。但是屬性相近的團體發展類似的標準則會有疊床架屋的資源浪費,所以加強不同標準間的互通性,對於資訊的組織會更為有效。


2007年11月28日 星期三

Being a Librarian: Metadata and Metadata Specialists in the Twenty-First Century

這篇超嘴砲 嘴砲到我念完不知道自己在念什麼



Author
Calhoun, Daren.

TitleBeing a Librarian: Metadata and Metadata Specialists in the Twenty-First Century


CitationLibrary Hi Tech, 25(2): 174-187


Summary


    本篇文章以以下面向討論:1.科技驅動的研究、教學、學習環境2.去中介化3.全球性指引4.使用者偏向取用網路及多媒體資訊。


    Choo指出大學的知識傳播社群是由領域專家、資訊專家、科技專家三方面所構成,其內的資訊網路過程為資訊的取得、產生、組織、傳播、使用。領域專家產生及使用資訊。資訊專家了解如何取用、組織、選擇資訊,並使其易於取用,同時提供教學支援。科技專家則是運用科技來建立保存資訊的設施。但目前的社群將從機構導向轉變成學科導向。


    主宰圖書館員的核心概念有二,一為圖書館只是倉庫,二為圖書館是引導使用者取用資訊的中心。而越來越多資訊計畫顯示出圖書館員在其中的重要性。


    研究指出使用者越來越依賴線上資源,並且希望能在原地完成工作。圖書館將會轉變成資訊集散地,提供電腦設備的開放空間。使用者在網路上利用圖書館取用資訊的比例低於使用非圖書館管道(搜尋引擎),因此圖書館的檢索系統必須要更為容易讓使用者使用,同時必須能夠將館藏及服務可視化,使其能夠呈現在使用者眼前,而非繁複的檢索。越來越多的紙本館藏最終只能被儲存而無法被瀏覽,必須能夠提供虛擬瀏覽的功能。另外圖書館必須組織沒有結構化的資訊,必且與其它的社群密切合作。


    阮岡納桑的圖書館五律中的節省讀者時間一直以來被圖書館奉為圭臬。OCLC的合作編目大量的降低了MARC編目的成本。而圖書館目錄是描述性的METADATA,但是其他諸如版權、科技、架構、管理、評價、保存、連結等其他資訊目前也是使用者需要的。Herbert認為傳播的單位為包含非文字資料的複合物件以及建立更為彈性的學術交流系統。METADATA必須要能夠重複使用。編目館員必須具焦於能夠提供的服務而非所使用的方法。


    圖書館不該只是一個容器,未來圖書館發展的方向應該是建立一個廣大的檢索系統。正如同編目館員發展了卡片目錄,METADATA專家應該要發展出屬於此一時代的工具。新時代的METADATA專家應該要投入檢索系統的開發,研究METADA的再利用,利用出版商提供的資訊自動編目;積極參與大學知識社群;以科技為導向的研究;去除圖書館的中介角色,將資訊系統變得更容易使用;建立全球的資訊地圖。


    圖書館的過度分工,造成工作效率的提高,但另一方面也侷限了思考的角度。館員必須要以全觀的角度來思考圖書館業務才能夠有所創新。另一方面,館員必須具有基礎的電腦能力,如此才能與電腦專家進行溝通。網路的發展對圖書館而言是危機也是轉機,圖書館員必須要視其服務社群來提供容易簡單取用的學術性資源。


心得:


    本文旨在闡述在快速變遷的網路時代裡,圖書館員應該如何應對趨勢的變化。其中強調了在資訊傳播的過程中,資訊專家(圖書館員)在其中扮演的相當重要的角色。雖然知識的生產看似重要,但是如果不能有效的取用的話,那麼再多的知識也是枉然。在網路時代裡,圖書館員不應被資訊的洪流所沖垮,而是要從中發現機會,從而創造圖書館的新價值。使用者雖然喜歡直接使用網路上的資源,但館員所能提供的是經過篩選、組織過後的資源,勢必能夠提供使用者較高的使用效率。圖書館的最終目的並不是和GOOGLE與之抗衡,而是與GOOGLE做出差異化,才能找出生存之道。正如文中所提到的,針對目標族群的資訊需求進行分析,提供準確的資料,發展標準化的METADATA,正是圖書館未來的走向。


2007年11月25日 星期日

議人是非

你認為



你什麼時候有資格批評別人?



是夜深人靜 午夜夢迴的時候 一個人低語呢喃的時候



還是找個朋友 私下哭訴的時候?



還是想找個公開場合 大肆議論 才顯得出你的真知灼見 以及旁人的連聲附和?



只有沒受過集體暴力的人 才會享受排擠人的權利快感



你可以擁有自己對於別人的觀感 無所謂 我也沒興趣



但是 一定要得到大家的背書你才敢去討厭一個人嗎?



懂不懂什麼叫做集體暴力啊



就是一群人自以為是地去擅自決定一個人的價值



你八面玲瓏吃的開 是你家的事 為什麼要把別人拖下水?



貶低別人是否真的就提高了自己?



愛道人長短議人是非的婊子 求你放過我耳根清靜



袖手旁觀其實跟落井下石同罪 真的





竊以為為友之道不應如此



要嘛與之交而真心誠意



要嘛與之絕而不出惡聲



何苦交之又暗放冷箭背後中傷?



令人不齒



又不是人多聲音大就是真理



怎麼不想想有一天輪到自己的時候會怎麼樣



還是你認為不會輪到自己?



風水輪流轉啊 十年河東十年河西



你又不是那麼的無可挑剔









我操你媽的機掰婊子喜歡在人背後論人是非道人長短人前人後兩個樣又愛裝親熱又自以為是



我今天在這邊罵幹你娘最後改天見面還是要開開心心的說聲嗨



幹你娘老機掰我下次見面一定是幹你娘





請大家多讀讀論語 謝謝 雖然高中有上過 不過應該是沒有唸進去 不然不會這樣





"小人就是那種沒有一個真正的朋友卻曾有很多人把他們誤認為知己的人" 余秋雨,人生風景

2007年11月22日 星期四

茫茫然然

今天去上課的時候 湊巧看到立娟老師在審proposal



ㄎㄎ 也不過就是打個照面而已



第一堂課 很莫名的就開始想睡覺 看來是該午睡的時候



不過衝著老師人很好笑 我硬是忍著沒睡



下課的時候便結結實實的睡了一下



然後第二節課 老師就說了



「我的課跟其他課比起來很好睡嗎?」



又指向我問道

「你昨天幾點睡啊」



「兩點」



「不是看書看到兩點吧」 ㄎㄎ



「不是」



「那你一定睡到十點對吧」



「ㄎㄎ」



「老師當年也是都兩點睡 是寫程式寫到兩點」





老師對不起 我以後會早一點睡覺





不過現在的生活也真有些單調



每天不是在打電動 看漫畫 不然就是用DR.EYE寫作業 要不就是上BBS



幹咧 什麼爛生活 一點目標都沒有



話說期末報告要開始了 我連根毛都沒生出來



是到底要做什麼 煩死了



每個人大綱都一樣 是怎麼樣 就那麼喜歡寫論文嗎



糜爛卻又無法自拔 找不到一個讓自己自動自發的方法



像我剛剛又睡了兩個小時才起床2100-2300







我正在考慮以後帶麵包屑去學校餵鳥



這樣會讓我騎在羅斯福路上比較有意義些

2007年11月21日 星期三

Authority Control in the Context of Bibliographic Control in the Electronic Environment

 

AuthorGorman, M.


TitleAuthority Control in the Context of Bibliographic Control in the Electronic Environment


CitationCataloging and Classification, 38(3/4): 11-22


Summary


    編目紀錄由三個部份組成:1.檢索點2.書目描述3.所在地。檢索點引導使用者利用紀錄,書目描述幫助使用者決定是否使用該資訊,所在地則讓使用者可以取用該資源。權威控制關注於檢索點的部份。


    檢索點有兩個功能,其讓使用者找得資訊,並聚集有相同特性的資訊。後者透過字彙控制來達成此一功能(劃一提名)而權威紀錄有以下功能:1.紀錄檢索點的標準形式2.確保使用相同的檢索點來聚集所有的資訊3.提供標準的書目紀錄4.紀錄決策、來源、檢索點5.紀錄所有形式的檢索點6.紀錄既有及其他使用標準檢索點以提供編目者規範。


    線上目錄的權威控制較卡片目錄的權威控制更為詳盡,其必須包含1.標準化的檢索點


2.「見」的所有形式記錄3.「參見」與其他連結的所有權威紀錄4.標準化檢索點的來源5.詳列既有以及其他使用的標準形式。


    因為沒有跨國際的編目規則、分類法、標題表,編目者可能因為時地的不同,而製作出形容相同物件的完全不同的紀錄。在編目時必須考量以下資源:1.現有的國家及地區權威紀錄。2.可應用的編目規則及標題。3.要編目的文獻4.參考資源。而各個資源有其重要性,因此不能有所偏頗。


    METADATA提供非圖書館人員一種較為簡便方式處理網路資源的檢索性,並且擁有不錯的準確率及回現率。而MEATADATA既不是完整的編目檢索系統,也不是全文檢索系統。其最後在任何規模的資料庫中均無法成功展現。


   OCLC研發出的DUBLIN CORE,擁有與MARC匹配的15個欄位,其擁護者認為DUBLIN CORE可以描述所有MARC內的特性,並且由於其簡單易懂的欄位,可以將編目工作交由非圖書館員處理。但忽略MARC本身詳盡描述資源的本質,而視其為無意義的反覆著錄。


   MARC是一個處理書目紀錄的框架作業,書目紀錄的內容則是交由AACR2LSCH等規則來處理。有的人認為編目只是辨認書目紀錄的元素而沒有處理書目紀錄的內容,但是書目控制最重要的是內容的分析以及控制分析過後的結果。把編目當做單純的填入工作,並認為DC可以用15個欄位取代MARC格式,其實是不智的。


    DC並沒有做字彙控制,因此它會因為字詞數量的無限膨脹,造成檢索效率的低落,所以在任何規模的資料庫都是無效的。即便其資料庫規模已足夠檢索,但也比不過全文檢索的搜尋引擎。


    檢索系統均由準確率及求全率來評估其效能。沒有字彙控制的搜尋引擎往往提供的是大量且不相關的資訊。必須透過檢索點控制來聚集有相同特性的資源。有權威控制的系統往往比沒有權威控制的系統好,但是權威控制既耗時又昂貴。


    必須要放棄認為METADATA在資料庫中是有用的以及擴充METADATA去符合書目紀錄。而參與METADATA制定的團體機構目前的困難最主要在於沒有準則可以參考,沒有標準的資料庫只是沒意義的無限擴增。網路資源編目的問題在於1.資源的價值2.資源在編目後的保存。


   UBC的計劃是文獻只在來源地編目一次,然後世界各地便可以取用該紀錄。其困難在於缺乏國際性的編目規則及權威控制。而解決方法其一為製作跨語言的檢索點編目規則,其必須要超脫文化因素而僅包含最廣層面的規則。其二為建立全球性的權威紀錄,以數字辨識作者、共同作者、劃一題名、主題。在檢索時以數字連結權威紀錄,展現所有相關的權威紀錄。全球性權威檔實現了符合編目規則以及貼近文化或語言現實的編目紀錄。


   權威控制是圖書館服務中最重要的一環,它是書目結構中最基礎的部份。


Comment


    本文強調的重點在於權威控制,其認為沒有字彙控制的系統沒有辦法提供使用者有效的檢索,並在文末提出了全球性權威控制的實作方法。而目前RDA的制定,即是以跨文化、語言的角度發展,正符合文中的全球性編目規則。


    但是網際網路資源的編目一直以來是個爭議不休的題目,圖書館員一直在編目與不編目之間擺盪。而除了以傳統編目的角度思考著錄網路資源外,目前語意網發展,其目的也在於整理網路資源。其概念在於建立一包羅萬象的知識本體,透過索引典等詞彙控制,將所有的資源歸類於其下,並以電腦自動化的方式完成。此一觀點脫離了編目與否的問題,而將資訊的組織交由電腦完成。不過其概念也是本於字彙控制,與本文之觀點正不謀而合。


2007年11月19日 星期一

Some Fundamental Concepts of Information Retrieval

AuthorPatrick Wilson


TitleSome Fundamental Concepts of Information Retrieval


CitationDrexel Library Quarterly 14:2(1978):10-24


Topic:說明資訊檢索中關鍵概念


Purpose:理解人如何處理資訊


Methodology:現象描述


Finding:資訊組織應以多面向分析,而非單一的使用主題相關來聚及資訊。


Summary


     文件中所包含的面向有兩種,一為關於某件事之資訊,一為關於某件事的正確資訊。前者可以稱為弱資訊(week)後者可以稱為強資訊(strong),而強資訊其實是一種特殊形式的弱資訊。文件本身所包含的只有文字(context),擁有相同文字的文件並不代表其擁有相同的資訊。資訊的產生端賴於使用者自身的詮釋。人在接收資訊時有兩個要素,第一是理解所要傳達的資訊,第二是相信該資訊為真。即便我不相信你所提供的資訊,但是我仍從中得到一些了解。必須要正確的推斷文字所代表的涵義才能接收到資訊。我們用思考來推斷文字的涵義。


    資訊檢索系統所提供的資訊可以分為不確定真假及確定為真兩種類型的資訊。提供前者的系統應該稱為內容檢索(content retrieval),而後者才可稱為資訊檢索(information retrieval)


    在分類及索引中,我們利用「關於」來描述文件所包含的主題。決定文件的主題是相當複雜的,因為一份文件可能由多個主題所構成,或者是其主題曖昧不清,造成定義上的困難,因此界定「關於」操作型定義就更為重要。而MARON提出的以使用者最常使用的檢索詞來表示文件的主題。必須要利用文件本身的結構來整理組織知識。


    資訊檢索系統中所討論的相關概念基本上是指值得檢索的資訊。分別相不相關的資訊只是將資訊分為是否應被檢索而已。但是這種相關概念是不完整的,沒有任何因子可以單獨影響相關性,相關性的決定應該視檢索及檢索者而定。決定檢索價值的因素也相當多元,而且多是因人而異。因此目前較為有效的方式是以主題相關決定相關性。


    需求(need)則是達成目標的要件,在達成目標之後需求也就自然消滅了。而以消極層面而言,需求指的是可以促進達成目標的物件,其目的在於減少達成目標的成本。亦即若我的需求無法滿足,我可能會退而求其次尋求其他的方法來達成較低層次的目標。而需求本身可以是知覺或不知覺的,前者是主觀的心理狀態,後者則是對於所缺乏資訊的不知覺。需求只有在提供真正需要的物件時被滿足,而使用者的需求滿足與否則要視其是否認為已被提供所需的物件。在誤訊(misinformation)的情況下,使用者的需求也有被滿足的可能性,這彰顯出需求滿足的主觀性。因此在資訊檢索系統中,可用性評估會有過於主觀的疑慮。


    資訊的描述即是該文件主要用途(primary use)的描述。而資訊的延伸用途(further use)則要視其主要用途的方向所延伸。在資訊檢索系統中,文件的主要用途是來自於作者對於該主題論述的資訊,亦即相同主題的文件可能有不同思考面向。必須以相同延伸使用的層面來聚集文件,而非以傳統的相同主題方式。只是透過描述主要用途的索引詞提供檢索,並從而驗證其相關性,對於資訊的分析是相當不足的。


    當前的資訊檢索系統仍只能回應主題相關的需求,對於自然語言檢索、資訊內容的分析、資訊的用途等方面多是缺乏的,未來的努力方向應朝此邁進。


Comment


    本文成文的年代相當早,但是對於現象的分析仍頗為精闢。其主要論點在於資訊檢索系統並無法判斷資訊的內容,而只能從關鍵字匹配的角度提供資訊給使用者。此一方向大大削弱了資訊本身的廣度,單一字詞描述資訊的侷限性太大了,過度壓縮了資訊量。此一現象亦發生在分類法之中,亦即綜合性書籍只有一類號代表。


     為了解決主題相關的侷限性,層面分析法目前已逐漸受到重視。透過多面向的描述資訊,可以將資訊較為有效的組織起來,並提供使用者更為簡便的檢索。同時在相關的概念發展之下,主題相關已經不在是唯一個相關關係,諸如情境相關、心理相關的與使用者高度連結的相關概念亦已發展而出。


A Perspective on the Measurement of Retrieval Effectiveness

方程式編輯器貼不上來...





AuthorCooper, W.S


TitleA Perspective on the Measurement of Retrieval Effectiveness


CitationDrexel Library Quarterly 14:2(1978):25-39


Topic:評估資訊檢索系統


Purpose:推廣效用評估


Methodology:各評估方式的比較


Finding:效用評估應取代現有評估方式


Summary


    評估檢索效益的測量方法對於資訊檢索理論以及實務是必要的。最早的評估方法是「準確率」,意指檢索結果中檢索到的相關文件比率。而之後為了平衡準確率評估,「求全率」應運而生,意指檢索出系統相關文獻的比率。這兩者是最常用來評估資訊檢索系統的指標,但是彼此間存在著成反比的關係。在A系統擁有比B系統較高的準確率以及較低的求全率時,可以透過個別的交替曲線(trade off curve)做比較。但如過要評估排序過後的結果,則必須使用「常態化準確率」及「常態化求全率」。而此二指標亦受限於樣本大小,因此又有「誤檢率」的應用。


    而效用(utility)評估則是取代相關(relevance)評估的新方法,其具焦於檢出結果對於使用者的價值,例如使用者是否能夠接受檢索的結果以及花費。雖然效用是一個新的評估概念,但是由於其尚未有一完整的計算公式,仍無法取代既有的準確率及求全率。同時因為其忽略了未被檢出的相關文獻比率,造成多數學者無法接受效用評估是有意義的測量方法。


    在檢驗效用時,其公式有四種。其一為檢索規模可以讓使用者一一評估其效用。其公式為:U=V1+V2+V3+..+Vn。其二為使用者認為有效文獻價值為常數u,無效文獻之價值為常數v,而檢索相關文獻數為r,不相關文獻數為i,則其公式為:U=ur+vi。其三為若系統提供排序的結果,則使用者的需求會檢索到q篇相關文獻即滿足,而sq減去檢索結果中所有相關文獻數之值,而假設有效文獻數為r,無效文獻數為ij為負相關文獻之總數,且各文獻之正效用為u,負效用為v,則其效用公式為。在比較多個系統時,該公式可以簡化成e.s.l=,此即為預期檢索長度。   


    雖然公式的呈現有不同的形式,但是其目標均在於量化相同的「使用者效用」。


Comment


    本文旨在說明僅以準確率以及求全率來評估檢索系統是不足的,因為其兩者本身存在著反比的關係,造成同時以兩者比較系統效能時的偏差。而為了減少此一謬誤,則發展出了一個新的評估方法:效用。其並以阿幾米德為例,說明效用評估是創新的思考概念而非既有公式的補充,意欲證明其在系統評鑑上的高度指標性。


    但是時至今日,最常見的評估方式仍是準確率以及求全率。效用評估為何未被接受?可能的原因在於其對於個別文獻的價值過於單一化,以及其計算公式的複雜化造成了推廣上的障礙。


    現今評估系統的方式除了傳統兩個指標的比較外,相關的評估反而蔚為主流。雖然相關基本上也被批評為過於主觀,但是由於其高度動態的本質造成其高度的適用性。而如何客觀且精確的評估系統,正是目前所需努力的方向。


 

2007年11月14日 星期三

Modeling Subject Access: Extending the FRBR and FRANAR Conceptual Models

AuthorDelsey, Tom

TitleModeling Subject Access: Extending the FRBR and FRANAR Conceptual Models


CitationCataloging and Classification, 39(3/4):49-61


Summary


    FRBRFRANAR的模型雖然有涵蓋主題的概念,但是並沒有完整的呈現在書目紀錄或權威紀錄中所產生的主題關係。必須對其實體、關係、特性做進一步的檢驗。


    必須重新檢驗三個主要目標:1.確保實體範圍包含了所有可以視為「主題」的物件。2.確保實體屬性有適切的涵蓋性。3.確保模型能夠明確且務實的呈現書目紀錄中主題取用點的關係。實體定義有兩個主要的問題1.實體是否足夠完整包含所謂的主題世界。2.實體的分類呈現是否適切且有意義的澄清書目紀錄間的關係


以下將以計畫與FRBRFRANAR的實體間做比較。


    將實體劃分為三個原始概念:1.感知的(percept)2.認知的(concept)3.多重的(關係) (relation)。而感知之下又分為生命的(生物)及非生命的(),關係之下分為動態事件及固定狀態。FRBR模型中缺少了中的固定狀態的實體。而FRBR中的物件必須定義的更為明確來包含所有可以感知的東西。


FRBR中有很多過於粗分的實體,相較之下之實體定義較為詳盡。必須重新思考FRBR中實體的劃分。


實體中的屬性代表了檢索點。在FRBR第三組實體中,concept, object, event, place均只有被定義一個屬性而已。


FRANAR中,提供基礎檢索點的元素被劃分為name實體。而與FRBR實體連結的屬性集也為了使用者的辨識性而有所擴展。而其中觀念的類型、物件的類型必須要反映出在索引典、分類法中的階層關係。而這些附加屬性又可以利用既有實體間的屬性。若FRBRFRANAR要重新定義實體時,其屬性也必須詳盡的定義。


FRBRFRANAR定義的關係有兩種層次,一為不同實體間的一般關係,二為相同或不同實體間的特定案例關係。前者必須要思考實體間的主題關係。除了”XX的主題是…”的概念,主題關係包含了更多廣泛而鬆散的關係。以主題取用連鎖的附加屬性必須在模型中呈現。例如反映索引典語意的上、下位詞的關係。因此必須明確區分對等以及階層或連鎖的關係。對等關係反映的是對於特定實例的血緣關係(如索引典中的見(see))。階層關係反映的索引典中的上下位詞的概念。FRBRFRANAR中的部份關係在階層關係中是有效的。而連鎖關係反映的是索引典中的參見以及相關詞的概念。其處理的既不是對等關係也不是階層關係。若要呈現連鎖關係,必須決定是否以單一分類或是多重分類處理。同時必須要更為詳盡的區分實體間的連鎖關係。


從資料模塑的觀點而言,有兩個重要的問題。其一為如何呈現在特定脈絡中的語句關係。第二個問題是如何定義及分類多種的語句關係。


擴充資料模型是很複雜的作業,必須囊括多方的專家才有可能為之。同時必須與其他非圖書館社群互相交流才能完善的分析資料模型。


心得


本篇文章以主題分析的角度切入FRBR的資料模型,突顯了在第三個實體組concept, object, event, place屬性較為不明確。而也進一步指出唯有清楚定義該組實體,並且分析其之間的關係,才能提供使用者適切的檢索點。在RDA中,權威控制已改成了檢索點,標示出權威控制的意義,也就是提供使用者檢索的功能。權威控制的目的在於維護標目的一致性以及建立標目之間的參照關係,必須透過定義第三實體組的關係才能達成此檢索功能。


 

2007年11月9日 星期五

我不該湊學分的

教授對不起



我不應該湊學分的



研究所本該是興趣取向 而非畢業取向的



我錯了



我應該在第一次上課後 發現自己的頭一直倒在牆壁上的時候就該決定



決定不參予這堂課



可惜我迷惘了 我迷惘在學分的誘惑之中



我以為倒在牆上一學期三學分就可以輕鬆入袋



我錯了



我以為回家自己看一看講義 就可以吸收全部的東西



我對抄投影片的筆記嗤之以鼻



我錯了



千不該萬不該



被這三學分所誘惑



白白三小時的空轉



學習也是有第一印象的



我在第一堂的課的時候就該明瞭



怎麼辦



現在停修還來得及嗎





或許理論就是這樣吧



老師講你去想 你不想老師講也是白搭




2007年11月7日 星期三

The Representation of Knowledge in Library Classification Schemes

我的研究所第一次熬夜經驗獻給了這一篇



莫名奇妙



又再一次的証明口語障礙之牆


logometic...ㄎㄎ the term is 決定可說與不可說的社會結構


AuthorRafferty, Pauline


TitleThe Representation of Knowledge in Library Classification Schemes


CitationKnowledge Organization 28(4): 180-191


摘要:


    圖書館分類法是以人為中心用來描述所有的東西的


   一般的分類法是關注於將知識應對成個別的主題。而一般分類法由大類、標記以及索引所組成。標記是一種基於自然語言的符號語言。Berwick認為圖書的編排是人的天性,一如秩序是天堂的第一條法律。十九世紀末因為知識的多產造成分類法的大量出現,如DDCUDCCC。而其用意在於取用書籍的知識及相信科學價值,並多強調實務運用。UDC的編者亦言UDC並非是知識分類的哲學或是學科重要性的排序。而其本身卻是基於DDC從培根的知識分類架構所延伸而來。Berwick認為分類系統是建立於哲學之上卻一直強調實務上的運用是矛盾的。


    而分類法分為以有形上學基礎的DDC以及為了實務方便的法國系統。而就算是沒有理論基礎的分類法也是建立於某種世界觀之上。事物並無法全然的隨機排列。其排列會基於傳統上的認知而給某些類別較為崇高的概念。其往往反映了物質社會的架構。而大類應該有以下特性:1.必須是建構的2.理想性而非代表性構成自然世界3.基於歷史的。


    大類一般是基於思想體系建構的,並不是物質世界的符號呈現,而分類法的建構往往是基於文化政治因素來決定大類以及細目的重要性。分類法會因為社會的變動而有所改動而反應現實。特定學科及論題的處理便是主題的時間變化。DDC對於小說的處理是以歷史及地理來分類的,並沒有進行內容或主題的分析。但是最近的檢索系統已經開發出小說的內容分析等功能。而AMAZON.COM對於小說的檢索提供了書目以及書評的功能顯示出社會對於小說的觀感上的改變。


    圖書館員經常強調分類法的實用性,而實用性的定義相當不明確。杜威雖然基於實用主義建立DDC,但它仍有些部分是其於知識上的哲學。


    DDC是從HARRIS反轉培根的知識體系的分類法為基礎而建構的。其類目並沒有呈現當代學科的性質。即使是實用的分類法也是基於某種哲學的基礎而影響其對於類目的關係。其強加並合理化其世界觀,讓使用者不用經過長考才能取得資料。但是必須透過其世界觀來搜尋資料。


    Bliss是以學術性一致來訂定大類,其認為反轉培根的知識體系沒有哲學概念,因為主要的科學已經分散開了,其同時批評DDC註記的低經濟性跟複雜性。其認為圖書館分類法不能只基於實務需要,其必須要具有教育功能,透過了解知識的關聯可以理解整個世界。他認為分類法必須與學術具有一致性。他認為定義明確的分類表會與時俱進,不過在後解構主義社會中將不易達成。


    DDC的流行在於其標記使用阿拉伯數字的概念。Paul Otlet Henri La Fontain關注於將語言轉換成國際語言。而阮岡納桑則是想要將個人認知的語言轉化成單純的符號語言。分類標記的翻譯是符號學的案例。Sassure Peirce把符號當作語言分析的基本單位。Sassure認為符號是由意符(Signifier)和意指(Signified)兩部分所組成。意符是符號的語音形象;意指是符號的意義概念部份。由兩部份組成的一個整體,稱為符號。而Peirce則認為符號包括代表項(representamen)、指涉對象(object)和解釋項interpretant) 所組成。而圖像符號可分為象徵性符號(Symbol)、指示性符號(Index)、象形性符號(Icon)。圖書分類標記法通常使用已經具有其他意義的符號。如阿拉伯數字、希臘字母。


    國際十進分類法由Paul Otlet Henri La Fontaine製作,以DDC改良並使用分面組配式分類法。Otlet認為他的分類語言可以呈現原始文件的核心理念。


    阮岡納桑的冒號分類法使用人(關鍵系統)、事(材料)、能量(過程與操作)、空間、時間,即為「PMEST 來標記。而他認為封閉的列舉式系統只適合用來描述固定的知識如古希臘哲學,並不適合當今變動成長快速的知識。他認為他的標記語言可以表示可以意會不能言傳的概念。


    當前超文本的出現再一次挑戰了知識組織,同時知識的架構也從既有的樹狀結構轉變成了樹根結構。


心得:


   本文敘述了分類法的知識呈現的過程以及原理,透過閱讀此文可以讓人再一次重新思考分類的目的是什麼,甚至進而思考資訊組織的概念及目標究竟是如何。


   本文充斥了大量的哲學術語,對於理解上確實造成了部份的障礙,但是對於其所欲闡述的概念仍能有個模糊的概念。


   基於對於本文的理解,讓我體認到自己對於其他學科認知的不足。很多的概念都是我未曾接觸過的,必須要做進一步的閱讀才能從中有所收穫。在現階段而言,本文對於我而言難度有些偏高。


 

2007年11月5日 星期一

What is diffusion?

我有在公共電腦上面看到別人的作業



相較之下 我寫的跟大便一樣



我是個沒有創造思考能力的考試機器 ㄎㄎ



Author
Rogers,  M.

TitleWhat is diffusion?


CitationDiffusion of Innovations. New York: The Free Press. 5th ed.2003


Topic:擴散 


Purpose:說明擴散的原理


Methodology:理論分析以及案例分析


Finding


Summary


    本文首先以秘魯推廣燒開水的案例將接受創新的人分為1.基於傳統風俗的接受者2.被說服的接受者3.抗拒者。創新計畫的接受度取決於是否能與當地的價值觀相容。此案例同時強調了人際網路的關鍵性,新知的擴散是一個社會過程而非科技事件。潛在接受者如何看待新知推動者也會影響其接受新觀念的意願。


    擴散是一種過程,在一定時間內,由社會中的成員藉由特定管道傳播關於某項新知的訊息。其為一種特殊形式的溝通。其溝通的訊息與新知有關。擴散亦為社會的變遷,因為新知擴散會使得社會結構產生變化。


    並不是有益的新知就會快速的被接受,必須仍要經過推廣才會被大眾所接受,如英國海軍防治壞血病的案例,以及Dvorak鍵盤並未廣泛被利用。科技創新並不必然得到成功擴散以及廣泛接受。


    擴散的四大要素為1.創新2.溝通管道3.時間4.社會體系


    創新意指接受端認可一個觀念為新時,此即為創新。大多數被研究的新知擴散多為科技上的創新,但科技是為了某依特定目標而設計的工具。應思考科技創新中的軟體層面,意即思想上的創新。科技本身就是一項軟硬體的混合物。創新的潛在優勢會影響接受的程度。傳統的創新研究只處理單一的案例,而目前的潮流將會考慮相關的創新傳播並已創新群集稱之。


    創新易於讓人接受的屬性為1.相對優勢:比既有更好2.相容性:跟社會體系及價值觀不相牴觸3.複雜性:可以讓人理解的程度4.可試驗性:透過實驗減少不確定性5.可觀察性:看的到創新的結果。另外在創新中又在一次創新的概念為再發明。


    創新傳播的溝通要素為1.創新2.了解創新的人3.不了解創新的人4.溝通管道。大眾媒體是最為快速且有效的管道,而網際網路的互動式溝通對創新來說也是很重要的。


    在溝通的過程中,以雙方對創新的看法是異質的,而在其他變數上是同質的情況下最為理想,因為與特質相近的人較容易溝通,而又必須存有對創新的不一致認知才能有傳播的產生。


    創新中的時間因素為:1.創新決策過程2.個人接受創新時間的早晚3.體系的接受率


    創新決策過程為1.認知:知道創新的存在和其效用2.說服:個人對於創新的正負面看法3.決策:選擇取捨創新與否4.執行:實踐創新5.確認:就先前的決策做再一次的確認。創新決策過程是一項搜尋和處理資訊的過程,個人以取得的資訊來降低對創新的不確定感。而創新決策的結果有兩種,即為接受跟不接受創新。


    基於創新性可以將接受者分類成:1.創新先驅者2.早期接受者3.早期大多數4.後期大多數5.落後者。


    接受率是指在一社會體系中全體成員接受創新的相對速率,而多以體系中具相當比例的成員接受創新的快慢來衡量的,並非以個人來衡量接受率。


    擴散必須在社會體系中進行。社會結構為各單位在體系中的定位,而此結構讓體系中的成員行為具有一定的規律性和穩定性,從而進行具準確性的預測。社會結構本身就是一種資訊,因為它能減少某些不確定性。傳統規範界定了體系可容忍的行為範圍,也影響的創新傳播的程度。


    創新先驅者對於擴散作用不大,反而是體系中的意見領袖具有較大的影響力。當社會體系傾向變革時,其亦展現出創新性;若社會傳統規範反對改變時,其則與傳統一致。意見領袖是社會結構的一個縮影和象徵。而其特質為1.熱衷於外在的溝通2.擁有較高的社會經濟地位3.創新性較高。而最重要的是意見領袖居於人際溝通網路的中心,對於體系內的溝通具有相當大的影響力。


    擴散推廣人員則是從體系外部對體系發生影響,通常會延攬意見領袖作為其代言人來推廣。因為推廣人員與體系內部成員存在著相當程度的異質性,溝通較為不易,因此亦會僱用與體系成員具有較高同質性的人士來推廣創新。


    創新決策的種類有1.個人抉擇式:個人自行決定接受創新與否,不受外界影響2.集體表決式:由體系成員之共識決定是否接受創新3.權威式:由體系內掌握權力的相對少數決定。以汽車的安全帶為例,最早由車主決定是否安裝,屬於個人抉擇。1966年美國國會通過一項法令,規定全國新車必須裝配安全帶,並於開車前繫上,此則屬於集體表決。而後經過反彈之後,繫安全帶則變成個人抉擇。如今,許多州政府制定「開車必須繫安全帶」法案,此一決策類型又變回權威決策了。


    創新的後果有1.滿意的與不滿意的:創新使否健全體性之功能或削弱之2.直接或間接的:視其對體系的反應而定3.可以預料或不可預料的:體系成員是否可以預料創新帶來的改變。





Comment


    創新傳播屬於資訊的上中下游裡的下游,也就是資訊的傳播與應用部份,其所強調的是創新推廣到社會中的過程以及結果。其目的在於如何有效的傳播新知,此一觀點與圖書資訊學中讓使用者能夠取用資訊的研究方向不謀而合。前者屬於主動的傳播創新,後者則是被動的讓使用者檢索資訊,兩者間的共通性就是提供資訊。


    而本文中提到諸多創新傳播的特質以及屬性,亦可應用於圖書館推廣利用教育之中,透過掌握傳播的本質並有效利用其特性,對於推廣工作必然有事半功倍的效用。此外,除了應用在圖書館業務之外,在學科內所產生的創新亦可應用之。學科內的概念創新有時因傳播較慢,造成普及率偏低,或許會造成疊床架屋的研究結果。有效散佈學科內的新知,讓研究人員可以認知到較新的概念以及技術,對於學科的發展也能有較為有效的助益,正如同牛頓所言之「站在巨人的肩膀上」可以看的更高更遠,使得學科整體的發展更趨於進步。


 

2007年11月1日 星期四

渾渾噩噩

全然的不知所為何來



每次禮拜三都在打瞌睡 從早上9點打瞌睡到下午6點半



我也不知道自己在幹嘛 又不是交學費特地去打瞌睡的



可是光看著別人在台前打嘴砲 倒也沒什麼好說的



又不是說聽著聽著 有一天我就會打嘴砲了



每個禮拜兩三篇 我的英文還是不太好



用導讀串接而成的學習 知者幾稀



有沒有人要發表問題的?



不是一片靜默 就是偶爾插花



幹 雖然我上研究所以後好像就變成啞巴一樣 可是我真的不知道該怎麼說啊



每次摘要心得不知所云 總是讓人深感無力





我覺得寫心得是一種消磨自信心的一種很有效的方式



因為你完全不知道自己之前在看什麼東西 你只是一台翻譯機



最後硬著頭皮寫出來的東西 相信自己也不會想看第二遍



一次次的 只是要讓你體認 你其實懂得還很少



幹 怎麼聽起來很耳熟



這不就跟小時候被逼著背三字經千字文全唐詩的時候



媽媽說「現在不懂沒關係 你大了就懂了」的感覺有些熟悉有些相似



想來有些心酸 這麼些年 還是沒什麼長進





上學就好像上班 刷停車證就好像在打卡 出席只是代表我有來 不代表我有在聽 就跟上班會摸魚一樣



求的只是一紙文憑 卻不知求來何用



期末報告 還是不知道要幹嘛



我找不到任何的potential topic 這是哪個環節出了問題?



還是說真的應該先去當兵 才能燃起求學的渴望



可是我明明就是因為大學書沒唸好 才想要繼續唸研究所的啊



矛盾的人生



莫忘初衷



趕羚羊



機掰




2007年10月31日 星期三

Relationships in the Organization of Knowledge: An Overview

  TitleRelationships in the Organization of Knowledge: An Overview 

AuthorGreen, Rebecca.


CitationRelationships in the Organization of Knowledge,2001(pp. 3-18)


摘要:


    實體是現實最基礎的單位。關聯則是多個實體交互作用的結果。沒有任何實體是單純的。在說明關聯之前,必須要先定義關聯的範圍以及關聯的本質。我們使用抽象關聯來建立資料模型,以具體關聯來記錄資料。


    參與關聯的實體數量稱為元數。二元關聯的規律性相當吸引人使用,卻無法重新建構原始的多元關聯。大多數的關係都是不對稱的。如此的不對稱性意指必須說明參與關聯的實體。關聯參與者必須有序的或是以標籤來連結其與關聯的角色。


    二元關聯可以有:111對多、多對多關係。二元關聯亦有交換率a(b+c)=ab+bc


    決定關聯的語意是最為重要的一件事。而方法有四


 1.不分析語意,由列舉參與實體或參與類別來構成其關聯。參見、相關的使用即此一概念。  


 2.接近式關聯


 3.替關聯命名


 4.用正式語言提出關聯的語義。


    關聯的清單應該用開放的以及封閉的類別來處理,前者為非列舉式,後者為列舉式。封閉類別包含了階層以及對等的關聯,開放類別則包含了結構關聯。


    必須關注參與的實體以及關聯的語意。並無法從定義的封閉關聯類別去推測開放類別的範圍。關聯的種類並不是一體適用的。關注知識組織中實體的類別及其關係較為有效的方法。


    知識組織中的實體有整體、書目單元、主題、觀念、字詞、知識、使用者。而其關聯為


 1.知識紀錄單元


 2.內部文本與外部文本關聯


 3.主題關聯


 4.相關關聯


    在抽象層次,必須要思考需要辨識的實體類別以及類別之間的關係。O’neill(1989)提出了作品、文字、版本、刷次、書等五種實體。其藉由1對多等實體連結反映了一種階層式的關聯。但是並不是所有的關聯都是1對多的階層關聯。而IFLA則提出了作品、出版版本、載體版本、單件的書目實體。


    書目間存在著一種遞迴關係。而牽涉內容的書目單元間也存在著遞迴關係。


    一個特地作品的內容版本,其內部結構可以由章節不斷分解成更為細小的單元直至一字一句。


    載體版本間的引用關聯與其主題間的語意關聯具有相似的關係,如此可以改良主題檢索的方法(如主題索引以及關鍵字搜尋)Trivison(1987)發現有引用關聯的文件集具有高度的相似性。但其語意侷限在特定的相同詞彙上,忽略的同義的語意關聯。


    超文本連結與引用關聯式相似的,其不同點在於實做的方式。後者只能間接的引用,而前者可以直接的連結。而其思考面向為詳盡的分析來源以及目的地的語意關聯對使用者是否有益?以及連結種類是否可以自動產生?Trigg(1983)的研究分析了超文本連結的種類,多數與前所提到的關聯相似。Parunak(1991)則將連結分為關聯的、聚集的、改編的三種類型。


    主題檢索的困難在於文獻的多主題性以及使用者難以定義符合需求的主題和無窮盡的主題量。觀念是主題的基礎,所有的索引語言都說明了觀念的範圍以及關聯。決定適合的主題詞是主題關聯最常被應用的部份。這也開發了研究哪些關聯可形成複雜的主題的領域。


    相關關聯表現的是使用者與其需求以及與需求相關的資源的關聯。從使用者的角度和資源的層面建立相關關聯。雖然話題性並不是產生相關時重要的條件,但其仍是決定相關時很重要的一個層面。


     知識組織中的關聯是複雜的,處理關聯的需求來自於爆炸的資訊以及持續自動產生紀錄的結合。人類理解的關聯並無法與電腦分享。表現以及運用關聯可以提高檢索系統的品質。但最終的問題是,如果可以合理的解釋資源的相關性,那麼高品質的檢索卻是來自於仍有未被檢索到的相關資源。





心得:


    我對於關聯的概念大多數來自於資料庫課程,兩相對照之下並無太大的不同。關聯的分析最主要也是要增加提供使用者的資訊。一如IFLA提出FRBR的資料模型之後,其便可以展現出作品與作品間的書目關係。


    除了作品之間的關聯,分析引用以及連結的關聯可以提供使用者更加精確的選擇其所需的資料。而主題關聯的研究則可以呈現一主題的學術脈絡。相關關聯的研究則是以使用者滿足需求與否來決定其關聯。


    通篇而言,個人只對於書目關聯的部分較為理解,其餘如主題、相關、連結等的關聯研究,也許是由於對原文上理解的錯誤,又或是其概念太過抽象,並無法確切理解其研究的目的以及最終目標為何。