嘴砲人生: 資訊科學

顯示具有 資訊科學 標籤的文章。顯示所有文章

2008年2月12日星期二

圖書館自動化系統安裝----嘴砲

記得第一次用這個系統是去西嶺國小用的之後陸陸續續的又用了幾次最後又變成只有在用KOHA

總覺得應該記下來做個紀念雖然以後不會再用了也可以當個青春的軌跡

原本的說明書是用IIS加Coldfusion來跑

不過普通電腦不會灌IIS 我在一次的機會下研究出如何讓coldfusion在appserv下面跑

茲以為記

流程

1.基礎設施：windows作業系統+java runtime enviroment

(因為coldfusion的資料庫檔案瀏覽器要用JAVA開不然會開不出來不過還是可以直接貼檔案路徑)

1.1 下載圖書館軟體

2.安裝伺服器軟體　

   2.1 Appserv-win32-2.4.4a (注意版本,新版的MYSQL會變成UTF8...這個程式還是在用BIG5在跑) 　

   2.2 Coldfusion4.5 (設定密碼及網路根目錄(預設值為appserv/www)

      (4.5版是免費軟體ㄎㄎ不過專業版的話可以直接匯入國圖的資料)

   2.3 從cfusion\bin複製ApacheModuleColdFusion.dll到appache\modules

     (要讓APPSERV載入模組)　

   2.4 修改httpd.conf

    2.4.1 在httpd.conf 裡面搜尋LoadModule

          新增一行加入 LoadModule coldfusion_module modules/ApacheModuleColdFusion.dll 　　　

2.4.2 在httpd.conf 裡面搜尋AddModule

          新增一行加入 AddModule mod_coldfusion.c 　　　　　

2.4.3 在httpd.conf 裡面搜尋DirectoryIndex,於index.php3後空格新增 index.cfm

    2.4.4 儲存檔案　

    2.4.5 重新啟動appche(程式集裡面restart appache server) 　

    2.5 解壓縮library.rar至網路根目錄(預設值為appserv/www)

2.6 CF資料庫　

2.6.1 開啟安裝首頁程式集>Coldfusion>coldfusion express admintrator

            (預設值為http://127.0.0.1/CFIDE/Administrator/index.cfm)

2.6.2 鍵入安裝密碼 (參考2.2)　　

    2.6.3 點選ODBC連結(資料庫連結) 　　

    2.6.4 新增資料 Microsoft Access(persondata,discussdata,mediadata,exchangedata) 　　

      　　路徑位置 library/mdb/psrsondata.mdb (類推) 　　

    2.6.5 安裝完成

3.軟體操作　

   3.1 軟體說明書 http://www.hkes.hcc.edu.tw/teacher/wywang/index.htm 　

   3.2 localhost/library/maintain/ 登入(IP)(預設a,a) 　

   3.3 更改權限，新增管理者　

   3.4 編目　

   3.5 修改　

   3.6 讀者資料

4.由我跟怪胎陳共同開發的條碼製造機 http://green.lins.fju.edu.tw/~lisa/barcode/barcode.php

   已經用3年了不會改版需事先下載3 of 9字型

請用IE開啟不支援其他瀏覽器條碼紙要用鶴屋的56格標籤紙

以上

有興趣想要在自己家裡面做圖書室的話照著步驟來就可以了ㄎㄎ

---

新的KOHA真是越來越花俏了我上次用VMWARE已經成功的安裝過一次了 Z3950也是一次到位

不過實在是灌很久 OTZ 我想還是很難推廣吧ㄎㄎ

---

我想以後應該再也不會用到了吧....這些都是我的青春....嗚呼尚饗

2007年12月17日星期一

The State of Retrieval System Evaluation

Author：Salton, G.

Title：The State of Retrieval System Evaluation

Citation：Information Processing &Management 28:4(1992):441-49

Topic： 說明當前系統評估之現況

Purpose：讓人對於系統評估之研究有一概括的理解，並從而思考未來研究的方向

Methodology：文獻分析

Finding：

Summary：

雖然系統評估的研究已經發展已久，但仍有不少專家對於其所使用的研究方法產生質疑，其中COOPER認為傳統的系統評估是基於變化極大的相關判斷以及許多主觀的因素，令人無法信服，另外回現率及準確率的使用也受人質疑，因此有人認為實驗室所產生的結果無法套用的現實生活之中。一般評估系統多使用1.求全率，指檢索到相關文獻的能力2.精確率，指排除非相關的文獻的能力，來測量系統效能，這建立於認為使用者想要檢索到大量的相關文獻同時拒絕大量的不相關文獻的假設上。但是此一概念與效用理論並不相容。Cooper認為所謂相關的文獻有時是沒有用的，使用者可能會因為一篇相關文獻而過度評價低回收率的系統。而事實上，只有少數的使用者會關注於檢索到所有相關的文獻上。傳統回收率跟準確率的雙指標有比較上的困難，另外也無法詳細的呈現檢索集的規模與已檢索的數量。但是Swet的E-measure及Cooper的預期檢索長度等測量值均有計算上的困難，因此回收率及準確率仍然是目前檢索評估的主流工具。

大部分的檢索評估研究都是在實驗室裡進行的，現實世界裡很難進行與實驗室相同的實驗。因此有以下批評：1.檢索要求無法表現真實的使用者需求，相關的判斷也無法與現實相同2.每個人的相關判斷都不盡相同3.回收率建立於所有相關的文獻上，而事實上對於無法檢索到的相關文獻只能使用估測值4.查詢詞與文獻測試集規模過小。

Cranfield實驗是第一個以固定的查詢及文件集配對的大規模實驗，其比較了三種索引語言：單一詞彙語言(single term language)、簡單概念索引語言(simple concept index language)與控制詞彙索引(controlled term index)，並應用了切截、同義詞、類同義詞等技術，其結果證明了單一詞彙語言的效能最佳。單一詞彙語言完全反映了自然語言的專指程度，既廣且深。而簡單概念索引語言的高度專指性造成了檢索效能低落。Swanson和Harter認為該實驗有兩個問題：1.使用者比較喜歡使用關鍵字比對2.該實驗並未包含大量相關但未被檢索出的文獻。但是即使在相關的判定上有所缺失，以及無法準確的推估未檢索到的相關文獻，但是基於同樣的基礎上，比較不同索引語言的效能仍是有效的。

SMART系統評估以CRANFIELD的測試集為基礎，目的在於證明內容分析會增加檢索系統之效能，但實驗結果發現加權關鍵字加上切截後的檢索結果較佳，而內容分析之檢索結果卻較預期的差。

雖然Smart和Cranfield的測試結果是互補的，但並不廣為接受，其原因在於小型實驗測試與現實檢索的差異性。

Stairs全文系統的評估報告指出其準確率為0.79，回收率為0.20，其使用無權重的關鍵字及布林邏輯進行檢索，研究指出回收率0.20已達全文檢索系統的最大值。McCarn和Lewis認為使用者自行擁有準確率的門檻，這意指系統應該提供讓使用者縮小檢索範圍的機制來提供更為準確的檢索。在實驗環境中查詢詞的擴展或窄化可以改變回現率及準確率，但在現實中是不可行的。系統評估必須建立在值得信賴的相關判斷以及可信的相關文獻數量。而SMART系統沒有特別強調回收率及準確率，但在其大規模的測試集的實驗下，不同索引語言是具有被比較的基礎。而過去的系統評估多關注於查詢詞與文獻測試集的關係，未來的研究方向則是應從使用者的相關回饋來呈現系統與人的互動。

Comment:

本文旨在分析當時的系統評估研究，同時指出未來的研究方向應該朝自動分類索引邁進。本文所分析之研究仍多屬於系統導向的研究方法，多以回現率及精確率來測量系統效能，忽略了使用者與系統互動的部份。但是由於使用者導向的研究方法變數過於龐大，且因人而異，對於整體環境無法一體適用，因此目前對於系統評估的方式仍然是以回現率以及精確率為主。

目前必須思考出能夠量化的相關評估指標，從而發展出可以使用單一測量值比較系統效能的研究方法，當前雙指標的反比關係對於系統比較上一直存在著根本上的謬誤。

The Cranfield Tests on Index Language Devices

Author：Cleverdon, Cyril.

Title：The Cranfield Tests on Index Language Devices

Citation：ASLIB Proceedings 19:6 (1963):106-30

Topic：索引方式的比較

Purpose：決定索引方式之優劣

Methodology：實證研究

Finding：自然語言單詞具有最高的檢索效能

Summary：

CRANFIELD I實驗是為了測試國際十進分類法(Universal Decimal Classification)、面向分類法(Facet Classification)、依字母順序排列之主題索引(alphabetical subject catalog)，以及單詞組合索引法(uniterm system of coordinate indexing)等四種索引系統的操作效能，而實驗結果顯示四者的效能均不相上下。而其測量值分別為1.求全率，指檢索到相關文獻的能力2.精確率，指排除非相關的文獻的能力。造成上數結果的原因在於四種索引系統為了同時提高求全率和精確率所設計出之複雜產品，所以會應用相同的概念來增加系統效能。

CRANFIELD II則是為了測試索引方法的效能，其中文件以三種方式製作索引：1.使用自然語言單詞記錄索引詞2.單詞觀念結合之主題3.給予主題相關權重。實驗的第一步是決定各個文件與各個問題相關程度，其分為1.完整回答問題的2.高度相關的，可激發額外聯想3.有用的，概論式導引4.最小興趣的。而在實驗中，使用誤引率(fallout ratio)(檢索到不相關的文獻/所有不相關的文獻)可以比較不同規模的文件集效能。

實驗中測試了三種索引語言：單一詞彙語言(single term language)、簡單概念索引語言(simple concept index language)與控制詞彙索引(controlled term index)，並應用了切截、同義詞、類同義詞，總共產生了33種不同的索引方式。實驗結果證明了在CRANFIELD I時提出求全率及準確率具有反比的關係，因此要直接用這兩個測量值來比較系統效能是相當困難的。

Salton的SMART系統測試基本上與CRANFIELD實驗的目的是一樣的，均為了測試不同索引方法的效能。而其不同點在於該程式能夠呈現一可信的相關排序，同時使SALTON可以計算常態化求全率，擺脫傳統雙指標比較方法。而實驗結果顯示單一詞彙語言表現最好，控制詞彙索引居次，簡單概念索引語言則效能最差。在任何環境下，最有效的索引方式是在同義詞上進行控制，而使用未經控制所結合的自然語言單一詞彙。實驗的結果可以視為一種巧合，其原因可能在於索引詞彙的專指程度，單一詞彙語言完全反映了自然語言的專指程度，雖然透過同義詞及切截雖然會降低專指程度，但會增加其檢索效能。而簡單概念索引語言的高度專指性造成了檢索效能低落。控制詞彙索引則同時表現了前述兩個現象。

專指性與索引詞彙的數量以及索引的窮盡程度有關，前者代表著檢索效能在索引詞彙達到一定數量時為最佳，而後者則代表索引辭所涵蓋的範圍，高度窮盡會降低檢索效能。

自然語言單詞加上切截功能和同義字控制在索引工作上具有最高的檢索效能。

Comment：

本文雖然成文於1960年代，但是卻是研究系統分析時重要的文獻。其研究方法很明顯是系統導向的，其只關注查詢詞與文獻及之間的關係。而其研究結果發現自然語言單詞的索引方式的效能遠大於控制詞彙以及自然語言片語的效能，此一結果無疑對圖資界是一種震撼，因為圖資界長久以來認為唯有組織資訊才能夠有效的取用資訊，而其方法就是使用控制詞彙來聚集文獻。沒有任何加工的自然語言單詞的效能高於控制語言索引，這不正是說明了圖資界的努力是白忙一場？

但是因為其對於圖資界的衝擊過大，所以也招來諸多批評，其中對於未檢索的相關文獻數則最被人質疑。

CRANFIELD實驗是有史以來第一個大規模實驗，雖然其系統導向的研究方法在今日來看已有些不合時宜，但是其樹立的里程碑卻是不可抹滅的。今日，我們可以透過融合使用者層面的研究方法，並且加入資訊科技的應用，對於系統評估定將有更進一步的發展。

2007年12月9日星期日

期末報告DEADLINE剖析

資訊學研討

01/21 序號 17

Title：語意網應用(初探)(淺談)(剖析)(嘴砲)...

Topic：說明第二代網路語意網如何改變當前的資訊檢索

Purpose：為了瞞混過關

Methodology：嘴砲

老師對我的題目說了「自求多福」跟「好自為之」

最後一個禮拜報告所以要1/14結案

應該是用大量的嘴砲學以及少量的應用層面作為主軸

--本科目前還剩兩篇文獻還沒翻譯

資訊組織研討

12/26 序號 5---初估會DELAY1個禮拜所以應該是01/02

Title：未定...[很想繼續用語意網怕會被同學打再看著辦]

Topic：語意網與資訊組織之關連

Purpose：兩者間的比較或淵源

Methodology：嘴砲

這個看來是最快要交的一篇這邊應該可以聚焦在資訊組織上反正語意網最原本的概念就是資組

可能就組織的方式做全面性的概論最後在嘴砲一些願景

--本科還有一篇口頭兩篇書面文獻

管理心理學

12/26 序號 2

Title：傑克威爾許管理哲學之我見

Methodology：抄書

這個也很緊迫書已經借了可是還不知道怎麼開始寫

不過應該不難...吧就把書跟講義做連結好了

「xxx這一管理行為無獨有偶的與管理心理學中的XXX原則及XXX效應如出一轍 .....」

--本科還有一次分組報告

自動分類索引

01/18 序號 9

Title：語意網技術概論

Topic：XML大雜燴

Purpose：說明標記語言的進化以及語意網之組織

Methodology：打算用大量的技術名詞跟程式碼來矇騙視聽大眾以期在課堂中收瞌睡之效

這個題目可以說是最早訂的幹可是通通都拖到現在都沒用 OTZ 人真是惰性的動物

技術就技術啦老嘴砲也很空虛可是我RDF SCHEMA語法看不懂

--本科還有兩次作業

----

只剩兩個禮拜就要交了做高中生程度的報告可能會被同學看不起老師可能也會叫我重做

可是我以前很少做報告............

機掰我這三天要好好玩個痛快幹然後開始埋首書堆

----

書單

語意網技術導論

語意網的概念、方法、應用 -碩論

Semantic Web technologies : trends and research in ontology-based systems

The semantic Web : a guide to the future of XML, Web services, and knowledge management

Towards the semantic web : ontology-driven knowledge management

傑克.威爾許的4E領導學

致勝威爾許給經理人的二十個建言

傑克.威爾許簡單講

傑克.威爾許如是說勝在影響力

再造奇異傑克.威爾許傳奇

2007年11月19日星期一

Some Fundamental Concepts of Information Retrieval

Author：Patrick Wilson

Title：Some Fundamental Concepts of Information Retrieval

Citation：Drexel Library Quarterly 14:2(1978):10-24

Topic：說明資訊檢索中關鍵概念

Purpose：理解人如何處理資訊

Methodology：現象描述

Finding：資訊組織應以多面向分析，而非單一的使用主題相關來聚及資訊。

Summary：

文件中所包含的面向有兩種，一為關於某件事之資訊，一為關於某件事的正確資訊。前者可以稱為弱資訊(week)後者可以稱為強資訊(strong)，而強資訊其實是一種特殊形式的弱資訊。文件本身所包含的只有文字(context)，擁有相同文字的文件並不代表其擁有相同的資訊。資訊的產生端賴於使用者自身的詮釋。人在接收資訊時有兩個要素，第一是理解所要傳達的資訊，第二是相信該資訊為真。即便我不相信你所提供的資訊，但是我仍從中得到一些了解。必須要正確的推斷文字所代表的涵義才能接收到資訊。我們用思考來推斷文字的涵義。

資訊檢索系統所提供的資訊可以分為不確定真假及確定為真兩種類型的資訊。提供前者的系統應該稱為內容檢索(content retrieval)，而後者才可稱為資訊檢索(information retrieval)。

在分類及索引中，我們利用「關於」來描述文件所包含的主題。決定文件的主題是相當複雜的，因為一份文件可能由多個主題所構成，或者是其主題曖昧不清，造成定義上的困難，因此界定「關於」操作型定義就更為重要。而MARON提出的以使用者最常使用的檢索詞來表示文件的主題。必須要利用文件本身的結構來整理組織知識。

資訊檢索系統中所討論的相關概念基本上是指”值得檢索的資訊”。分別相不相關的資訊只是將資訊分為是否應被檢索而已。但是這種相關概念是不完整的，沒有任何因子可以單獨影響相關性，相關性的決定應該視檢索及檢索者而定。決定檢索價值的因素也相當多元，而且多是因人而異。因此目前較為有效的方式是以主題相關決定相關性。

需求(need)則是達成目標的要件，在達成目標之後需求也就自然消滅了。而以消極層面而言，需求指的是可以促進達成目標的物件，其目的在於減少達成目標的成本。亦即若我的需求無法滿足，我可能會退而求其次尋求其他的方法來達成較低層次的目標。而需求本身可以是知覺或不知覺的，前者是主觀的心理狀態，後者則是對於所缺乏資訊的不知覺。需求只有在提供真正需要的物件時被滿足，而使用者的需求滿足與否則要視其是否認為已被提供所需的物件。在誤訊(misinformation)的情況下，使用者的需求也有被滿足的可能性，這彰顯出需求滿足的主觀性。因此在資訊檢索系統中，可用性評估會有過於主觀的疑慮。

資訊的描述即是該文件主要用途(primary use)的描述。而資訊的延伸用途(further use)則要視其主要用途的方向所延伸。在資訊檢索系統中，文件的主要用途是來自於作者對於該主題論述的資訊，亦即相同主題的文件可能有不同思考面向。必須以相同延伸使用的層面來聚集文件，而非以傳統的相同主題方式。只是透過描述主要用途的索引詞提供檢索，並從而驗證其相關性，對於資訊的分析是相當不足的。

當前的資訊檢索系統仍只能回應主題相關的需求，對於自然語言檢索、資訊內容的分析、資訊的用途等方面多是缺乏的，未來的努力方向應朝此邁進。

Comment：

本文成文的年代相當早，但是對於現象的分析仍頗為精闢。其主要論點在於資訊檢索系統並無法判斷資訊的內容，而只能從關鍵字匹配的角度提供資訊給使用者。此一方向大大削弱了資訊本身的廣度，單一字詞描述資訊的侷限性太大了，過度壓縮了資訊量。此一現象亦發生在分類法之中，亦即綜合性書籍只有一類號代表。

為了解決主題相關的侷限性，層面分析法目前已逐漸受到重視。透過多面向的描述資訊，可以將資訊較為有效的組織起來，並提供使用者更為簡便的檢索。同時在相關的概念發展之下，主題相關已經不在是唯一個相關關係，諸如情境相關、心理相關的與使用者高度連結的相關概念亦已發展而出。

A Perspective on the Measurement of Retrieval Effectiveness

方程式編輯器貼不上來...

Author：Cooper, W.S

Title：A Perspective on the Measurement of Retrieval Effectiveness

Citation：Drexel Library Quarterly 14:2(1978):25-39

Topic：評估資訊檢索系統

Purpose：推廣效用評估

Methodology：各評估方式的比較

Finding：效用評估應取代現有評估方式

Summary：

評估檢索效益的測量方法對於資訊檢索理論以及實務是必要的。最早的評估方法是「準確率」，意指檢索結果中檢索到的相關文件比率。而之後為了平衡準確率評估，「求全率」應運而生，意指檢索出系統相關文獻的比率。這兩者是最常用來評估資訊檢索系統的指標，但是彼此間存在著成反比的關係。在A系統擁有比B系統較高的準確率以及較低的求全率時，可以透過個別的交替曲線(trade off curve)做比較。但如過要評估排序過後的結果，則必須使用「常態化準確率」及「常態化求全率」。而此二指標亦受限於樣本大小，因此又有「誤檢率」的應用。

而效用(utility)評估則是取代相關(relevance)評估的新方法，其具焦於檢出結果對於使用者的價值，例如使用者是否能夠接受檢索的結果以及花費。雖然效用是一個新的評估概念，但是由於其尚未有一完整的計算公式，仍無法取代既有的準確率及求全率。同時因為其忽略了未被檢出的相關文獻比率，造成多數學者無法接受效用評估是有意義的測量方法。

在檢驗效用時，其公式有四種。其一為檢索規模可以讓使用者一一評估其效用。其公式為：U=V1+V2+V3+..+Vn。其二為使用者認為有效文獻價值為常數u，無效文獻之價值為常數v，而檢索相關文獻數為r，不相關文獻數為i，則其公式為：U=ur+vi。其三為若系統提供排序的結果，則使用者的需求會檢索到q篇相關文獻即滿足，而s為q減去檢索結果中所有相關文獻數之值，而假設有效文獻數為r，無效文獻數為i，j為負相關文獻之總數，且各文獻之正效用為u，負效用為v，則其效用公式為。在比較多個系統時，該公式可以簡化成e.s.l=，此即為預期檢索長度。

雖然公式的呈現有不同的形式，但是其目標均在於量化相同的「使用者效用」。

Comment：

本文旨在說明僅以準確率以及求全率來評估檢索系統是不足的，因為其兩者本身存在著反比的關係，造成同時以兩者比較系統效能時的偏差。而為了減少此一謬誤，則發展出了一個新的評估方法：效用。其並以阿幾米德為例，說明效用評估是創新的思考概念而非既有公式的補充，意欲證明其在系統評鑑上的高度指標性。

但是時至今日，最常見的評估方式仍是準確率以及求全率。效用評估為何未被接受？可能的原因在於其對於個別文獻的價值過於單一化，以及其計算公式的複雜化造成了推廣上的障礙。

現今評估系統的方式除了傳統兩個指標的比較外，相關的評估反而蔚為主流。雖然相關基本上也被批評為過於主觀，但是由於其高度動態的本質造成其高度的適用性。而如何客觀且精確的評估系統，正是目前所需努力的方向。

2007年11月5日星期一

What is diffusion?

我有在公共電腦上面看到別人的作業

相較之下我寫的跟大便一樣

我是個沒有創造思考能力的考試機器ㄎㄎ

Author：Rogers, M.

Title：What is diffusion?

Citation：Diffusion of Innovations. New York: The Free Press. 5^th ed.2003

Topic：擴散

Purpose：說明擴散的原理

Methodology：理論分析以及案例分析

Finding：

Summary：

本文首先以秘魯推廣燒開水的案例將接受創新的人分為1.基於傳統風俗的接受者2.被說服的接受者3.抗拒者。創新計畫的接受度取決於是否能與當地的價值觀相容。此案例同時強調了人際網路的關鍵性，新知的擴散是一個社會過程而非科技事件。潛在接受者如何看待新知推動者也會影響其接受新觀念的意願。

擴散是一種過程，在一定時間內，由社會中的成員藉由特定管道傳播關於某項新知的訊息。其為一種特殊形式的溝通。其溝通的訊息與新知有關。擴散亦為社會的變遷，因為新知擴散會使得社會結構產生變化。

並不是有益的新知就會快速的被接受，必須仍要經過推廣才會被大眾所接受，如英國海軍防治壞血病的案例，以及Dvorak鍵盤並未廣泛被利用。科技創新並不必然得到成功擴散以及廣泛接受。

擴散的四大要素為1.創新2.溝通管道3.時間4.社會體系

創新意指接受端認可一個觀念為新時，此即為創新。大多數被研究的新知擴散多為科技上的創新，但科技是為了某依特定目標而設計的工具。應思考科技創新中的軟體層面，意即思想上的創新。科技本身就是一項軟硬體的混合物。創新的潛在優勢會影響接受的程度。傳統的創新研究只處理單一的案例，而目前的潮流將會考慮相關的創新傳播並已創新群集稱之。

創新易於讓人接受的屬性為1.相對優勢：比既有更好2.相容性：跟社會體系及價值觀不相牴觸3.複雜性：可以讓人理解的程度4.可試驗性：透過實驗減少不確定性5.可觀察性：看的到創新的結果。另外在創新中又在一次創新的概念為再發明。

創新傳播的溝通要素為1.創新2.了解創新的人3.不了解創新的人4.溝通管道。大眾媒體是最為快速且有效的管道，而網際網路的互動式溝通對創新來說也是很重要的。

在溝通的過程中，以雙方對創新的看法是異質的，而在其他變數上是同質的情況下最為理想，因為與特質相近的人較容易溝通，而又必須存有對創新的不一致認知才能有傳播的產生。

創新中的時間因素為：1.創新決策過程2.個人接受創新時間的早晚3.體系的接受率

創新決策過程為1.認知：知道創新的存在和其效用2.說服：個人對於創新的正負面看法3.決策：選擇取捨創新與否4.執行：實踐創新5.確認：就先前的決策做再一次的確認。創新決策過程是一項搜尋和處理資訊的過程，個人以取得的資訊來降低對創新的不確定感。而創新決策的結果有兩種，即為接受跟不接受創新。

基於創新性可以將接受者分類成：1.創新先驅者2.早期接受者3.早期大多數4.後期大多數5.落後者。

接受率是指在一社會體系中全體成員接受創新的相對速率，而多以體系中具相當比例的成員接受創新的快慢來衡量的，並非以個人來衡量接受率。

擴散必須在社會體系中進行。社會結構為各單位在體系中的定位，而此結構讓體系中的成員行為具有一定的規律性和穩定性，從而進行具準確性的預測。社會結構本身就是一種資訊，因為它能減少某些不確定性。傳統規範界定了體系可容忍的行為範圍，也影響的創新傳播的程度。

創新先驅者對於擴散作用不大，反而是體系中的意見領袖具有較大的影響力。當社會體系傾向變革時，其亦展現出創新性；若社會傳統規範反對改變時，其則與傳統一致。意見領袖是社會結構的一個縮影和象徵。而其特質為1.熱衷於外在的溝通2.擁有較高的社會經濟地位3.創新性較高。而最重要的是意見領袖居於人際溝通網路的中心，對於體系內的溝通具有相當大的影響力。

擴散推廣人員則是從體系外部對體系發生影響，通常會延攬意見領袖作為其代言人來推廣。因為推廣人員與體系內部成員存在著相當程度的異質性，溝通較為不易，因此亦會僱用與體系成員具有較高同質性的人士來推廣創新。

創新決策的種類有1.個人抉擇式：個人自行決定接受創新與否，不受外界影響2.集體表決式：由體系成員之共識決定是否接受創新3.權威式：由體系內掌握權力的相對少數決定。以汽車的安全帶為例，最早由車主決定是否安裝，屬於個人抉擇。1966年美國國會通過一項法令，規定全國新車必須裝配安全帶，並於開車前繫上，此則屬於集體表決。而後經過反彈之後，繫安全帶則變成個人抉擇。如今，許多州政府制定「開車必須繫安全帶」法案，此一決策類型又變回權威決策了。

創新的後果有1.滿意的與不滿意的：創新使否健全體性之功能或削弱之2.直接或間接的：視其對體系的反應而定3.可以預料或不可預料的：體系成員是否可以預料創新帶來的改變。

Comment：

創新傳播屬於資訊的上中下游裡的下游，也就是資訊的傳播與應用部份，其所強調的是創新推廣到社會中的過程以及結果。其目的在於如何有效的傳播新知，此一觀點與圖書資訊學中讓使用者能夠取用資訊的研究方向不謀而合。前者屬於主動的傳播創新，後者則是被動的讓使用者檢索資訊，兩者間的共通性就是提供資訊。

而本文中提到諸多創新傳播的特質以及屬性，亦可應用於圖書館推廣利用教育之中，透過掌握傳播的本質並有效利用其特性，對於推廣工作必然有事半功倍的效用。此外，除了應用在圖書館業務之外，在學科內所產生的創新亦可應用之。學科內的概念創新有時因傳播較慢，造成普及率偏低，或許會造成疊床架屋的研究結果。有效散佈學科內的新知，讓研究人員可以認知到較新的概念以及技術，對於學科的發展也能有較為有效的助益，正如同牛頓所言之「站在巨人的肩膀上」可以看的更高更遠，使得學科整體的發展更趨於進步。

2007年10月15日星期一

馬太效應

Author：王崇德

Title：馬太效應

Citation：資訊科學原理。台北市：農資中心；民80

Topic：說明馬太效應現象

Purpose：對馬太效應有效控制

Methodology：現象分析

Finding：必須要有所控制

Summary：

馬太效應是一種社會心理學概念，出自於《新約全書‧馬太褔音》25章「因為凡有的，還要加給他，叫他有餘。沒有的，連他所有的，也要奪過來。」

它描繪了優勢和劣勢的積累過程：一經存有優勢，則這種優勢局面會不斷地加強，反之若處於劣勢，則這種不利條件也會繼續加劇。

在某一特定學科中，全部論文的半數係由該領域中全部作者的平方根的那些人所撰。高產作者出現是社會選擇與調整的結果。優勢會進行累積的過程。同時弱勢也亦然。精英集團出現便是說明了馬太效應的影響。

而論文多次受引以及專著頻繁被借閱，這種被動產生的結果即為集中取向。專書的20%滿足了80%流通量。而文獻的受引因為集中取向的影響可以分析出被大量引用的核心期刊。

一般情況下，核心趨勢可能是相乘的累積，集中取向似是相加的累積

而在文章量有所限制時，每個人平均可以發表20篇文章，而此時具有高知名度或者是權威的作家可能有機會發表20篇以上的文章，此時其便奪走了其他作家可以出版的數量。此係由於馬太效應的機制，他“掠奪”了各方面都不如他的作者。

對於馬太效應有兩個假設，一為其強度與現有狀態比例關係，其二為負效應有限累積。有兩個實驗來證明此二假設，第一個單缸實驗說明了成功導致成功，失敗導致失敗。某些論文一旦得以受引，它們再次受引的概率便增大，反之在取得足夠的k次引用前，在此前不受引的概率會是很高的。第二個多缸試驗則表現出失敗不能無限累積的概念。並闡釋了核心趨勢。其例為同主題文獻在期刊上的集中行成了核心期刊，以及退稿後改投其他期刊的行為。

而應用馬太效應的面向有1.摒棄平均，突出重點，設立文獻中心，專司採購核心期刊而非齊頭式採購期刊，並透過地區的佈局，讓文獻能夠保證取得。2良性堆加，自然導向。科技人員踴躍地出席會議也是馬太效應的使然。特別是顯貴、名氣大的科學會議更令人嚮往，許多人認為出席會議是一種榮耀。

而消除馬太效應則要適度積累，防止偏頗。如諾貝爾獎得主的受引次數。另必須關注核心期刊之外的文獻。馬太效應是一種習慣勢力，因此新人新事的出現就要受到拘束。

Comment：

馬太效應是一種社會現象，並沒有嚴謹的科學考證。大抵上所謂集中以及核心的概念，都是受到馬太效應的影響，說明了人們一窩蜂的現象。

因為馬太效應的發生，產生了核心期刊以及核心作者，以及高頻受引論文和高頻借閱專書。此一現象，集中了資源的累積，使人可以除去浪費在過於廣泛的資源而就較核心的資訊進行研究。妥善的操作馬太效應，可以讓資源更為有效的被運用。而馬太效應必須要經過人為的控制，才不會無限制的累積，造成新生的知識受到壓迫。

耗散結構

Author：王崇德

Title：耗散結構

Citation：資訊科學原理。台北市：農資中心；民80

Topic：說明耗散結構

Purpose：敘述資訊中的耗散結構

Methodology：現象分析

Finding：必須輸入負熵維持系統的有序性

Summary：

熱力學第二定律是規定能量轉化過程方向性的，這條定律的本質就是“增熵原理” 。其表述為：不可能把熱量從低溫物體傳到高溫物體而不引起其它變化即熱傳導不可逆。熵決定於系統內微觀粒子排列的機率(或稱概率) 。系統有自發地向熵增大方向變化的趨勢。

熵不斷增加的意義是，分子運動的無序性的增加，有序性的減少。

而耗散結構建立於開放系統上，它既與外界進行物質交換，又是與外界進行能量交換的系統。而熵變的概念是任何一個系統的熵變化是由兩部分組成，一為系統與外界交換物質和能量而引起的熵變流；一系統內部自發產生的熵。而在系統遠離平衡態的時候，系統不斷地從環境互動而取得負熵，新的結構和新的組織就能自發地形成，此即為耗散結構。在遠離平衡的非線性區形成的新的有序結構，並以能量耗散來維持其自身的穩定性，就是耗散結構。

. 而形成耗散結構的條件：為 1系統必須是一個開放系統2.系統應當遠離平衡態3.系統內部要素之間存在著非線性的相互作用4.系統從無序向有序演化

資訊系統是一個開放的系統，並且是物質系統與概念系統的綜合體，而且對新技術、高技術特別敏感。

而文中將耗散結構運用在資訊科學領域時舉例如下：

1.文獻不斷的增加，顯然增大了文獻系統的無序程度。編製加工文獻就是一種旨在求得有序的負熵流輸入。但是加工文獻雖然克服原始文獻的無序狀態，卻又帶來了加工文獻本身的新的無序。輸入負熵流，使之更加有序化－轉化為目錄之目錄、名錄之名錄、文獻指南型的再加工文獻。

2.各種受控詞表都不是完整無缺的。會有錯漏以及缺欠的問題，此均為詞表本身的“增熵”結果。而修訂詞表就是輸入負熵使其趨於有序。

3.文獻流的無組織狀態，這種狀態也可以認為就是“文獻增長熵”，它是社會文獻信息系統無序的惡化趨勢，透過分類的處理，即是輸入負熵。

4.館藏不斷增加的過程也是增熵的表現，可以運用滯架週期、剩餘有益性來輸入負熵，從而有效的管理館藏。

Comment：

耗散結構意即一消耗外界能量來維持自身有序性的系統，簡言之就是透過人為管理的方法輸入負熵，使系統之熵變趨近於零，讓該系統中之分子排列趨於有序。

大凡任何人為的管理以及操作都是輸入負熵的行為。一個開放的系統，若沒有經過人為的控制，其熵將會趨於無限大，也就是混沌而雜亂無章的狀態。而由於資訊大量產出，無所控制，造成了所謂的資訊爆炸。為了有效的管理資訊，資訊科學由是應運而生，目的在於使資訊趨於有序，讓使用者可以取用其所需的資訊。

透過運用耗散結構的概念，我們可以分析各種行為，判別其對於整體而言是輸入負熵或是正熵，來決定此一行為對於系統的操作是否對於其有序化有所助益。

2007年9月30日星期日

Redefining information science

Author：Chaim Zins

Title：Redefining information science：from “information science” to“knowledge science”

Citation：Journal of Documentation Vol. 62 No. 4, 2006 pp. 447-461

Topic：重新定義資訊科學

Purpose：探索資訊科學的本質

Methodology：五段論證

Finding：資訊科學確有其必要改名成知識科學

Summary：

目前對於資訊科學沒有統一的見解。不同的解釋代表著不同的知識領域。在以資料、資訊、知識三者討論資訊科學時，若認為資料是原始的資訊，資訊是原始的知識時，如此由於知識的高位階，則應該將資訊科學改名成知識科學。而其中爭議在於一者認為知識與資訊是相似的，沒有位階問題。一者認為資訊是客觀的實體，而知識是個人心智模式的總和，所以資訊科學討論的是資訊。

傳統知識論分為三種，一為實際知識，一為親知，一為定理知識。前者為KNOWING HOW的技能，後二者中前者為不經由中介直接感受到的資料，而定理知識則是知道那個物體。而資訊科學則是由可推論的定理知識所建構。

知識可以被認為是一個人的心智或是一個物件。前者認為主觀知識是由個人認知其為真所建立，後者則認為知識是客觀而獨立存在的。

Popper的世界論中世界1由所有的物理實體組成，世界2由所有的主觀實體所組成，世界3由人的心智所組成。我們無法確切得知在主觀意識外是否存在任何客觀知識。因此我們應該以宇宙知識來描述客觀知識的存在。沒有人知道的知識是沒有意義的。每個人運用主觀心智來活化宇宙知識。宇宙知識其實是主觀知識的外顯形式。

資料、資訊、知識三者互有關聯。資料是原始的資訊，資訊是原始的知識，這個順序建立於一個認為資訊是一個資訊是實化知識的必要元素的謬誤。資訊與知識也不是類似的，資訊是知識的特殊形式。

任何的感知行為都是綜合的，知識也是綜合的。任何的經驗感知是由"感覺資料"與主觀意識的綜合體。資料是感官上的刺激，資訊是這些刺激的涵義。資訊在主觀領域則是經驗知識，一個加諸在原有知識之上的知識。知識則是個人的心智思想，為個人的信念、信仰以及真哩，包含了經驗與非經驗的知識。

在客觀領域中，資料是一組呈現感官刺激的信號，資訊是一組呈現經驗知識的信號，知識是一組呈現個人信念的信號。個人是決定一組信號是資料、資訊或知識的重要關鍵。

資訊科學與認知心理學及神經科學不同點在於後二者由探索思考以及學習來關注於主觀知識領域，而資訊科學則關心的是客觀知識領域。資訊科學是知識裡研究客觀知識中的科技以及使用方面。也就是製造、呈現、組織、運作、儲存、散佈、檢索。

從以上的觀點可以做出資訊是知識的一種，資訊科學探索的是知識的根基，由是可以得出以知識科學取代資訊科學的結論。名稱的改變可以表現出該學科所關注的焦點。目前資訊科學建基於知識是人類心智的綜合體，只存在於主觀知識領域。這表示客觀知識領域只是資訊而非知識。可是我提出了在客觀知識領域亦有知識存在的概念，因此我建議將將資訊科學改名為知識科學。

Comments：

此文探討的是資訊科學所處理的問題的本質。資料、資訊、知識三者一直以來均是資訊科學所關心的對象，如何妥善運用其達到最大效益也就是本學科最終的目標。而本文重點在於資訊(information)其實是一種特殊形式的知識(knowledge)，因此其建議必須將學科名稱從資訊科學(information science)改為知識科學(knowledge science)才能確切的代表本學科所研究的方向。

就我個人而言，我認為學科科目名稱的更動，表現出的是該學科與時俱進，彰顯其跟上時代潮流的樣子。如同當年圖書館學更名為圖書資訊學一般，將資訊科學融入圖書館學之中，表現出研究範圍的擴大以及延伸。但是，此一改變必須代表該學科所研究之面向真實的改變。

意即如果資訊科學改名為知識科學之後，如果其研究方向還是一樣的話，那麼其實更不更名並非必要。雖然名不正則言不順，但是同時必須考量到現有之學科名通俗性，以及被大眾接受的程度。誠如文中所言，資訊是一個廣泛的概念，可是知識又何嘗不是？雖然資訊科學處理的真的是知識，可是更名之後，其研究方法、研究對象、研究目的並不會有相當大的差異，因此我認為此一更變非屬必要。

Information Science

Author：Tefko Saracevic

Title：Information Science

Citation：JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE—October 1999

Topic：資訊科學

Purpose：重新釐清資訊科學的本質

Methodology：歷史分析及預測未來

Finding：結合使用者與系統導向的研究方法是未來研究的趨勢

Summary：

資訊科學由其所指出的問題以及所解決的方法來定義。資訊科學本來就是綜合學科，其與其他學科的關係是變化的。而且這種跨學科的發展也是各自不同的。資訊科學無可避免的與資訊科技有所關聯。技術性解決方案為讓強制資訊科學變得跟其他學科一樣發展、或者是進一步的將資訊社會視為一個整體。資訊科學在很多方面在資訊社會的發展中扮演主動的參予者，資訊科學擁有極多的社會及人文面向。

資訊檢索提供了資訊的過程邏輯化，相關概念則是與使用者的資訊尋求與評估，互動則是指在資訊檢索中使用者與系統溝通。

資訊科學是在處理二次大戰後因為科技革命等因素造成大量出版的資訊爆炸。

資訊科學的發展有很大一部分是由於政府機構的支持，而其目的是為了有效傳播大量生展的知識。最終是讓科學文獻可供取得。在資訊社會來到的時候，資訊科學雖然有提出解決方案跟實務但是並沒有完全壟斷掌握資訊的方法。當資訊越來越重要，也越來越多人開始研究資訊。

資訊是一種基本現象，研究基本現象是學科的本質，而資訊這一概念在各學科之間所定義的各有所不同，有寬有窄。在窄化的定義中，資訊是指「給予決定的訊號或信息，牽涉較少或趨近於零的心智模式」其價值在於帶給決定者的變化。而在寬化的定義中則代表認知的過程與理解，其處理兩個認知架構，一為心智，一為文字。而在最寬的定義中，資訊是一種背景，其不單只是被接收、被認知，還有其所處的環境、工作、事件等

資訊科學主要由兩個層面所組成，一為資訊分析，一為資訊檢索，兩者的互動性很低，

資訊科學是有效使人、社會、組織與資訊有效溝通的專業實務。重視資訊的需求以及使用。關心人類知識的各種紀錄(文獻)。其無關於電腦科學中提供有效的電腦應用方面。

資訊科學處理的面向有：1.實證資訊檢索2.引文分析3.實務檢索4.書目研究5.圖書館系統6.科學傳播7.使用者研究與理論8.線上公用目錄9.其他學科10.索引理論11.引用理論12.傳播理論13.互動研究14.網路搜尋15.多媒體檢索16.多語言檢索17.數位圖書館

資訊檢索專注於搜尋資訊，以及於其中系統、技術、機制。重點在於系統的建置。系統導向作法是由演算法的作業以及由傳統IR模型的評估做為實例，並不考慮使用者因素。而認知、情境、互動研究反而是使用者導向作法的實例。在建構系統時，以使用者為導向的系統未曾被建置，而系統導向的系統並未考慮到使用者的需求。結合兩者的研究多由使用者導向的研究者所執行。

網路的混亂讓每個人都想透過IR來制定規則。而網路的檢索系統越來越多，同時也產生了未發生過的問題。

相關的概念是指在系統與使用者溝通的過程中所得到的有價值的資訊。IR系統中多使用求準率跟回現率來評估系統，而相關的評估中又包含了許多概念。

圖書館學與資訊科學一樣關注於個人有效利用資訊紀錄，其不同點在於：

1.大部分資訊科學的議題在圖書館學中不存在。

2.圖書館學的架構與資訊科學的架構並不相同。

3.雖然在實驗的方法上有所雷同，但是對於專業的要求仍大相逕庭。

4.在資訊檢索與圖書館自動化中所使用的科技相當不一樣。

5.圖書館學較為獨立。

電腦科學與資訊科學的關係在於將電腦科技應用於IR之中，以及相關的服務、網路。電腦科學關注於符號的傳輸，並不考慮與使用者的互動，而資訊科學關心的是資訊的傳輸，兩者之間有互補的作用。此外數位圖書館的議題吸引了大量非圖書館界的人員進入此一領域。

資訊科學教育並沒有受到其應有的重視。而其教學模式又可分為Shera模式以及Salton模式。 Shera模式：將資訊科學附加在圖書館學之中、 Salton模式：將IR附加於電腦科學之中，並沒有一個融合使用者導向以及系統導向的資訊科學教育。

Comments：

本文透過有組織的條列說明資訊科學的本質內涵，首先指出其出現的歷史意義，次而指出其所處理的基本現象，再者分析其所組成的元素以及研究方向，然後提出了資訊檢索、相關、互動三個資訊科學重要的議題。最後分析與資訊科學融合的學科，並以圖書館學與電腦科學為例。

而文中對於學科的定義相當準確，意即一個學科的意涵是由其所關注的問題以及研究的方向所組成，過多的宣染以及誇示其實都是不必要的。

而所謂相關的概念是一個變動性相當大的議題，其由使用者決定了大多數相關的價值，也因此使研究此一議題的困難度相當的提高。

在我大學時期所修習的課程中，其實對於資訊科學著墨甚少，由是目前對於何謂資訊科學仍然有些混沌不明。這也印證了文中所說的「資訊科學教育不被重視」的觀點，說明了目前的學科分類仍是將資訊科學下置於圖書館學下，並沒有融合於其中，只是附加於其後而已。也指出了雖然圖書館學跟資訊科學雖然表面上相當類似，但是本質上仍具有相當大的差異性，要與之融合仍然相當困難。

Information Science: What is it?

Comment部份可以略過我的comment很沒sense...

一篇要3小時不知道什麼時候會進步成1小時ㄎㄎ

Author：BORKO, H

Title：Information Science: What is it?

Citation：American Documentation, 19:1(1968:Jan.) p.3

Topic：分析文獻學與圖書館學與資訊科學的關係

Purpose：重新定位資訊科學

Methodology：描述現況

Finding：

Summary：

資訊科學是調查資訊的特性以及行為、管理資訊流、以及有效的利用資訊。關注於知識本體的來源、蒐集、組織、儲存、檢索、傳播、轉移、以及使用資訊。這是一門跨學科科學。其擁有自然科學以及應用科學的面向。圖書館學與文獻學都是資訊科學的應用層次。

資訊科學的目的在於提供可以讓各機構提升知識傳播及累積能力的資訊架構。但是目前各機構對於社會並無法充分的溝通，其原因在於1.大量產生的新知識孤立了舊有的知識2.知識的快速變動造成畢業生必須重回學校學習3.大量的科學家跟科學期刊存在4.越來越多的專業讓各學科的溝通更加不易5.研究與應用有即時同步的需求。如果各學科無法彼此溝通的話，會發生重複研究的問題，造成研究事倍功半。

資訊科學中的理論與實務互為表裡，資訊科學研究分為九個類別:1.資訊需求與使用2.文件製造與複製3.語言分析4.轉換5.摘要、分類、索引6.系統設計7.分析與評鑑8.模式分析9.最適系統。

理論不能只是紙上談兵，研究者多組成一個以應用導向小組織，他們處理資訊傳播的問題以及其他，同時需要最新的理論來應用於其中。科學學門需要學術元件，資訊科學目前被關注於專業技能而非所需被教育的內容。或許需要等到現有的學生畢業後才能決定資訊科學真正需要教授的科目。

資訊科學是是一門跨學科的科學，調查資訊的特性以及行為、管理資訊流、以及有效的利用資訊。文獻學是資訊科學中應用的部份，其專注於取得、儲存、檢索、傳播文獻資訊。資訊科學家研究處理新資訊的新技術、教授資訊科學或改良資訊處理系統。

Comments：

本文成於1968年，至今已有三十多年的時間，但細觀而言，套用於目前的資訊科學仍不失其梗概。本文生成的環境在於將文獻學與圖書館學結合而成圖書資訊學的時代，此一文點出了當時的從業人員對自我認同的問題。瞭解本身學科所關注的問題是專業研究不可或缺的要素。本文有系統的將資訊科學的內涵有系統的組織起來，使欲接觸該領域之人能有一通盤之了解。

透過此一文，可以明白資訊科學的本質以及努力方向。雖然經過了三十多年，我卻認為目前的資訊科學也尚未超脫本文所描述的範圍，這是否代表著本學科侷限性？或者是其已發展完備了？甚而之，是否需要重新定義資訊科學？

訂閱：文章 (Atom)

嘴砲人生

2008年2月12日星期二

圖書館自動化系統安裝----嘴砲

2007年12月17日星期一

The State of Retrieval System Evaluation

The Cranfield Tests on Index Language Devices

2007年12月9日星期日

期末報告DEADLINE剖析

2007年11月19日星期一

Some Fundamental Concepts of Information Retrieval

A Perspective on the Measurement of Retrieval Effectiveness

2007年11月5日星期一

What is diffusion?

2007年10月15日星期一

馬太效應

耗散結構

2007年9月30日星期日

Redefining information science

Information Science

Information Science: What is it?

Archives

旅遊見聞

國考甘苦談

作業

Contact me

總瀏覽量

2008年2月12日 星期二

2007年12月17日 星期一

2007年12月9日 星期日

2007年11月19日 星期一

2007年11月5日 星期一

2007年10月15日 星期一

2007年9月30日 星期日

2008年2月12日星期二

2007年12月17日星期一

2007年12月9日星期日

2007年11月19日星期一

2007年11月5日星期一

2007年10月15日星期一

2007年9月30日星期日