圖書館數字化內容選擇原則闡釋

時間:2022-07-15 06:14:00

導語:圖書館數字化內容選擇原則闡釋一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

圖書館數字化內容選擇原則闡釋

【內容提要】內容選擇是圖書館信息資源數字化項目的一個重要步驟。文章在對信息資源數字化內容選擇原因分析的基礎上,闡明了數字化內容選擇應該遵循的基本原則

【摘要題】信息資源建設與管理

【關鍵詞】數字化/信息資源數字化/數字化內容/圖書館

【正文】

由于計算機技術、數字存儲技術、現代通訊技術和網絡技術的飛速發展及有機結合,信息存貯和檢索的地理界限已經被打破,人們能通過計算機網絡,查詢分布于世界各地的數據、圖表、文獻等信息。圖書館作為信息資源的收集、整理、存貯和交流的中心,要改變以往的工作模式,能夠在任何空間、任何時間,準確、快捷地為任何用戶提供所需信息,需要圖書館將自己的信息資源數字化,由于各圖書館資金有限,不得不對數字化內容進行選擇。圖書館信息資源數字化內容選擇是依據確定的標準進行相符性判斷,將符合條件的原始資源遴選出來,繼而進行數字化加工的一個過程。良好的選擇原則有助于確保以盡可能低的成本將最重要和最有用的信息資源進行數字化,避免知識產權糾紛,產生良好的社會效益和盡可能高的投資回報。

1進行數字化內容選擇的原因

數字化內容選擇的原因有很多,概括起來主要有:(1)存儲空間的原因。數字化的產品是通過網絡被廣大用戶存取利用,而大家都知道數字化產品是存放在磁盤陣列上的,磁盤陣列由服務器來管理,磁盤空間是有限的,服務器的能力也是有限的,不可能無限量地存入數字資源,這就需要我們對文獻資源數字化內容進行選擇。(2)解決數字化生產高成本和圖書館經費有限性之間矛盾的需要。幾乎沒有圖書館有充足的資源來對整個館藏進行數字化,內容選擇不可避免。(3)數字資源管理的需要。技術的快速發展使數字化項目所生成的數字資源的生命周期越來越短,投入巨資進行數字遷移是延長數字資源生命的一個重要途徑,昂貴的維護成本就必須考慮數字化的內容選擇。(4)產權保護的需要。圖書館對絕大多數館藏都缺乏產權的擁有,只能選擇那些能夠得到產權許可的館藏進行數字化。(5)特殊文獻的考慮。圖書館大都收藏一些對文化倫理乃至民族問題敏感的信息資源,對這些資源進行數字化就要考慮很多因素。(6)殘缺文獻處理成本的考慮。圖書館館藏文獻中有一部分是殘缺不全的,對這些文獻進行數字化之前就要進行補缺或作相應的說明,其費用較多。(7)圖書館信譽的需要。圖書館作為責任機構,要對所數字化且的信息資源的可靠性和準確性負責。

2高校圖書館數字化內容選擇應遵循的基本原則

不同的數字化項目其內容選擇原則不盡相同,西南政法大學圖書館現在正在籌備兩個數字化項目:一個是法律古籍的數字化;另一個是法律經典圖書的數字化。選擇這兩個項目是因為這是一個政法大學的圖書館,它面對的讀者是政法院校的學生,故選擇的內容都是法律方面的。重慶大學圖書館選擇的數字化內容主要是理工科類的和建筑類的文獻資源;重慶師范大學選擇的數字化內容是教育類的文獻資源。無論哪個高校在數字化內容選擇的時候都遵循了以下八個原則:

2.1原始文獻知識價值原則

影響原始信息資源的知識價值因素有很多,但主要包括資源的唯一性、相關價值、對相關主題領域理解的重要性、對相關主題領域覆蓋的廣度和深度、實用性和準確度、特定主題領域中其他載體記錄質量差的信息內容、具有強化項目實施的歷史價值以及數字化產品潛在的長期價值等。另外,文獻知識價值也可能包括管理價值、藝術價值、證據價值和市場價值,文獻知識價值的判斷具有很大程度的主觀性。圖書館不同,對文獻知識價值的判斷也不相同,在國內,每個高校的圖書館都有自己的基本館情,他們都積極對館內自己認為有特色的東西進行數字化。例如,同樣是法律文獻,在政法院校的圖書館可能認為這些法律文獻是很有價值的,數字化之后可以給更多學生訪問下載。而法律文獻不是理工科院校的重點,數字化的意義不大。

2.2知識產權原則

館藏資源的產權狀態識別與數字化項目實施和數字資源所在的國家地區有關,每個國家都有自己的知識產權保護法律。學者針對圖書館信息資源數字化項目制訂了產權狀態識別模型,比如,美國北卡羅萊納州立大學法律圖書館主任LauraN.Gasaway建立并維護的用于圖書產權狀態識別模型;康奈爾大學PeterHitle教授構建了用于手稿產權狀態的識別模型;印第安納州立大學和得克薩斯州立大學的產權管理中心也分別提供了圖書館信息資源產權狀態識別框架[3,4]。館藏資源的產權歸屬有四種情況:第一,館藏文獻是通過接收的方式,把原本屬于國家所有的文獻收進館中,這種文獻的所有權和著作權都屬于國家所有,圖書館代為行使,在這種情況下圖書館在遵守有關法律的前提下,有權根據需要自主進行數字化。第二,圖書館通過購買集體或個人所有的受著作權保護的作品,在這種情況下,如果圖書館沒有購買其著作權,則著作權仍屬于原所有者,因此圖書館要對此類檔案進行數字化,必須在征得原所有者的同意,并向其支付一定的報酬后方可進行,否則就構成侵權。第三,館藏中的一些文獻資源是通過受捐贈的方式得來的,這種情況下,捐贈人一般只是將文獻實體所有權贈給圖書館,自己仍保留著作權,所以在數字化這類文獻時,與通過購買方式得來的文獻一樣,同樣要征得文獻著作權人的法定許可,并向其支付一定的報酬后方可進行。但也有在捐贈時,聲明將所有權和著作權一并捐贈給圖書館的情況,這種情況除外。第四,一些寄存在圖書館里的文獻資源,寄存只是由圖書館代為保存,不發生所有權和著作權的轉移,這種情況下,圖書館在進行數字化之前,必須征得文獻資源所有者的同意,否則就侵犯文獻所有者的權益[2]。目前數字化項目中保護產權的主要技術有:對每個數字圖像添加可視水印或版權戳;給每個數字圖像添加不可視水印,這種水印標志可以用來證實數字圖像的版權身份,也可用來跟蹤這個數字圖像在因特網上的傳播軌跡;對數字圖像加密,并僅把密鑰發送給注冊用戶,這種方法會限制公共存取;將公共瀏覽的圖像限制在低分辨率;將公共存取限制在截取數字圖像的一小部分之中,這種方法在一些項目中應用得非常成功;將圖像的瀏覽權僅限定在一些注冊或被授權的用戶。

2.3能獲得更多的用戶原則

用戶利用的本質就是館藏文獻的利用率,從理論上講,圖書館信息資源數字化項目應把有限的資金用在利用率高的資源的數字化上,但一些問題需特別關注:其一是要對利用率高的文獻的原因進行分析,如果主要用戶群體分布在本地,且類似文獻又不存在,這類文獻的利用率自然可能高,但數字化后在網絡上,其利用率如何就比較難以判斷,因為這時的用戶就不僅局限于本地了。其二是文獻的利用率有時與文獻的知識價值并不一致,有些具有高知識價值的文獻由于存放地點和圖書館存取方針的限制或目錄的不完整等因素,可能導致利用率偏低,比如說,西南政法大學的法律外文圖書,其實它對讀法律的學生來說是非常有知識價值的,由于這些書經濟成本很高,一般每本書就是幾十上百美元,折合人民幣就是幾百上千,為了降低這些圖書的丟失率和預防別人翻版這些外文圖書,以至于這些圖書只能復印,并且不用復印全本圖書。其三是利用率也會與文獻的物理狀態有關,一些文獻的物理狀態限制了用戶對其的訪問,比如易碎載體的文獻、古舊的手稿等。如西南政法大學圖書館的法律古籍,許多都是線裝書,并且紙張都已經發黃,很容易被損壞,如果開放由讀者隨意借閱,會使這些珍貴的古籍被損壞,以致消失,這對西南政法大學圖書館乃至整個法律界都是一個不可估量的損失。其四是在多館合作數字化項目中,一些大部頭的系列文獻分散在各成員單位,對這些文獻的訪問率可能較低,但數字化后可以形成完整的虛擬館藏,其訪問率可能就會提高。其五是一些技術因素不應該成為阻止一些文獻數字化的原因,比如,一些文獻的數字化文件的格式或像素導致在網上傳播速度慢,乃至用戶難以瀏覽,但網絡技術的快速發展(如帶寬的不斷提高)可能在數字化周期之內就能得到解決,另外文獻數字化后的格式改變也是促進技術發展的一個重要動因。

2.4原始文獻存在狀態原則

在數字化內容選擇過程中,需要考慮的與原始文獻存在狀態相關的問題有:原始文獻的存在狀態是否有利于數字化?其內容是否能被目前的數字化技術完全和充分地抓取?物理材質和形狀是否會對數字化過程構成障礙?是否有保存良好的替代品(如縮微膠片)?最常見的物理材質有一般紙張、牛皮紙、草紙、微縮膠片、光學材料、三維物體、玻璃器皿、記錄音頻的盒帶光盤和磁帶、視頻等。不同物理材質的文獻需要不同的技術進行數字化,比如,一般紙張可以采用數字掃描,但三維物體只能采用數碼拍照。存在狀態對其內容的充分抓取也有重大影響,比如,一般紙張中內容的抓取要比草紙充分得多,甚至,有些物理材質的內容數字化目前還難以實施。所以,只能選擇那些當前技術條件下適合于數字化的載體材質館藏資源,載體的物理尺寸也是影響內容選擇的一個重要因素。比如,常見掃描設備對大型地圖和海報進行數字化很困難,這時,也許對其替代物(如照片)進行掃描是一種較好的選擇[1]。載體的健壯性對數字化內容選擇也會產生影響,比如,一些珍貴或易損的資源需要在特殊環境中數字化。牛津大學的“難民研究數字化項目”和耶魯大學的“開放圖書項目”支持資源載體的拆分,以提高數字化設備的吞吐量。健壯性的另一個體現是對數字化處理的特殊要求,如牛津大學的“塞爾特語和中世紀手抄本數字化項目”要求設計一種特殊的保護托架來放置手稿。

2.5對文獻資源進行保存原則

為了保存的需要,數字化內容選擇的原則之一是安全數字化(safedigitiza2tion),包括原始信息資源的狀態允許被完全數字化;數字化實施過程需要搬運原始資源時,其狀態適合于搬運;盡可能掃描原始資源的替代品(如照片),從而減少對原始資源的損傷;數字化的產品必須建檔,并制訂由于時間和技術變化等因素導致的長期維護策略。數字保存的另一層含義是保護易碎載體的原始資源,數字資源的本身就是原始資源的新版本,可以代替原始資源供用戶訪問,并由此減少對原始文獻的操作從而使其得到保護。如對古籍來說,由于它極其容易被損壞,從這個原則上來講它是應該拿來數字化的,但在數字化過程中,特別要注意不要將這些珍貴的圖書損壞,這也將對數字化帶來很多麻煩。

2.6經濟效益原則

館藏文獻的數字化成本受眾多因素影響。分辨率越高的圖像所需的成本也越高,彩色圖像的成本要比黑白圖像的成本高,數字化生成純文本文件有助于全文檢索,且占用較少的存儲空間,但需要OCR識別,并需要大量的人工校對,如果生成帶標記的文本文件(如XML文件),雖然有助于各種分析乃至納入數據庫管理,但成本必然增加。成本也取決于數字化過程,比如,單頁掃描比裝訂在一起掃描成本要低,保存狀態良好的資源掃描要比保存狀態差的資源掃描所需成本要低,因為后者需要更多的人工處理。從效益角度看,受益最大的是用戶。另外,數字化也便于圖書館管理人員對館藏資源的管理,并能更高效地提供服務,盡可能提高成本效益是數字化內容選擇的宗旨。實現相同功能而采用不同方法的成本會有所不同,比如,數字化生成文本文件與生成圖像文件,后者加入元數據與圖像文件鏈接,兩種方法得到的效果可能差不多,但很明顯后者的成本要低些。另外,規模很大的項目單件數字化成本要低,長期保存的費用也會降低。

2.7避免重復數字化原則

對于已有數字化版本的館藏避免再次數字化是目前內容選擇的一個基本原則。目前,都覺得數字圖書館有利可圖,于是國家圖書館、各地區各行業圖書館甚至是一些企業,都一哄而上,從自身利益出發,紛紛建立自己的數據系統,在內容上缺乏明確的分工,相互之間在技術上、數據格式和標準并不兼容,往往好大喜功,力圖“最大”、“最全”,無法實現資源共享,實際上形成一種“信息割據”的局面[5]。但要考慮已有數字化版本的質量、記錄狀況和功能是否能夠滿足用戶的需要,以及獲取數字化版本的條件,甚至還要評估獲取數字化版本與重新數字化兩者所需費用。一般來講,自己再數字化的成本要比獲取數字化版本的費用要高,如果我們確實需要這部分數字化資源,我們可以向這部分數字化資源的所有者購買使用權。這樣就可以節省自己圖書館的開支,也達到了目的。在其它條件都允許的情況下,最好不要重復數字化,因為重復數字化,是對金錢、時間、人力、物力的一種浪費。

2.8技術條件限制原則

數字化內容選擇將受現有技術條件的限制,我們在選擇數字化內容的時候必須要考慮現在的技術是不是能夠順利地把這個內容數字化。考慮的主要因素有:數字化過程中對原始資料識別技術方面的問題,會導致數字技術生成的文獻數字版與原始文獻包含信息相比出錯率很大;數字資源顯示在用戶終端的質量;圖書館支持的現行平臺和網絡環境對數字資源的存取能力;數字資源網絡傳播速度的合理性;對未來用戶使用先進設備的預測,以免日后需重新掃描;搜索引擎對圖書館數字資源的索引能力。另外,還要考慮一些特殊資源數字化的技術可行性,如,需要超高分辨率的文獻資源、顏色至關重要的原始資源、超大尺寸的資源、三維形態的資源以及易讀性很差的資源載體等。

圖書館在進行數字化內容選擇的時候,只有滿足了以上的原則,數字化才有價值,才能給圖書館和讀者都帶來好處。

【參考文獻】

[1]臧國全.圖書館信息資源數字化內容選擇原則研究.圖書情報知識,2006(1):21-24

[2]向立文.檔案數字化建設中若干問題的研究.湘潭大學碩士學位論文,2004

[3]CopyrightManagementCenter.[2005-07-30].www.copyright.iupui.edu/

[4]CopyrightCrashCourse.[2005-07-30].www.copyright.iupui.edu/

[5]陸娜,李綱.論我國數字信息資源建設.情報科學,2006(2):204-205

a