一、概述?
1.數字圖書館的產生背景和意義?
◆互聯網的發展使得人們能夠跨越時空的界限共享資訊;
◆"科教興國"是國家的長遠戰略;
◆知識經濟的時代已經來臨;
互聯網的普及,使在線教育(網上教育)逐步成長起來,在不久的將來,開展網上教育成為未來教育產業的大勢所趨。
隨著信息技術的發展,需要存儲和傳播的信息量越來越大,信息的種類和形式越來越豐富,傳統圖書館的機制顯然不能滿足這些需要。因此,人們提出了數字圖書館的設想。
2.數字圖書館的定義?
數字圖書館是一個電子化信息的倉儲,能夠存儲大量各種形式的信息,用戶可以通過網絡方便地訪問它,以獲得這些信息,并且信息存儲和用戶訪問不受地域限制。?
數字圖書館是傳統圖書館在信息時代的發展,它不但包含了傳統圖書館的功能,向社會公眾提供相應的服務,還融合了其他信息資源(如博物館、檔案館等)的一些功能,提供綜合的公共信息訪問服務??梢赃@樣說,數字圖書館將成為未來社會的公共信息中心和樞紐。體現了信息化、網絡化、數字化的大趨勢。
3.外圍環境
目前,世界各發達國家都投入了大量的資源,加緊建設數字圖書館。例如,美國國家自然科學基金投資1億美元建設的NSF/A8PA/NASA數字圖書館將涵蓋大規模的文獻庫、空間影院庫、地理圖源、聲像資源庫,美國還投資3000萬美元建設美國數字圖書館聯盟項目,重點是美國歷史與文化成就信息。
日本要在2002年完成日本國圖書館關西館工程,計劃成為日本*大的數字圖書館及亞洲地區的文獻中心。這些情況都表明,發達國家都把數字圖書館的建設作為未來社會文化建設的一個重要內容,加以高度重視。
4.數字圖書館涵蓋的內容 ?
◆一定規模并從內容或主題上相對獨立的數字化資源;
◆可用于廣域網(目前主要是INTERNET)服務的網絡設備和通信條件;
◆一整套符合標準規范的**的數字圖書館運作建設流程和分階段的實施方案。
數字圖書館主要包括以下幾個重要的系統工程
1、信息的獲取與創建--圖書數字化加工
2、存儲與管理--搭建海量網絡存儲機制
3、訪問與查詢--搜索引擎、標準分類檢索系統
4、權限管理--在線閱覽系統
5、動態發布--web數據庫、中間件
5.數字圖書館的優勢
?傳統圖書館 | ?數字圖書館 | |
?圖書館建設 | ?書刊采購 | ?由數字化資源創建 |
?圖書資源保存 | ?典藏 | ?存儲(多媒體數據庫) |
?查詢檢索方式 | ?編目 | ?識別、標引并生成索引 |
?服務方式 | ?借閱流通 | ?基于互聯網的分類檢索系統 |
?控制 | ?流通管理 | ?權限管理 |
6.數字圖書館的實現手段?
將現有物理館藏采用各種先進的數字化手段加工成為電子圖書。
通過專業的識別、標引、分類檢索、互聯網發布系統整合建成數字化的閱覽環境。利用權限訪問機制以供讀者遠程實時的調用閱覽。?
公司專業從事紙質圖書文獻的數字化加工,將圖書文獻資源制作成符合國際標準的數字資源,進行深度數據加工和加密處理,制作成全文檢索數據庫供戶使用,非常適合于圖書館、出版社、期刊雜志、各類企事業單位以及個人用戶。
7. 圖書文獻數字化管理
?
二、 建設數字圖書館的流程
(一)、圖書數字化
圖書數字化是建設數字圖書館的基礎,圖書數字化的*終目的是生成可以在線瀏覽和在線借閱的電子書籍。也就是說,數字圖書館的館藏是電子書籍,電子書對于數字圖書館的意義就如同水對于河流,車輛對于高速公路一樣。
電子書籍--是由物理書籍經過圖書數字化的過程加工而成。然后采用識別、壓縮、合成、標引等等環節生成一定的格式。常見的電子書格式有方正的ceb格式、超星的pdg等等。
(二)、圖書數字化加工工作流程
數字圖書館需要高質量的電子圖書。如何快速、高保真的將圖書加工成為電子書籍,是建設數字圖書館*重要的部分。?
在各種類型文檔影像資料加工流程之中,對圖書的數字化要求非常高。這表現在質量和效率兩個方面。因為,圖書數字化的目的是*終建立"數字圖書館",便于讀者在線查詢借閱。所以很多參考指標都會影響到*終電子書的質量和可用性。
圖書數字化,又稱"圖書資料加工"。是建設數字圖書館的核心環節,是*重要的流程。
圖書數字化流程大致包括:
◆ 圖書分解
◆ 圖書掃描
◆ 識別
◆ 生成電子書
◆ 自動標引
◆ 建立標準分類體系
◆ 互聯網發布(采用先進的大型數據庫技術和中間件)
◆ 搭建訪問控制權限系統(基于網絡的全數字圖書借閱系統)?
◆ 面向訪問者開放
(三)、 圖書數字化加工的要求:
1. 保證字體還原度--充分保持書籍中漢字字體的原貌。
2. 電子書的圖像質量和頁面質量--去除頁面上的噪聲,得到高質量的圖像,便于閱覽和未來進行全文識別。
3. 加工效率--數字資源的快速建設,提高單位時間的產出。
4. 全部工序集成--易管理,可控制進度和質量。
(四)、?圖書數字化工序
1.圖像掃描
對特色圖書、期刊、論文進行篩選后進行掃描??梢圆捎酶咚賿呙鑳x進行快速圖像采集,也可以采用平板掃描儀進行不拆分掃描,生成TIFF、JPG、PDF等圖像格式。在掃描過程當中保證沒有少掃漏掃現象。
2.圖像處理
修圖組是對掃描完的電子圖像進行去污、校正等增強處理;提高識別率和增強美觀度,如格式轉換、動態二值化處理、自動校正、自適應紙張大小、灰度加強和去黑邊等功能。同時修圖組還進行質檢圖像模糊、原稿殘缺、補掃、漏掃、圖片不完整、多圖重疊等圖像問題。
?3.識別與校對
采用OCR軟件支持對掃描的圖像文件進行文字識別,生成文本文件。興源科創采用國際**的OCR識別技術,既可以識別常見的簡體漢字、繁體漢字、英文,也可以識別日文、韓文、俄文、德文、法文等190多種文字,超強的版面分析能力,*大限度減少手工操作量,識別準確率高達99.8%。
?4.轉換成雙層PDF格式
轉換成雙層PDF格式,可以對圖像內容進行全文檢索,檢索結果定位到文檔所在頁面的具體位置,文件內容原版顯示,無須二次排版。
?5.質量檢查
質量檢查員對加工完成的成品數據進行抽查,主要檢查圖像清晰情況、目錄準確性、有無缺頁少頁。
?6.索引制作
按照索引項目利用所提供的軟件進行標注或人工標引。
?7.索引質檢
檢查索引的文字正確性與索引的字段標識。
?8.成品驗收
對圖像、文本與索引進行全面的質檢,合格后提交成品。
?9.光盤刻錄
將加工完成并檢查合格的成品數據刻錄到數據光盤(DVD)中,保證光盤讀取正確,如果數據量大則使用移動存儲保存加工后的成品,交付給用戶。
10.數據加密
通過數字版權保護技術(DRM)將電子文檔進行加密處理,例如數據庫加密、文件加密、口令保護、軟件序列號認證、硬件加密等,有效保證數據安全。