當前位置:首頁 » 數據倉庫 » 中國檔案資料庫
擴展閱讀
webinf下怎麼引入js 2023-08-31 21:54:13
堡壘機怎麼打開web 2023-08-31 21:54:11

中國檔案資料庫

發布時間: 2023-04-08 04:58:53

⑴ 全國檔案事業統計調查信息管理系統怎麼新建

1.1確定納入檔案信息化目標的信息類型
在檔案信息化建設中,不僅要加強檔案信息資源的建蔽畝頃設,而且要加強一系列與檔案社會服務有關的其他信息資源的建設。從資源建設的內容小劃分,它主要包括檔案實體信息、檔案檢索信息、檔案內容信息、檔案開發信息、檔案開發信息、現行文件開發信息、檔案教育信息、檔案政策與法規信息、檔案新聞、檔案科研信息等。
.2檔案信息資料庫的共建
當案信息資料庫包括目錄資料庫和內容資料庫。從資源建設的角度來認識,檔案信息數耐鎮字化及檔案信息資料庫的建設實質就是重建檔案宏陸信息資源體系的過程。這個檔案信息資源體系有兩個特徵:首先它是數字化的信息資源體系;其次它是全國所有檔案機構的數字化檔案信息資源共同構建的體系。是一體化的信息資源體系。因此,圍繞著檔案信息資源體系的建設,應由檔案事業主管部門制定統一的檔案信息資料庫

⑵ 關於檔案資料庫建設問題的探討

余虹劍

(中國地質調查局南京地質調查中心)

摘要 數字化各種檔案的目的是要向社會提供信息服務,這種服務需要一個由檔案網路體系、網站、資料庫、信息服務系統、檔案資源等組成的良好的服務平台做支撐。檔案資料庫建設就是為數字化了的檔案提供服務的資源平台。

關鍵詞 著錄 資料庫 規范 管理

1 標准化、規范化數據著錄

檔案資料庫屬於文獻資料庫,是檔案自動化的重要內容。檔案資料庫是以系統的方法編排的,並可通過電子方式單獨訪問的檔案數據的集合。[1]檔案資料庫建設的成功與否,在很大程度上取決於資料庫的質量。庫中的數據條目必須標准、規范,達到有序、有效,庫管理本身是科學合理的,這樣的資料庫操作性一般較強、使用面也較廣。科學實用的檔案資料庫在建庫時,一般都會按照相應的技術標准、管理標准和工作標准,最終形成一個自身的標准,形成規范的檔案數字化利用平台。作為一個數字檔案館,應先建立館藏檔案的目錄資料庫,也是著錄資料庫,包括全宗級、案卷級、文件級目錄,並應注意它們之間的關系。另外,根據本單位的館藏特色開展檔案全文資料庫建設。檔案全文資料庫涵蓋面較廣,一般含有文本型、圖形圖像型和多媒體型。目錄資料庫與全文資料庫要實現結構化,促發式。檔案目錄資料庫是檔案資料庫的基本,它能提供便捷的查詢路徑,閱覽者可根據需要,通過一次輸入就能提取閱覽者希望查詢的結果。提供類似查詢前必須建立基礎信息數據,這些數據包括檔案題名、責任者、來源、頁碼、分類號、主題詞、摘要等,少數包含檔案全文。[2]這項工作對著錄的內容特徵如關鍵詞、題名、項目負責人等著錄不詳細、標准不統一、索引的檔案內容深度廣度不夠,在檢索時就會有誤差,出現檢索不準確、不全面的現象,在一定程度上會影響檔案利用率。可以說,著錄標引是否標准規范是影響資料庫管理的關鍵因素之一,這項工作大體上決定著數據結構的合理性,這項工作能完成好是檢索系統查全、查準的前提。除檔案目錄資料庫外,檔案全文資料庫、多媒體檔案資料庫、Web資料庫的建設也必須遵守檔案著錄、標引等標準的原則要求。

2 建立資料庫

現階段根據有關部門的工作需要和計劃,按照內容不同,我們建立的資料庫分為成果資料庫和科技檔案資料庫,分別針對地質大調查形成的資料和單位各項目形成的資料、收集來的各項各類資料錄入數據條目。該資料庫更新到目前已收集的所有合格項目的資料和數據,針對這個資料庫還建立了目錄級資料庫共分兩級:第一級是項目大類共552條。第二級是各個項目詳細內容條目,截至擬稿更新到第一級第240條記錄的具體內容共5836條記錄。還有一大半有待繼續更新錄入。

3 保障數據安全是檔案信息資料庫的根本

檔案數據生成即必須長期甚至永久保存。該怎麼保證經過數字化後的檔案的原始性,防範這些數字內容不被篡改等,都是建設檔案資料庫時在安全方面應解決的問題。資料庫的參數設定、數據存儲方式和位置、數據傳輸途徑、使用等各個環節和整個過程都涉及檔案資料庫的安全。為防止數據丟失、損毀,避免保密信息流失等事故,又要保障海量信息數據的安全、完整,使日積月累產生和收集來的檔案數據能在日後長期得到利用,必須把更新檔案資料庫安全體系、合乎實際工作需求的管理制度作為資料庫建設的關鍵環節。制定既利於工作又能監管數據出入的防範措施,加強數據運行中的監控和管理,使資料庫從建設到利用各環節都萬無一失。檔案資料庫建設時,經常使用技術手段實現許可權控制,日常的數據備份必不可少。廣義上,許可權控制應設置讀寫控制、數據加密等方面,從實際工作需求出發,一般根據用戶類別、部門允許訪問范圍內(包括閱覽、下載等)的目錄和檔案數據對訪問和使用設置可訪問層度、控制和監督。防寫控制是使信息保真的手段,使得用戶只能讀取信息,而不能修改、復制,以防止信息被篡改。加密技術可以確保控制檔案內容的非公開性。為保證許可權控制的有效性,要在系統中配置使用記錄系統,全程跟蹤、自動記錄使用情況,進行定期檢測與維護,還要隨著高新技術的發展,引進新的安防技術。

4 檔案信息化建設需要切實加強集中統一的管理體制

檔案信息化建設的管理體制是從管理制度上保證業務技術的規范、標准和硬軟體選用的統一性,使各層次、各專業辦公都納入統一的檔案信息自動化系統管理當中,實現集中統一的管理。使其不能各行其是自建系統,從而減少信息分割和資源浪費現象的發生。檔案信息化系統的管理體制,要在較強的管理和先進的技術條件下,實行高度集中管理和方便使用相結合的模式。

5 結束語

本文闡述的只限於在檔案資料資料庫建設中遇到的極有限的實際工作問題。檔案資料庫建設是一項長期、持久的工作,作為檔案管理部門在進行資料庫建設時,要有規劃地形成資料庫產品,一般需要做用戶需求分析、本館狀況分析、效益分析等。科學選題,合理規劃,循序漸進,杜絕短期行為的發生,形成良性循環,檔案資料庫建設才能有持久發展的動力。

參考文獻

[1]孫淑梅.檔案管理與計算機[M].北京:檔案出版社,1987.

[2]洪漪編.檔案信息組織與檢索[M].武漢:武漢大學出版社,1998.

⑶ 如何做檔案目錄

下面將會介紹一下檔案目錄應該如何做,而且什麼是檔案目錄?利用「插入/引用/索引和目錄」命令可以達到目的。

注意:
使用上述功能前,首先要把用成目錄的小標題設置樣式。

樣式設置方法:
依次選中作為目錄的標題,在「格式」工具欄左側的「樣式」列表中點擊「標題1」、「標題2」、「標題3」。
如果只是查找文檔收集情況回,只要把收集的文檔標題設置為「標題1」即可。
檔案目錄是檔案館(室)編制的,由眾多著錄條目組成並按一定次序編排的,揭示、報道與查找檔案的工具。是檔案檢索系統的重要組成部分。檔案目錄按其加工文獻和處理信息的手段可分為手檢目錄和機檢目錄兩大類。基本簡介
檔案館(室)編制的,由眾多著錄條目組成並按一定次序編排的,揭示、報道與查找檔案的工具。是檔案檢索系統的重要組成部分。

檔案目錄按其加工文獻和處理沒碧信息的手段可分為手檢目錄和機檢目錄兩大類。手檢目錄是由人工製作,可直接查找檔案的檢索工具,常見的有卡片式和書本式兩種形式。卡片式目錄是把文件或案卷的內容和形式特徵記錄在卡片上,按一定規則組合排列而成,是一種離散式目錄載體;書本式目納核錄是將文件或案卷的內容和形式特徵著錄成條目,按一定規則組合排列並書寫或復印在空白書頁上,裝訂成冊,是一種聚合式目錄載體。機檢目錄是藉助於電子洞察掘計算機等機械設備存儲目錄信息和查找檔案的檢索工具,一般有機讀和縮微兩種形式。機讀目錄是把記錄文件或案卷特徵的文字、圖形、數字和符號轉換成機器可以識別的代碼輸入計算機,以特定的格式存儲於計算機磁帶、磁鼓或磁碟上,檢索時經過特定的程序轉換成文字並編製成各種目錄,顯示在屏幕上,或直接列印成各種目錄;縮微目錄是將手檢目錄拍攝在縮微膠片上,檢索時藉助閱讀器將其放大,顯示在屏幕上。

分類介紹
在中國的檔案館(室)中仍以手檢目錄為主,其中常用的有案卷目錄、分類目錄、專題目錄、主題目錄、全宗文件目錄、人名目錄等。

⑷ 檔案學有哪些資料庫

【編者按】:檔案學就是探索檔案、檔案工作和檔案事業的發展規律,研究檔案信息資源的管理、開發的理論、原則與方法的學科。精品學習網檔案學欄目為您提供檔案學範文參考,以及檔案學寫作指導和格式排版要求,解決您在寫作中的難題。
淺談資料庫在檔案管理中的應用
[摘要]本文分析了資料庫在檔案管理中應用的現狀與不足,討論了利用資料庫技術對檔案進行管理的實現和應用,提出了有建設性的對策和建議,提出了自己的思考。
[關鍵詞]資料庫 檔案管理 應用
信息化是當今世界發展的大趨勢,是推動經濟社會發展和變革的重要力量。隨著我國各單位業務的急速發展,單純的手工記錄方式已無法及時有效地對檔案材料進行收集、整理、立卷、歸檔和管理。而計算機技術在近十年來的迅猛發展,使得各單位利用計算機對檔案進行輔助管理成為可能。檔案信息化是在檔案管理中全面應用現代信息技術,對檔案信息資源進行開發、管理和提供利用等服務,主要包括檔案資源數字化和網路化、檔案信息管理和利用提供的一體化、檔案信息的高度共享等。
《全國檔案信息化建設實施綱要》規定了我國近期檔案工作發展目標,《國家信息化發展戰略(2006年—2020年)》的審議通過,為檔案信息化提供了有力保障。計算機的介入打破了傳統的管理模式,使得原本鬆散、龐雜的檔案管理邁入了集中統一、信息自動化的新領域。雖然,利用計算機輔助管理檔案能大量減輕管理工作的強度、提高管理工作的效率,並能減少管理工作的失誤,但是由於計算機技術,尤其是資料庫的發展是一個逐步開發、完善的過程,同時使用該技術的工作人員也有逐步學習、應用的階段,因此計算機輔助管理各單位檔案中也存在著不少需要解決的問題。
一、資料庫在檔案管理中應用的現狀與不足
隨著各單位業務的不斷擴大,傳統的手工管理檔案的方法,已經不能適應成倍膨脹的檔案數量,也無法滿足社會對檔案的巨大利用需求,利用檔案管理軟體進行計算機管理是提高各單位檔案服務水平的必由之路。將手工管理的紙質檔案轉換為數字信息進入網路,即從檔案的實態轉換到虛擬態,檔案信息與載體分離,在這個意義上說網路傳遞的僅是檔案信息,用戶得到的僅是復製品,而非檔案原件。使用資料庫計算機輔助管理檔案不同於以往對紙質文檔進行收集、整理、立卷、歸檔、管理等工作,管理人員除了需要具備檔案管理業務素質外,還需要對計算機及資料庫應用具備一定的認識。有相當多的檔案管理工作人員知識結構老化,缺乏計算機技術知識,不能准確、規范地錄入基本信息,導致基本信息錯誤、缺失甚至張冠李戴。與此同時,由於一些檔案管理軟體在建立時僅考慮當時的數據量和用戶需求,資料庫結構中只有比較有限的幾個數據欄位,資料庫容量較小,不能導出通用格式的數據。當數據量成倍增加,資料庫運行的速度就相應減慢,使工作效率被迫降低。
二、資料庫在檔案管理中的應用建議
要全面提升檔案資料庫系統的安全水平是個艱難的過程,涉及方面很多,需要管理部門投入人量的人力物力。有些方面,例如,設備的可靠性,火災預防等方面,主要涉及投入力度的問題:防止人為的有意識破壞方面,如泄密監取密碼口令、計算機病毒、黑客等,主要依靠管理制度和計算機安全專項技術。但在資料庫的一致性、完整性問題上,檔案管理部門自身起著決定性作用。主要應關注以下幾點:
1.採用科學的資料庫開發方式
早期使用結構化方法開發的檔案管理軟體,其穩定性、可修改性和可重用性都比較差,用戶需求的變化往往造成系統結構的較大變化,並且需要花費很大代價才能實現這種變化。新的檔案管理軟體可採用面向對象的程序設計方法,商定一種或多種數據轉換方式,以便數據能夠在不同軟體之間實現信息共享。考慮到信息網路化的需要,檔案管理軟體可具備通過網頁進行數據查詢、交換的功能。同時還應考慮數據量增加的速度和資料庫技術發展的趨勢,以便今後對資料庫進行升級或更新換代。對於管理條例的各種文件可採用數碼照相或者文本方式進行保存整理,通過公文類程序或網頁進行交換及查詢。
2.確保檔案的保密性和安全性
單位檔案的保密性和安全性是十分令人關注的問題。檔案一旦進入計算機網路系統,網路的安全將直接關繫到檔案的保密性。對於計算機網路與電子文件所存在的技術上的弱點只能靠技術上的發展去解決。作為計算機網路的使用者,電子文件的形成者和保管者都有責任關注信息技術的最新發展,也有責任採用諸如防火牆、密碼技術、網關、虛擬保險箱、電子印章、電子水印等最先進信息技術解決上述問題。同時通過建立符合科研檔案技術發展規律的各種工作規范來保障電子文件的安全。只要工作規范,技術到位,這一科研檔案工作的主要障礙是完全可以解決與克服的。
加強網路監控,及時備份數據。網路中存在的安全性問題是對檔案管理系統安全性最大的威脅。目前有多種網路安全策略,各種安全策略必須相互配合才能真正起到保護作用,其中網路的訪問控制可以說是保證網路安全最重要的核心策略,它的主要任務是保證網路資源不被非法使用和訪問,它也是維護網路系統安全、保護網路資源的重要手段。另外,要注意建立計算機檢索查詢和提供檔案信息的主要服務方式,為使用者提供網狀信息組織結構,使用戶可以根據自己的意志沿著信息之間的關系鏈進行瀏覽,而不是按照規定途徑進行檢索和查詢檔案信息。
3.關注計算機病毒的新變化
當檔案信息系統擴展到區域網甚至互聯網時,計算機病毒成為不可迴避的危害,而且新型病毒具有許多網路時代的新特徵,例如,病毒傳播主要通過網路途徑擴散,病毒與計算機入侵關系密切,Windows操作系統的網路功能是常見的攻擊點,等等,檔案工作者應當時刻注意新的技術變化,制定針對性策略,並從管理制度、技術監督、後備保護、應急措施等多方面綜合防範。
4.加強法制建設
保障檔案信息安全單純依靠檔案管理部門自身的努力是不夠的,還需要有相關法律、規章制度的約束。因此,檔案信息安全與其它社會問題一樣,是一個復雜的綜合性較強的問題,各個環節必須緊密銜接才能發揮作用。立法在保障檔案信息安全性中的作用是不言而喻的,缺乏法律支持的信息安全保障是紙上談兵。我國已將信息安全列入國家信息化發展戰略,遼寧省早在1998年就通過了《遼寧省計算機信息系統安全管理條例)),這些都將在檔案信息安全保障中發揮重要作用,但隨著新問題的出現還需要更完善的、更專業的法律、法規出台。
參考文獻:
[1]張姝,韓振英.計算機在學籍檔案管理中的應用[J].洛陽工業高等專科學校學報,1998,(4).
[2]劉淑芬.計算機網路技術與學校檔案管理[J].學校檔案,1999,(1):23-25.
[3]徐志敏.計算機技術對檔案工作的影響[J].辦公室業務,2000,(3):32-33.

檔案資料庫建設中存在的問題及解決思路

錢毅
摘要:檔案資料庫是檔案信息資源管理的核心工具,目前我國檔案資料庫的建設和利用狀況還存在不少問題。作者首先解析了檔案資料庫的概念,指出應當從檔案業務需求的角度去考察資料庫的功能,並分析了檔案實踐的發展導致了檔案資料庫內容變化的幾大因素。在檔案建設過程中存在的問題包括缺乏有效統籌規劃、資料庫定位不準確、標准規范缺失、數據質量不高等。要解決這些問題,作者提出應當加強檔案資料庫規劃管理、完善標准規范、建立健全質量控制體系、培養人才隊伍等措施。
關鍵詞:檔案資料庫 概念 問題 思路
資料庫技術是20世紀60年代末發展起來的一門信息管理技術,是公認的信息資源開發、管理和服務的核心手段。目前資料庫的建設規模、信息量大小和使用頻率已經成為衡量一個國家信息化水平和綜合國力的重要尺度。在我國國家和地方各級的檔案信息化規劃中,檔案資料庫作為檔案信息資源管理的核心工具也都得到了廣泛的重視。但檔案界一直存在著如何盤活檔案資源、提高利用效率等問題。應該說,擁有先進的數據組織技術和靈活可靠管理手段的資料庫技術理論上可以從容面對這些挑戰,為檔案信息化搭建一個堅實的平台。事實上幾乎所有的檔案信息管理系統的中心都由檔案資料庫來擔當,無論其形式是檔案輔助管理系統還是所謂的數字檔案館。但檔案資料庫的建設和利用狀況仍然不容樂觀,還存在著數據結構封閉、數據質量不高,檔案信息資源尚未完全走出信息孤島的狀態。筆者擬從對檔案資料庫的概念、檔案資料庫的應用現狀及建設思路幾個方面來分析這些問題。
一、檔案資料庫概念解析
檔案資料庫的建設在我國已經有20餘年的歷史,但其理論發展卻並不充分。筆者通過期刊網(www.cnki.net)進行查閱,在1994~2005年間查詢到篇名中包含「檔案資料庫」的文章僅有28篇①,內容多局限在實際工作總結的層次上,對檔案資料庫的概念描述和理論挖掘相對較少。
通過文獻調研,筆者發現早在1987年孫淑揚就指出「檔案資料庫屬於文獻資料庫,是檔案自動化的重要內容,它是經過整理組織以機讀形式出現的檔案信息集合。②」洪漪編著的《檔案信息組織與檢索》中認為「機讀檔案資料庫,簡稱檔案資料庫,是以一定的組織方式存儲在一起的機讀檔案數據的集合。這些數據包括檔案題名、責任者、來源、頁碼、分類號、主題詞、摘要等,少數包含檔案全文。③」楊公之主編的《檔案信息化建設實務》一書認為「檔案資料庫,從廣義的角度講,就是以特定方式組織起來的檔案數據集合。具體地講,就是為了滿足多個用戶多種應用需要,按照一定的數據模型將本單位所保管的檔案信息存貯在計算機中以備使用的數據形式。④」
筆者無意為檔案資料庫給出一個確切的定義,因為作為支撐點的「檔案」與「資料庫」在實際應用中本身就是發散性很強的概念,而且還在不斷發展變化之中,上述定義都符合其各自特定的信息背景,以致檔案資料庫在不同階段的發展中出現了許多稱謂,如機讀目錄資料庫、索引資料庫,照片檔案資料庫、全文資料庫、多媒體檔案資料庫等等。因此研究檔案資料庫,需要綜合把握資料庫和檔案實踐的發展,獲得對檔案資料庫的相對完整的認識。
在研究資料庫時,除了掌握其先進的管理手段和操作方法外,更重要的是要立足檔案信息資源的特點,按照需求引導的原則關注資料庫中可以「為我所用」的部分,而不能片面追求資料庫功能而忽視基本的檔案需求。比如為了描述日益豐富的檔案數據類型,我們要求資料庫具有完備的數據類型能夠表達音頻、視頻、全文等信息類型;為了加強檔案數據質量控制,需要重點關注資料庫的完整性管理機制;為了保證檔案數據的安全,需要靈活應用資料庫的視圖功能、許可權管理以及加密機制等。此外,資料庫提供的共享交換、格式轉換、數據倉庫等核心功能可以為檔案資料庫提升管理水平和管理層次都提供技術保障。
同時,我們還要關注檔案實踐活動的變化,關注這些變化可能對檔案資料庫帶來的影響。筆者認為影響檔案資料庫內容的主要因素有如下三個方面。
1.檔案實體管理。在近年的檔案管理活動中出現了許多新情況,比如2000年出台的《歸檔文件整理規則》允許在文書檔案實體管理活動中取消「卷」的概念,這直接影響到檔案資料庫是否還需要「卷」這一級邏輯層次,從而影響相關表的數據結構。信息記錄技術的發展引進了許多新型載體,目前紙張、照片、膠片、縮微膠片、硬碟、軟盤、磁帶、各類光碟、圖紙等共存一室並不鮮見,不同類型的載體需要有不同的數據表來進行管理,檔案信息化規劃中還要求將這些載體的信息通過各種方式數字化後進入計算機系統,這也極大地豐富了檔案資料庫的內容。此外,在檔案信息利用環節,用戶全文和多媒體信息檢索需求也會促進檔案資料庫的數據類型的拓展。
2.檔案資料庫設計活動。在多數情況下,檔案資料庫系統並不只是純粹檔案數據的集合,還包括檔案管理活動中的其他信息,這些信息可以在資料庫設計過程中被納入管理。比如,在使用數據流圖等工具進行資料庫需求分析的時候,可以將許多業務流程方面的管理信息納入數據字典;資料庫的概念設計階段經常使用的ER模型(Entity-Relation Model)要求仔細分析檔案管理域中各實體及其之間的聯系,並據此建立檔案資料庫模式,通過這種設計方法得到的資料庫通常還包括一些管理實體,比如包括各類人員庫、標准庫、組織機構表、保管期限表、人員許可權表、庫房信息等,甚至包括檔案借閱者信息,而其中相當一部分不屬於檔案本體數據所包含的范圍。
3.應用環境。不同的機構具有不同的應用環境,像檔案館與一般業務部門的應用環境就有很大差別,它們對於檔案數據具有不同的管理要求。比如在信息集中管理應用環境中,為了管理方便,往往將檔案與資料、期刊、報紙、圖書等大量的非檔案成分進行集中管理;文檔一體化環境則將文件與檔案數據共存一庫,彼此依存,或者乾脆就是合而為一;電子文件管理應用環境則根據前端控制原則,要求電子檔案資料庫的建設不能採用事後建庫的方式,而必須深入到文件形成階段,收集電子文件生命周期的完整信息。因此可以看出,不同應用環境下建立的檔案資料庫的內容範圍存在較大的差異。
通過簡要分析檔案資料庫概念的內涵及其變化,筆者認為對於檔案資料庫的理解不能一刀切,而應該立足檔案資料庫建設單位的實際環境和系統需求,將包括檔案實體信息、管理信息、應用環境信息在內的各種類型數據按照特定數據模型進行組織的數據集合,並以此為據來考察目前我國檔案資料庫存在的一些問題。
二、檔案資料庫建設中存在的問題
在檔案信息系統的建設過程中,軟硬體設施可以通過購買、引進而獲得,但一個行業或者部門的信息資源是買不來的,只能依靠自己建設。檔案資料庫作為檔案信息資源採集、處理、存儲和傳輸中心,在檔案信息資源中佔有舉足輕重的作用。因而從宏觀上講,如何規劃設計檔案資料庫的建設,是關系檔案信息化進程是否能夠順利進行的關鍵因素。應該說,我們在這方面取得了很大的進步,資料庫建設數量、分布的范圍、發展的勢頭都是可喜的,初步消除了檔案部門會淪為「信息孤島」的疑慮。但同時,許多檔案資料庫建設中的問題也浮上檯面,能否解決好這些問題是關系檔案資料庫未來發展的關鍵。
1.檔案資料庫建設缺乏有效的統籌規劃
檔案資料庫建設是檔案信息資源開發的核心工作,但目前我國檔案資料庫建設缺乏有效的統籌規劃。在國家檔案資料庫建設層面上,除了明清、民國、革命歷史檔案資料三個目錄中心的建設已經啟動外,尚未有國家級檔案資料庫的規劃安排,各地檔案部門在實際建立檔案資料庫時基本上是各自為政,在檔案數據標准體系尚不完善的情況下,這種局面將會導致數據共享困難。雖然我國就檔案資料庫的建設也提出過總體指導意見,比如《全國檔案信息化綱要》一文中多次提到檔案資料庫的建設問題,提出「加強檔案目錄資料庫建設」、「進一步加強檔案目錄中心建設」、「積極推進檔案全文資料庫和多媒體資料庫建設」等,但這些意見缺乏可操作性。此外,如何將電子文件以及數字化檔案的信息納入檔案資料庫中進行管理,也需要在宏觀層面上進行有效的統籌規劃。
2.把握好資料庫定位
也就是要回答好「建設什麼樣的檔案資料庫」的問題,回答這個問題需要充分了解檔案資料庫的內涵,明確建庫的需求和目的,確定資料庫定位,有的放矢。資料庫定位將直接影響到資料庫的建設成本、規模、效能等,是進行檔案資料庫以及信息系統建設的一個基本出發點。比如,是建立存儲檔案著錄信息為主的目錄資料庫,還是建立存儲檔案全文的全文資料庫;是根據館藏的特點建立具有特色的資料庫,還是基於館藏圖片、音像等資料建立綜合
性多媒體資料庫;是建立檔案信息管理系統、文檔一體化系統還是電子文檔管理系統;是獨立建庫還是若干機構建立聯合目錄中心,或者是為未來的數字檔案館做數據准備。這些問題都需要提前論證,做好決策。而我們目前的檔案資料庫建設,在定位方面做的工作還不充分,許多資料庫千篇一律,缺乏特色;或者資料庫結構相似卻不能聯合,各自為戰,造成資源分散,工作量重復。
3.資料庫設計盲目性大,存在不科學的成分
資料庫設計是一項非常嚴謹、科學性很強的一項工程,從可行性分析開始,逐次進行數據分析,繪制資料庫的數據字典,然後運用各種工具進行概念模型設計、外模式設計和物理設計,最後才能裝載資料庫。其中的各個步驟都必須認真對待,偏廢不得,前一階段的設計是下一階段工作的基礎,不適合跨越設計階段開展工作。
但在實際的檔案資料庫設計過程中,還存在著許多不科學的問題。特別在資料庫可行性分析和數據分析階段存在的隨意現象比較突出。許多設計者對繁瑣的數據分析不太重視,往往一上來就開始設計庫表結構,這種脫離詳細分析的設計方法雖然表面上速度較快,但其質量經不起推敲。對任何一個資料庫系統而言,庫表結構是其基石所在,基石不牢,大廈則有將傾之虞。
4.資料庫邏輯結構缺乏規范
在進行資料庫邏輯結構設計時,相關標准規范缺失是造成檔案資料庫的設計工作流於隨意的主要原因,而檔案資料庫邏輯結構不規范的情況會引起資料庫之間轉換困難、難以共享等問題。目前正在許多單位開展的數字化工作所形成的圖像文件、視音頻文件如何建庫管理,目前尚未有相關規范出台。電子文件管理元數據規范的滯後使得電子文件歸檔數據難以收集齊全,還有不少電子文件仍在進行人工著錄登記,長此以往,前端控制原則難以在應用系統中得到應用。而在欄位結構層面上,不規范的情況則更為突出。像在檔案資料庫中通常作為主鍵的「檔號」欄位的表示方法就五花八門,根據浙江省綜合檔案館信息資料庫建設調查報告的調查結果,在這浙江省通用的6種檔案軟體中,有的用4個欄位來表示檔號;有的定義成數字形式;有的定義為字元型,甚至同一個檔案館在不同時期錄入的數據,表示形式也不統一。這將對日後資料庫遷移、目錄中心數據合並等工作帶來極大的困難。
5.數據質量
檔案資料庫的建設必須保證良好的數據質量,「問水哪得清如許,為有源頭活水來」這句古詩啟示我們,准確的資料庫信息、良好的數據管理是營造檔案資料庫「一池清水」的先決條件。作為重要的社會信息資源單位,檔案部門必須高度重視檔案數據質量,在追求資料庫數量增長的同時,還要加強「污染防治」工作,防止臟數據的產生。而根據浙江資料庫現狀調查報告,隨機檢查結果表明檔案資料庫質量較好的數據誤差也在12%左右,總平均差錯率達29%,造成這種狀況的原因主要在錄入階段,同時資料庫的質量檢查制度不完善也是重要原因。
三、檔案資料庫發展中存在問題的解決思路
1.加強資料庫建設規劃管理
資料庫建設是一項投入非常巨大、周期很長、事關信息化成敗的基礎工程,應當由檔案事業管理部門提供宏觀的指導方針,統籌規劃,合理布局,提供本地區或本行業資料庫建設的藍圖,並會同有關部門對資料庫規劃的可行性進行論證,提出檔案數據建設的具體意見。地方檔案部門則根據宏觀規劃的要求進行詳細設計,以實現全局共享為基礎,突出特色數據。基於這樣的總體思路,可以建立大范圍內協調一致的數據結構,資料庫框架設計、數據內容都能得到很高的共享度,將會改善目前檔案資料庫建設自行一套、質量參差不齊的總體狀況。
2.加強標准規范的建設
檔案信息資源描述標准體系是建設檔案資料庫的重要保障,相關標准規范的確立和逐步完善有助於各級各類檔案資料庫需要保持必要的協調,共同為社會提供高效、優質的檔案信息服務。檔案標准規范的制定要本著「確保數字檔案資源格式統一、數據規范、長期可讀、便於共享」的原則進行。在實施過程中,應當積極採用國際標准和國外先進標准;一般性的信息處理標准優先採用國家標准,如《文獻保密等級代碼》、《全國行政區劃代碼》等標准應當直接採用國家標准,不必另行一套;對檔案領域內特有的資源制定行業標准,如《壽險業務檔案管理標准》。此外為了保證國家文獻系統標准之間的一致性,檔案工作標准應盡量與圖書、情報的國際、國內標准相一致。
3.建立標準的元資料庫
目前資料庫的邏輯結構設計比較混亂,雖然從各資料庫個體角度觀察,並沒有太大的差錯,但結構的不一致、不兼容會對資料庫的共享和相互轉換帶來很大的困難,甚至難以進行。筆者認為,這個問題的最終解決,依賴於以著錄標准化為依託的元資料庫的建設。
目前檔案資料庫的主要記錄對象是檔案文件的二次文獻信息,即文件的著錄信息。許多檔案資料庫結構的確定其實就是將著錄卡上的項目轉換為數據表上的欄位信息。從原理上講,這個過程應該很容易,但由於我國的《檔案著錄規則》,雖然規范了著錄項目,但並沒有規定相應的量化指標,離資料庫系統所要求的結構化數據的要求還有相當距離。由於著錄標准並不是確定數據結構的強制標准,各檔案資料庫在建設時都可以根據自己的理解靈活應用,著錄項目可以自行增刪,欄位類型、欄位長度可以自由選擇,這樣的資料庫進行互聯互通的難度就可想而知了。因此筆者建議以著錄標准為基礎,建立一定范圍內的元數據標准,此處的元數據就是關於資料庫中各數據欄位的信息,並以此為基礎構成元數據字典。該字典提供數據項目的結構化信息,包括數據欄位的名稱、數據類型、長度、默認格式等規范,並說明欄位之間的聯系。需要指出的是,這樣一個具有內在聯系的有機的元數據字典,實質上是為檔案資料庫提供通信格式,並不要求完全遵循,如果有特殊要求,只需要在此基礎上提供轉換功能即可。隨著檔案信息化的深入,元數據字典的建設還應當包括全文和電子文件的元數據項目,為電子文件管理系統的設計提供相應的元數據,實現電子文檔的前端控制,從而在根本上解決電子文檔介面規范問題。
4.建立健全資料庫質量控制體系
針對檔案資料庫數據質量的問題,筆者認為應當將檔案資料庫視作檔案部門的信息產品,並依照生產產品的管理方式,通過質量控制體系進行監管。該體系以可操作的方式提供對檔案資料庫的全面質量管理,包括資料庫設計、建設、管理活動中主要環節的控制,並制定資料庫質量考核指標體系。該體系要求將資料庫設計過程作為單獨的項目進行管理,通過項目文檔能夠審查資料庫設計過程是否科學、合理;能夠對資料庫建設過程中的人、財、物進行審計;對數據收集、錄入、備份等各環節提供質檢措施,保證數據准確、完整;通過質量指標體系對資料庫容量、響應時間、查全率、查准率、錯誤率等進行核查。依照質量控制體系進行管理,能夠優化資料庫管理活動,加強資料庫建設人員的責任感。
5.加強檔案資料庫隊伍建設
隨著檔案事業的不斷推進,對檔案信息管理人員的要求越來越高。檔案資料庫作為檔案信息化建設的中樞工程,其規劃、設計、實施、管理、維護、標准建設等都需要相關人員具有較高的綜合素質,不僅要熟悉館藏,了解基本檔案理論、業務流程、未來發展,還要掌握資料庫管理的基本技能,對於檔案資料庫管理員,還需要具備一定的規劃能力和標准化知識,而目前這方面的人才是比較缺乏的,需要檔案部門和教育機構通力合作,培養通曉檔案資料庫建設的全面人才,全面推進檔案信息資源的開發進程。
注釋:
①查詢時間:2005年9月16日,檢索形式為「篇名」,檢索模式為「精確檢索」,資料庫來源為「電子技術及信息科學輯目錄」,特此說明。
②孫淑揚編著:《檔案管理與計算機》,第176頁,檔案出版社1987年3月。
③洪漪編著《檔案信息組織與檢索》,第146頁,武漢大學出版社,1998年1月。
④楊公之主編:《檔案信息化建設實務》,中國檔案出版社,2003年,第103頁。
(原文載於《檔案學通訊》2006年第4期)