『壹』 基礎資料庫、核心資料庫和主題資料庫的定義和內容 最好具體點或把資料來源告訴我
資料庫系統
database systems
由資料庫及其管理軟體組成的系統。資料庫系統是為適應數據處理的需要而發展起來的一種較為理想的數據處理的核心機構。計算機的高速處理能力和大容量存儲器提供了實現數據管理自動化的條件。
資料庫系統一般由4個部分組成:①資料庫,即存儲在磁帶、磁碟、光碟或其他外存介質上、按一定結構組織在一起的相關數據的集合。②資料庫管理系統(DBMS)。它是一組能完成描述、管理、維護資料庫的程序系統。它按照一種公用的和可控制的方法完成插入新數據、修改和檢索原有數據的操作。③資料庫管理員(DBA)。④用戶和應用程序。對資料庫系統的基本要求是:①能夠保證數據的獨立性。數據和程序相互獨立有利於加快軟體開發速度,節省開發費用。②冗餘數據少,數據共享程度高。③系統的用戶介面簡單,用戶容易掌握,使用方便。④能夠確保系統運行可靠,出現故障時能迅速排除;能夠保護數據不受非受權者訪問或破壞;能夠防止錯誤數據的產生,一旦產生也能及時發現。⑤有重新組織數據的能力,能改變數據的存儲結構或數據存儲位置,以適應用戶操作特性的變化,改善由於頻繁插入、刪除操作造成的數據組織零亂和時空性能變壞的狀況。⑥具有可修改性和可擴充性。⑦能夠充分描述數據間的內在聯系。
資料庫管理系統
資料庫管理系統(DBMS)是指資料庫系統中管理數據的軟體系統。DBMS是資料庫系統的核心組成部分。對資料庫的一切操作,包括定義、更新及各種控制,都是通過DBMS進行的。DBMS總是基於某種數據模型,可以把DBMS看成是某種數據模型在計算機系統上的具體實現。根據數據模型的不同,DBMS可以分成層次型、網狀型、關系型、面向對象型等。MS SQL Server2000就是一種關系型資料庫管理系統。
關系模型。關系模型主要是用二維表格結構表達實體集,用外鍵表示實體間聯系。關系模型是由若干個關系模式組成的集合。關系模式相當於前面提到的記錄類型,它的實例稱為關系,每個關系實際上是一張二維表格。
關系模型和層次、網狀模型的最大判別是用關鍵碼而不是用指針導航數據,表格簡單用戶易懂,編程時並不涉及存儲結構,訪問技術等細節。關系模型是數學化模型。SQL語言是關系資料庫的標准化語言,已得到了廣泛的應用。
如圖1.1所示,DBMS的特點和功能可以分為三個子系統:設計工具子系統、運行子系統和DBMS引擎。
設計子系統有一個方便資料庫及其應用創建的工具集。它典型地包含產生表、窗體、查詢和報表的工具。DBMS產品還提供編程語言和對編程語言的介面。
運行子系統處理用設計子系統開發的應用組件。它所包含的運行處理器用來處理窗體和資料庫的數據交互,以及回答查詢和列印報表等。
DBMS引擎從其他兩個組件接受請求,並把它們翻譯成對操作系統的命令,以便讀寫物理介質上的數據。DBMS引擎還涉及事務管理、鎖、備份和恢復。
數據的結構化,數據的共享性好,數據的獨立性好,數據存儲粒度小,數據管理系統,為用戶提供了友好的介面。
資料庫系統的核心和基礎,是數據模型,現有的資料庫系統均是基於某種數據模型的。
資料庫系統的核心是資料庫管理系統。
資料庫系統一般由資料庫、資料庫管理系統(DBMS)、應用系統、資料庫管理員和用戶構成。DBMS是資料庫系統的基礎和核心。
資料庫系統的核心是數據模型,因為數據模型是資料庫系統的核心和基礎。
『貳』 資料庫基礎 有關
第一章 資料庫基礎知識
本章以概念為主,主要是了解資料庫的基本概念,資料庫技術的發展,數據模型,重點是關系型數據。
第一節:信息,數據與數據處理
一、 信息與數據:
1、 信息:是現實世界事物的存在方式或運動狀態的反映。或認為,信息是一種已經被加工為特定形式的數據。
信息的主要特徵是:信息的傳遞需要物質載體,信息的獲取和傳遞要消費能量;信息可以感知;信息可以存儲、壓縮、加工、傳遞、共享、擴散、再生和增值
2、 數據:數據是信息的載體和具體表現形式,信息不隨著數據形式的變化而變化。數據有文字、數字、圖形、聲音等表現形式。
3、 數據與信息的關系:一般情況下將數據與信息作為一個概念而不加區分。
二、 數據處理與數據管理技術:
1、 數據處理:數據處理是對各種形式的數據進行收集、存儲、加工和傳輸等活動的總稱。
2、 數據管理:數據收集、分類、組織、編碼、存儲、檢索、傳輸和維護等環節是數據處理的基本操作,稱為數據管理。數據管理是數據處理的核心問題。
3、 資料庫技術所研究的問題不是如何科學的進行數據管理。
4、 數據管理技術的三個階段:人工管理,文件管理和資料庫系統。
第二節:資料庫技術的發展
一、 資料庫的發展:資料庫的發展經歷了三個階段:
1、 層次型和網狀型:
代表產品是1969年IBM公司研製的層次模型資料庫管理系統IMS。
2、 關系型數據型庫:
目前大部分資料庫採用的是關系型資料庫。1970年IBM公司的研究員E.F.Codd提出了關系模型。其代表產品為sysem R和Inges。
3、 第三代資料庫將為更加豐富的數據模型和更強大的數據管理功能為特徵,以提供傳統資料庫系統難以支持的新應用。它必須支持面向對象,具有開放性,能夠在多個平台上使用。
二、 資料庫技術的發展趨勢:
1、 面向對象的方法和技術對資料庫發展的影響:
資料庫研究人員借鑒和吸收了面向對旬的方法和技術,提出了面向對象數據模型。
2、 資料庫技術與多學科技術的有機組合:
3、 面向專門應用領域的資料庫技術
三、 資料庫系統的組成:
資料庫系統(DBS)是一個採用資料庫技術,具有管理資料庫功能,由硬體、軟體、資料庫及各類人員組成的計算機系統。
1、 資料庫(DB):
資料庫是以一定的組織方式存放於計算機外存儲器中相互關聯的數據集合,它是資料庫系統的核心和管理對象,其數據是集成的、共享的以及冗餘最小的。
2、 資料庫管理系統(DBMS):
資料庫管理系統是維護和管理資料庫的軟體,是資料庫與用戶之間的界面。作為資料庫的核心軟體,提供建立、操作、維護資料庫的命令和方法。
3、 應用程序:
對資料庫中數據進行各種處理的程序,由用戶編寫。
4、 計算機軟體:
5、 計算機硬體:
包括CPU、內存、磁碟等。要求有足夠大的內存來存放操作系統、資料庫管理系統的核心模塊以及資料庫緩沖;足夠大的磁碟能夠直接存取和備份數據;比較主的通道能力;支持聯網,實現數據共享。
6、 各類人員。
四、 資料庫系統的特點:
1、 數據共享:
2、 面向全組織的數據結構化:
數據不再從屬於一個特定應用,而是按照某種模型組織成為一個結構化的整。它描述數據要身的特性,也描述數據與數據之間的種種聯系。
3、 數據獨立性:
4、 可控數據冗餘度:
5、 統一數據控制功能:
數據安全性控制:指採取一定的安全保密措施確保資料庫中的數據不被非法用戶存取而造成數據的泄密和破壞;
數據完整性控制:是指數據的正確性、有效性與相容性。
並發控制:多個用戶對數據進行存取時,採取必要的措施進行數據保護;
數據恢復:系統能進行應急處理,把數據恢復到正確狀態。
Record):又稱為結點,由若干個數據項組成,用於描述一個對象;
3、 文件(File):由若干個記錄組成;
4、 資料庫(Data Base):由邏輯相關的文件組成。
二、 數據模型:
數據的組織形式稱為數據模型,它決定 數據(主要是結點)之間聯系的表達方式。主要包括層次型、網狀型、關系型和面向對象型四種。層次型和網狀型是早期的數據模型,又稱為格式化數據系統數模型。
以上四種模型決定了四種類型的資料庫:層次資料庫系統,網狀資料庫系統,關系型資料庫系統以及面向對象資料庫系統。
目前微機上使用的主要是關系型資料庫。
1、 層次型:是以記錄為結點的有向樹;圖如教材P7圖1--2
2、 網狀型:樹的集合,它的表示能力以及精巧懷強於層次型,但獨立性下降。
3、 關系型:
在關系型中,數據被組織成若干張二維表,每張表稱為一個關系。
一張表格中的一列稱為一個「屬性」,相當於記錄中的一個數據項(或稱為欄位),屬性的取值范圍稱為域。
表格中的一行稱為一個「元組」,相當於記錄值。
可用一個或若干個屬性集合的值標識這些元組,稱為「關鍵字」。
每一行對應的屬性值叫做一個分量。
表格的框架相當於記錄型,一個表格數據相當於一個同質文件。所有關系由關系的框架和若干元組構成,或者說關系是一張二維表。
關系型的特點:描述的一致性;可直接表示多對多關系;關系必須是規范化的;關系模型建立在數學概念基礎上。
4、 面向對象型:主要採用對象和燈的概念。
第四節:關系型資料庫
一、 關系型資料庫的發展:
1、 資料庫產品種類繁多:像dBASE,FoxBASE,Clipper,Paradox,Acess等。
2、 採用SQL語言:SQL(Structured Query Language)「結構化查詢語言」,是通用的關系型資料庫操作語言,可以查詢、定義、操縱和控制資料庫。它是一種非過程化語言。
3、 支持面向對象的程序設計:
4、 提供良好的圖形界面和窗口;
5、 支持開放的客戶機/伺服器和分布式處理;
6、 提供新一代的資料庫管理系統開發工具:支持GUI(圖形界面)、ODBC(開放資料庫連接)、OLE(對象的鏈接與嵌入)、DLL(動態鏈接)等。
二、 關系型資料庫管理系統(RDBMS)及其產品:
主要著名的關系型資料庫產品有Oracle、Sybase、Informix、DB2、Inges、Paradox、Access、SQL Server等。資料庫應用系統開發工具是PowerBuilder和Delphi。
『叄』 數據倉庫系統有哪三個工具層
【數據倉庫系統的三個工具層】數據倉庫系統通常採用3層的體系結構,底層為數據倉庫伺服器,中間層為OLAP伺服器,頂層為前端工具。具體如下:
1、數據源和數據的存儲與管理部分可以統稱為數據倉庫伺服器。
(1)數據源:是數據倉庫系統的基礎,是整個系統的數據源泉。通常包括企業內部信息和外部信息。內部信息包括存放於RDBMS中的各種業務處理數據和各類文檔數據。外部信息包括各類法律法規、市場信息和競爭對手的信息,等等。
(2)數據的存儲與管理:是整個數據倉庫系統的核心。數據倉庫的真正關鍵是數據的存儲和管理。數據倉庫的組織管理方式決定了它有別於傳統資料庫,同時也決定了其對外部數據的表現形式。要決定採用什麼產品和技術來建立數據倉庫的核心,則需要從數據倉庫的技術特點著手分析。針對現有各業務系統的數據,進行抽取、清理,並有效集成,按照主題進行組織。數據倉庫按照數據的覆蓋范圍可以分為企業級數據倉庫和部門級數據倉庫(通常稱為數據集市)。
2、OLAP伺服器:對分析需要的數據進行有效集成,按多維模型予以組織,以便進行多角度、多層次的分析,並發現趨勢。其具體實現可以分為:ROLAP、MOLAP和HOLAP。ROLAP基本數據和聚合數據均存放在RDBMS之中;MOLAP基本數據和聚合數據均存放於多維資料庫中;HOLAP基本數據存放於RDBMS之中,聚合數據存放於多維資料庫中。
3、前端工具:主要包括各種報表工具、查詢工具、數據分析工具、數據挖掘工具,以及各種基於數據倉庫或數據集市的應用開發工具。其中數據分析工具主要針對OLAP伺服器,報表工具、數據挖掘工具主要針對數據倉庫。
『肆』 信息系統建設是怎樣劃分基礎資料庫和業務資料庫的
一、 引言資料庫對於企業信息化的重要性是不言而喻的。資料庫存儲著現代企業最重要的數據,包括生產、經營、管理等各類數據,這些數據作為企業的核心信息,通過各類信息系統,為用戶提供及時准確的信息,幫助用戶分析,為用戶提供決策依據。為提高企業的工作效率,提升企業形象,具有傳統模式無法比擬的優勢。其中構建合理高效的資料庫,是資料庫建設關鍵之一。如何構建合理高效的資料庫是企業信息化過程要解決的問題。下面就資料庫的構建談談自己的一些經驗,希望能對大家有所幫助。 二、 設計資料庫之前
資料庫並不是憑空想像出來的,而是根據業務部門的需要設計符合業務需求的資料庫。因此在形成資料庫之前需要充分了解業務需求。 1. 充分理解業務需求。需求分析是整個設計過程的基礎,是最困難、最耗費時間的一步。在這期間通過與業務部門交流,了解用戶的想法以及工作流程,通過雙方多次交流,會形成初步的數據模型,當然這時的數據模型不會是最終的模型,還需要和用戶進行交流,並且在以後的信息系統開發過程中還會反復修改。 2. 重視輸入輸出。在定義資料庫表和欄位需求(輸入)時,首先應了解數據產生源和數據流程,也就是必需要知道每個數據在那兒產生,數據在那兒表現,以什麼樣的形式表現等等,然後根據用戶提供的報表或者設計出的報表、查詢和視圖(輸出)以決定為了支持這些輸出哪些是必要的表和欄位。 3. 創建數據字典和ER 圖表。ER 圖表和數據字典可以讓任何了解資料庫的人都明確如何從資料庫中獲得數據。ER圖對表明表之間關系很有用,而數據字典則說明了每個欄位的用途以及任何可能存在的別名。對SQL 表達式的文檔化來說這是完全必要的。 需要注意的是,在需求分析調研過程中,並不是一帆風順的,因為業務人員對於業務的理解不同,以及對於信息知識的缺乏,會影響需求分析的質量,為了提高質量,各方要用更多的時間交流與相互理解,業務部門需要精通業務的人員自始至終全力配合,而開發人員則盡量使用用戶理解的業務術語交流,這樣會避免出現理解不同而產生的歧義。 三、 設計合理的表結構
通常合理的表結構會減少數據冗餘,提高資料庫的性能。設計合理的表結構要遵循以下兩點。 1. 標准化和規范化 數據的標准化有助於消除資料庫中的數據冗餘。標准化有好幾種形式,但3NF(第三範式)通常被認為在性能、擴展性和數據完整性方面達到了最好平衡。簡單來說,遵守3NF標準的資料庫的表設計原則是:某個表只包括其本身基本的屬性,當不是它們本身所具有的屬性時需進行分解。表之間的關系通過外鍵相連接。它具有以下特點:有一組表專門存放通過鍵連接起來的關聯數據。 例如:某個存放單井信息及其有關油井生產日報信息的3NF資料庫就有兩個表:單井基礎信息和油井日報信息。日報信息不包含單井的任何信息,但表內會存放一個鍵值,該鍵指向單井基礎信息里包含該油井信息的那一行。 不過也有例外,有時為了效率的緣故,對表不進行標准化也是必要的。 2. 考慮各種變化 在設計資料庫的時候考慮到哪些數據欄位將來可能會發生變更。使資料庫更具擴展性,從而減少將來數據變更所帶來的損失。 例如,日期類型欄位,有時我們會考慮使用字元類型代替日期類型,因為在處理日期欄位上容易產生數據錯誤,所以我們就使用字元類型。這樣的例子還很多,在做前期設計時都要考慮的。 表結構的設計不是一次就能成功的,在信息系統開發過程中會存在數據讀取、錄入或統計困難,為了解決這些問題會修改表結構,或增加一些欄位,或修改一些欄位的屬性。這個過程不斷重復,因此不要想一次能成功。建議使用專門設計工具來做這些工作,筆者經常使用:SYBASE PowerDesigner ,當然還有其它的工具:ORACLE Designer 2000 ,ROSE等工具。這樣會使你的工作事半功倍。 四、 選擇合理的索引
索引是從資料庫中獲取數據的最高效方式之一。95%的資料庫性能問題都可以採用索引技術得到解決。 1. 邏輯主鍵使用唯一的成組索引,對系統鍵(作為存儲過程)採用唯一的非成組索引,對任何外鍵列採用非成組索引。考慮資料庫的空間有多大,表如何進行訪問,還有這些訪問是否主要用作讀寫。 2. 大多數資料庫都索引自動創建的主鍵欄位,但是可別忘了索引外鍵,它們也是經常使用的鍵,比如運行查詢顯示主表和所有關聯表的某條記錄就用得上。 3. 不要索引大型欄位(有很多字元),這樣作會讓索引佔用太多的存儲空間。如MEMO(備注)、TEXT(文本)等欄位。 4. 不要索引常用的小型表 不要為小型數據表設置任何鍵,假如它們經常有插入和刪除操作就更別這樣作了。對這些插入和刪除操作的索引維護可能比掃描表空間消耗更多的時間。如代碼表,或系統參數表。 五、 保證數據完整性
數據的完整性非常重要,這關繫到數據的准確性,不準確的數據是毫無價值的,因此保證數據的完整性非常重要。 1. 完整性實現機制:實體完整性:主鍵參照完整性: 父表中刪除數據:級聯刪除;受限刪除;置空值父表中插入數據:受限插入;遞歸插入 父表中更新數據:級聯更新;受限更新;置空值 DBMS對參照完整性可以有兩種方法實現:外鍵實現機制(約束規則)和觸發器實現機制用戶定義完整性:NOT NULL;CHECK;觸發器 以上完整性機制需要熟悉和掌握,它對於數據的完整性非常重要。 2. 用約束而非業務規則強制數據完整性 採用資料庫系統實現數據的完整性。這不但包括通過標准化實現的完整性而且還包括數據的功能性。在寫數據的時候還可以增加觸發器來保證數據的正確性。不要依賴於業務層保證數據完整性;它不能保證表之間(外鍵)的完整性所以不能強加於其他完整性規則之上。 3. 強制指示完整性 在有害數據進入資料庫之前將其剔除。激活資料庫系統的指示完整性特性。這樣可以保持數據的清潔而能迫使開發人員投入更多的時間處理錯誤條件。 4. 使用查找控制數據完整性 控制數據完整性的最佳方式就是限制用戶的錄入。只要有可能都應該提供給用戶一個清晰的價值列表供其選擇。這樣將減少鍵入代碼的錯誤和誤解同時提供數據的一致性。某些公共數據特別適合查找:性別代碼、單位代碼等。 5. 採用視圖 視圖是一個虛擬表,其內容由SQL語句定義,視圖不僅可以簡化用戶對數據的理解,也可以簡化他們的操作。那些被經常使用的查詢可以被定義為視圖,從而使得用戶不必為以後的操作每次指定全部的條件。另外通過視圖用戶只能查詢和修改他們所能見到的數據。資料庫中的其它數據則既看不見也取不到。資料庫授權命令可以使每個用戶對資料庫的檢索限制到特定的資料庫對象上,增強數據的安全性。 六、 結束語
資料庫的高效運行不僅需要技術上的支持,也需要硬體平台和網路的支持以及資料庫管理員的有效管理,本文只是從技術的角度說明如何提高資料庫的效率,但在實際應用過程中其它方面的支持也是不可缺少的,尤其是資料庫管理,資料庫建設是「三分技術,七分管理,十二分基礎數據」,因此對於資料庫管理一定要重視,在管理到位的情況下技術才能發揮應有的作用。
『伍』 什麼是四大國家基礎資料庫
「四大基礎資料庫」在國家電子政務建設中具有重要的地位和作用,是國家信息化和電子政務建設的一項重要基礎設施。無論在政務領域,還在企業領域,「四大基礎資料庫」有著廣泛的應用場景和共享需求,四大基礎資料庫的建設不僅能實現數據的共享,同時在建設的過程本身也推進著各業務流程的整合及優化。
四大基礎庫分別是:人口基礎資料庫、法人資料庫、宏觀經濟資料庫,自然資源與空間地理資料庫,也有的專家稱「四大基礎資料庫」是國家層面四大主資料庫。
1、人口信息資料庫
人口信息庫的主體包括公民身份號碼、姓名、性別、民族、出生地等基本信息,還包括各部門業務系統在利用人口基本信息過程中產生的、其他部門存在共享需求的人口信息。
人口信息資料庫主要來自公安局、人社局、民政局、衛生局、教育局等,另外我市在綜治辦、市民卡中心、便民服務中心也有部分數據。
2、法人單位信息資料庫
法人單位信息資料庫的數據主要來源於市場監督局的企業注冊登記庫和組織機構代碼庫,編辦的事業單位注冊登記、民政局的社會團體登記庫、國稅地稅的稅務資料庫,以及統計局的基本單位普查庫等。
3、自然資源和空間地理信息資料庫
自然資源和空間地理信息資料庫是以電子地圖為基礎,整合道路、行政區劃、建築、植被、地下管線等基礎數據,以及土地利用、規劃用地、園林綠化、生態環境、自然資源等專題數據。
4、宏觀經濟基礎信息資料庫
宏觀經濟基礎信息數據包括全市主要經濟指標、地方財政收入、稅收完成情況、金融機構信貸情況、各鎮(區)主要經濟指標等信息,以統計經濟信息為基礎。
(5)資料庫基礎層擴展閱讀
近年來,全國各地都已開始積極建設「四大基礎資料庫」,並在「四大基礎資料庫」基礎上建設「數字城市」,有些發達地區的地方政府已開始從「數字城市」向「智慧城市」轉型升級,進入「大數據」時代。
習近平總書記指出「沒有信息安全,就沒有國家安全,沒有信息化就沒有現代化」,李克強總理也提出了「互聯網+」概念,這充分說明了信息化的重要性。
「四大基礎資料庫」正是政府信息化建設的基礎,對電子政務具有非常重要意義,既能加強政務資源的整合、共享與交換,打破信息孤島,避免重復建設,又能推進政府職能部門業務協同,強化服務意識,通過數據加工和挖掘還能為政府決策提供知識依據和大數據的支持。
『陸』 資源與環境基礎資料庫圖層
1.金屬礦產資源圖層劃分
a.基本信息(JXΔΔΔ01)
對成礦地質環境的總體素描,包括地層(界、系、統)、構造(主控斷裂)、岩漿岩(超基性—酸性、鹼性;太古代—新生代)。
b.礦床信息(JXΔΔΔ02~04)
02——貴金屬;03——有色金屬;04——黑色金屬;大中小型礦床所在地。
c.成礦信息(JXΔΔΔ05)
成礦遠景區(Ⅰ、Ⅱ、Ⅲ級)。
d.工業布局信息(JXΔΔΔ06)
大中小型礦山,冶煉廠所在地。
e.交通信息(JXΔΔΔ07)
連接交通干線的專線鐵路、公路支線。
2.非金屬礦產資源圖層劃分
a.基本信息(FXΔΔΔ01)
對成礦地質特徵的總體素描,包括地層(群、組、段)、構造(主控斷裂、褶皺)、岩漿岩(超基性—酸性、鹼性)。
b.礦床信息(FXΔΔΔ02~04)
建材工業原料礦產(FXΔΔΔ02);化工工業原料礦產(FXΔΔΔ03);寶玉石、石材工業原料礦產(FXΔΔΔ04)。
c.大中小型礦床所在地
成礦信息(FXΔΔΔ05)。
d.含礦層位
工業布局信息(FXΔΔΔ06)。
e.大中小型礦山及加工基地所在地
交通信息(FXΔΔΔ07);連接交通干線的鄉鎮級公路。
3.能源礦產資源圖層劃分
a.基本信息(NXΔΔΔ01)
對成礦地質環境的總體素描,包括含礦地層(群、組)、構造(邊界、斷裂)、沉積凹陷、基底隆起。
b.礦床信息(NXΔΔΔ02~03)
石油、天然氣(NXΔΔΔ02);煤、煤層氣(NXΔΔΔ03);大中小型煤田、油氣田。
c.成礦信息(NXΔΔΔ04)
生油儲油斷陷盆地。
d.工業布局信息(NXΔΔΔ05)
大中小型礦山井田;石油化工、煤化工基地。
e.交通信息(NXΔΔΔ06)
連接交通干線公路、鐵路及鄉鎮公路。
f.災害(NXΔΔΔ07)
塌陷、地下突水、地熱、瓦斯。
4.水資源圖層劃分
a.基本信息(SXΔΔΔ01~02)
水文下墊面(SXΔΔΔ01);富水岩組、導、阻水斷裂(SXΔΔΔ02)。
b.資源總量信息(SXΔΔΔ03)
流域分區與分區產水模數(SXΔΔΔ04);淺層地下水分區與產水模數(SXΔΔΔ05)。
c.給水工業布局信息(SXΔΔΔ06)
城市供水、大型火電基地、耗水工業、農田渠網。
d.災害信息(SXΔΔΔ07)
沉降漏斗、特大洪水澇區、高礦化度區、污染區。
5.土地資源圖層劃分
a.基本信息(TXΔΔΔ01~05)
土地類型(TXΔΔΔ01);土壤類型(TXΔΔΔ02);土地利用現狀(TΔΔΔ03);土壤肥力現狀(TXΔΔΔ04);林地布局現狀(TXΔΔΔ05)。
b.土地利用潛力信息(TXΔΔΔ06~07)
土地利用潛力(TXΔΔΔ06);土地生產力潛力(TXΔΔΔ07)。
6.旅遊資源圖層劃分
a.歷史文化遺存信息(UXΔΔΔ01~04)
黃河文化層(UXΔΔΔ01);伊洛文化層(UXΔΔΔ02);中原文化層(UX★ΔΔΔ03);氏族文化層(UXΔΔΔ04)。
b.山水地質信息(UXΔΔΔ05~10)
太行山斷塊山地地貌(VXΔΔ05);伏牛山峰嶺地貌(UXΔΔΔ06);嵩山地質遺跡(UXΔΔΔ07);豫西南白堊紀恐龍化石遺跡(UXΔΔΔ08);大別山白堊紀火山遺跡(UXΔΔΔ09);自然保護區(UXΔΔΔ10)。
7.環境質量圖層劃分
a.地質環境信息(HXΔΔΔ01~05)
岩土體工程地質(HXΔΔΔ01);活動性斷裂(HXΔΔΔ02);地震震中(HXΔΔΔ03);地震烈度(HXΔΔΔ04);地質災害(HXΔΔΔ05)。
b.生態環境信息(HXΔΔΔ06~11)
年降雨量分布(HXΔΔΔ06);歷年平均積溫(HXΔΔΔ07);植被覆蓋度(HXΔΔΔ08);大氣污染(HXΔΔΔ09);水污染(HXΔΔΔ10);土壤侵蝕(HXΔΔΔ11)。
c.經濟環境信息(HXΔΔΔ12~13)
人口密度(HXΔΔΔ12);生產總值(HXΔΔΔ13)。
8.重點經濟區帶圖層劃分
參照上述標准,編號前加地域名拼音縮寫兩位。
『柒』 access資料庫對象分為三個層次,其中第一層次是資料庫的基本對象,包括什麼
第一層次是表對象和查詢對象,它們是資料庫的基本對象,用於在資料庫中儲存數據和查詢數據。
第二層次是窗體對象、報表對象和數據訪問頁,它們是直接面向用戶的對象,用於數據的輸入輸出和應用系統的驅動控制。
第三層次是宏對象和模塊對象,它們是代碼類型對象,用於通過組織宏操作或編寫程序來完成復雜的資料庫管理工作並使得數據管理自動化。
『捌』 資料庫的基本結構有哪三個層次
資料庫的基本結構
資料庫的基本結構分三個層次,反映了觀察資料庫的三種不同角度。
(1)物理數據層。它是資料庫的最內層,是物理存貯設備上實際存儲的數據的集合。這些數據是原始數據,是用戶加工的對象,由內部模式描述的指令操作處理的位串、字元和字組成。
(2)概念數據層。它是資料庫的中間一層,是資料庫的整體邏輯表示。指出了每個數據的邏輯定義及數據間的邏輯聯系,是存貯記錄的集合。它所涉及的是資料庫所有對象的邏輯關系,而不是它們的物理情況,是資料庫管理員概念下的資料庫。
(3)邏輯數據層。它是用戶所看到和使用的資料庫,表示了一個或一些特定用戶使用的數據集合,即邏輯記錄的集合。
資料庫不同層次之間的聯系是通過映射進行轉換的。資料庫具有以下主要特點:
(1)實現數據共享。數據共享包含所有用戶可同時存取資料庫中的數據,也包括用戶可以用各種方式通過介面使用資料庫,並提供數據共享。
(2)減少數據的冗餘度。同文件系統相比,由於資料庫實現了數據共享,從而避免了用戶各自建立應用文件。減少了大量重復數據,減少了數據冗餘,維護了數據的一致性。
(3)數據的獨立性。數據的獨立性包括資料庫中資料庫的邏輯結構和應用程序相互獨立,也包括數據物理結構的變化不影響數據的邏輯結構。
(4)數據實現集中控制。文件管理方式中,數據處於一種分散的狀態,不同的用戶或同一用戶在不同處理中其文件之間毫無關系。利用資料庫可對數據進行集中控制和管理,並通過數據模型表示各種數據的組織以及數據間的聯系。
(5)數據一致性和可維護性,以確保數據的安全性和可靠性。主要包括:①安全性控制:以防止數據丟失、錯誤更新和越權使用;②完整性控制:保證數據的正確性、有效性和相容性;③並發控制:使在同一時間周期內,允許對數據實現多路存取,又能防止用戶之間的不正常交互作用;④故障的發現和恢復:由資料庫管理系統提供一套方法,可及時發現故障和修復故障,從而防止數據被破壞
『玖』 基礎資料庫
(一)數據內容
基礎資料庫包括系統運行前所採集到的所有支撐數據,數據的具體內容在數據分類與數據源章節中已描述,概括可分為以下幾類。
(1)遙感影像數據:包括歷史圖像數據,以及按照一定監測周期更新的遙感圖像數據。
(2)數字線劃圖數據:矢量數據(現狀專題圖和歷史專題圖數據)、柵格數據、元數據等。入庫前數據以ArcInfoCoverage格式分幅或整體存儲,採用地理坐標系統。
(3)數字柵格圖數據:包括1∶5萬和1∶10萬基礎地理圖形數據的掃描柵格數據。
(4)數字高程模型數據:塔里木河幹流河道1∶1萬和「四源一干」區域1∶10萬數字高程模型。
(5)多媒體數據:考察照片、錄像、錄音和虛擬演示成果等多媒體資料。
(6)屬性數據:社會經濟與水資源數據、水利工程數據、生態環境數據等。
(二)數據存儲結構
1.柵格數據
柵格數據包括遙感影像、數字柵格圖、數字正射影像圖、數字高程模型等,這些數據的存儲結構基本類似,因此可進行統一設計。遙感圖像資料庫與普通的圖像資料庫在存儲上有些差別,遙感圖像作為感測器對地理、空間環境在不同條件下的測量結果(如光譜輻射特性、微波輻射特性),必須結合同時得到的幾個圖像才可以認為是對環境在一定的時間條件下的完整的描述,也即是說,可能需要一個圖像集合才能構成一個圖像的完整的概念,並使之與語義信息產生聯系(羅睿等,2000)。因此,遙感圖像數據存儲結構模型必須能夠描述幾個圖像(波段)之間的邏輯關系。利用ArcSDE進行數據入庫時,系統可自動建立各圖像(波段)之間的關系,並按一定規則存儲在資料庫系統中。
對柵格數據在後台將採用Oracle資料庫管理系統進行存儲。Oracle系統可直接存儲影像信息,並具有較強的數據管理能力,可以實現柵格數據信息的快速檢索和提取。數據引擎採用ArcSDE,實現各類影像數據的入庫。數據存儲的關鍵是建立圖幅索引,本系統數據的存儲按圖幅號、圖名、採集時間等內容建立索引。
柵格數據依據圖形屬性一體化的存儲思想,採用大二進制格式直接存儲數據,這種方式的存儲可實現內容的快速檢索查詢,按索引表檢索出相關項後可直接打開柵格數據,提高柵格數據的管理效率。
2.矢量數據
本系統採用圖屬一體化思想即將空間數據和屬性數據合二為一,全部存在一個記錄集中的思想存儲空間數據,是目前GIS數據非常流行的存儲方法。考慮到數據的具體情況,決定採用資料庫存儲空間數據和屬性數據,部分具有少量、定型幾何信息的地理要素如水文測站、河流、湖泊等,採用圖屬一體化思想存儲其信息,而與其有關聯關系的大量、多邊化的屬性信息如水文信息,則存儲在屬性數據表中,利用唯一標識符信息建立兩表的關聯。
針對本系統空間數據的特點,系統按照「資料庫—子庫—專題(基礎數據)—層—要素—屬性」的層次框架來構築空間資料庫,按照統一的地理坐標系統來存儲空間數據,以實現對地理實體/專題要素進行分層疊加顯示。
3.多媒體數據
Oracle系統可直接存儲圖片和視頻信息,並具有較強的數據管理能力,可以實現多媒體信息的快速檢索和提取。多媒體數據存儲的關鍵是建立索引表,本系統多媒體數據的存儲按類型、時間、內容等項目建立索引,直接存儲於Oracle資料庫中。
多媒體數據存儲時,可以將多媒體內容與索引表結構合為一體,採用大二進制格式直接存儲,這種存儲方式可實現內容的快速檢索和查詢,按索引表檢索出相關項後可直接打開多媒體內容,而且多媒體資料庫也便於維護管理。
(三)空間索引設計
1.矢量空間索引
確定合適的格網級數、單元大小是建立空間格網索引的關鍵。格網太大,在一個格網內有多個空間實體,查詢檢索的准確度就低。格網太小,則索引數據量成倍增長和冗餘,檢索的速度和效率低。每一個數據層可採用不同大小、不同級別的空間索引格網單元,但每層級數最多不能超過三級。索引方式設置遵循以下基本原則:
(1)對於簡單要素的數據層,盡可能選擇單級索引格網,減少RDBMS搜索格網單元索引的級數,縮短空間索引搜索的過程;
(2)如果數據層中的要素封裝邊界大小變化比較大,應選擇2或3級索引格網;
(3)如果用戶經常對圖層執行相同的查詢,最佳格網的大小應是平均查詢范圍的1.5倍;
(4)格網的大小不能小於要素封裝邊界的平均大小。為了減少每個格網單元有多個要素封裝邊界的可能性,格網單元的大小應取要素封裝邊界平均大小的3倍;
(5)格網單元的大小不是一個確定性的問題,需要多次嘗試和努力才會得到好的結果。有一些確定格網初始值的原則,用它們可以進一步確定最佳的格網大小。
SDE(Spatial Data Engine,即空間數據引擎),從空間管理的角度看,是一個連續的空間數據模型,可將地理特徵的空間數據和屬性數據統一集成在關系型資料庫管理系統中。關系型資料庫系統支持對海量數據的存儲,從而也可實現對空間數據的海量存儲。空間數據可通過層來進行數據的劃分,將具有共同屬性的一類要素放到一層中,每個資料庫記錄對應一層中一個實際要素,這樣避免了檢索整個數據表,減少了檢索的數據記錄數量,從而減少磁碟輸入/輸出的操作,加快了對空間數據查詢的速度。
ArcSDE採用格網索引方式,將空間區域劃分成合適大小的正方形格網,記錄每一個格網內所包含的空間實體(對象),以及每一個實體的封裝邊界范圍,即包圍空間實體的左下角和右上角坐標。當用戶進行空間查詢時,首先計算出用戶查詢對象所在格網,然後通過格網號,就可以快速檢索到所需的空間實體。因此確定合適的格網級數、單元大小是建立空間格網索引的關鍵,太大或太小均不合適,這就需要進行多次嘗試,確定合適的網格大小,以保證各單元能均勻落在網格內。利用ArcSDE的索引表創建功能,記錄每一網格單元的實體分布情況,形成圖層空間索引表。根據空間索引表,ArcSDE實現了對空間數據的快速查詢。
2.柵格數據空間索引
柵格數據的空間索引通過建立多級金字塔結構來實現。以高解析度柵格數據為底層,逐級抽取數據,建立不同解析度的數據金字塔結構,逐級形成較低解析度的柵格數據。該方法通常會增加20%左右的存儲空間,但卻可以提高柵格數據的顯示速度。在資料庫查詢檢索時,調用合適級別的柵格數據,可提高瀏覽和顯示速度。
(四)入庫數據校驗
入庫數據的質量關繫到系統評價分析結果的准確性。數據在生產中就需要嚴格進行質量控制。依據數據生產流程,將數據質量控制分成生產過程式控制制和結果控制。生產過程式控制制包括數據生產前期的質量控制、數據生產過程中的實時質量控制,結果質量控制為數據生產完成後的質量控制(裴亞波等,2003)。對入庫數據的校驗主要是進行數據生產完成後的質量控制和檢查。
1.規范化檢查
(1)代碼規范化:所有地理代碼盡量採用國家標准和行業標准,例如,行政代碼採用中華人民共和國行政區劃代碼國標。
(2)數據格式規范化:所有數據採用標准交換數據格式,例如,矢量數據採用標准輸出Coverage格式和E00格式。
(3)屬性數據和關系數據欄位規范化:所有屬性數據和關系數據提前分門別類地設計欄位的內容、長短和格式,操作過程中嚴格執行。
(4)坐標系統規范化:本系統所有與空間有關的數據採用統一的空間坐標系統,即地理坐標系統。
(5)精度規范化:所有數據按照數據精度與質量控制中所要求的精度進行採集和處理。
(6)命名規范化:所有數據按照命名要求統一命名,便於系統的查詢。
(7)元數據規范化:依照元數據標准要求,進行元數據檢查。
2.質量控制
數據質量是GIS成敗的關鍵。對於關系型資料庫設計,只要能保證表的實體完整性和參照完整性,並使之符合關系資料庫的三個範式即可。對於空間資料庫設計,則不僅要考慮數據采樣、數據處理流程、空間配准、投影變換等問題,還應對數據質量做出定量分析。
數據質量一般可以通過以下幾個方面來描述(吳芳華等,2001):
(1)准確度(Accuracy):即測量值與真值之間的接近程度,可用誤差來衡量;
(2)精度(Precision):即對現象描述得詳細程度;
(3)不確定性(Uncertainty):指某現象不能精確測得,當真值不可測或無法知道時,就無法確定誤差,因而用不確定性取代誤差;
(4)相容性(Compatibility):指兩個來源不同的數據在同一個應用中使用的難易程度;
(5)一致性(Consistency):指對同一現象或同類現象表達的一致程度;
(6)完整性(Completeness):指具有同一準確度和精度的數據在類型上和特定空間范圍內完整的程度;
(7)可得性(Accessibility):指獲取或使用數據的容易程度;
(8)現勢性(Timeliness):指數據反映客觀現象目前狀況的程度。
塔里木河流域生態環境動態監測系統的所有數據在數據質量評價後,還需要從數據格式、坐標一致性等方面進行入庫質量檢驗,只有通過質量檢驗的數據才可以入庫。
3.數據檢驗
空間數據質量檢驗包括以下步驟:
(1)數據命名是否規范,是否按設計要求命名;
(2)數據是否能夠正常打開;
(3)投影方式是否正確;
(4)坐標系統是否正確;
(5)改錯是否完成,拓撲關系是否建立;
(6)屬性數據是否正確,包括欄位設置是否依據設計進行、是否有空屬性記錄、是否有屬性錯誤記錄等。
關系數據質量檢驗包括以下步驟:
(1)數據命名是否規范,是否按設計要求命名;
(2)數據是否能夠正常打開;
(3)數據欄位是否按設計要求設置;
(4)是否有空屬性記錄;
(5)是否有屬性錯誤記錄。
屬性數據的校驗,主要採用以下三種方式:
(1)兩次錄入校驗:對一些相互之間毫無關聯的數據,進行兩次的錄入,編寫程序對兩次錄入的結果進行比較,找出兩次錄入結果不一樣的數據,查看正確值,進行改正。
(2)折線圖檢驗:對一些相互之間有關聯的序列數據,如人口統計數據,對這一類數據,編寫程序把數據以折線圖的形式顯示在顯示器上,數據的序列一般都有一定規律,如果出現較大的波動,則需對此點的數據進行檢查修改。
(3)計算校驗:對一些按一定公式計算後所得結果與其他數據有關聯的數據,如某些數據的合計等於另一數據,編寫程序對這類數據進行計算,計算結果與有關聯的數據進行比較,找出結果不一樣的數據,查看正確值,進行改正。
圖形數據的校驗,主要包括以下步驟(陳俊傑等,2005):
(1)圖層校驗:圖形要素的放置圖層是唯一的。對於入庫的Coverage數據,系統將根據圖層代碼進行檢查,確保圖形要素對層入座。
(2)代碼檢查:圖形要素的代碼是唯一的。對於入庫的Coverage數據,系統將根據入庫要素代碼與特徵表中的代碼進行比較,確保入庫數據代碼存在,杜絕非法代碼入庫。
(3)類型檢查:對入庫的數據,檢查該要素的類型與特徵表中的類型是否一致,確保圖形要素對表入座。如點要素、線要素、面要素僅能賦相應的點、線、面代碼,且該代碼必須與特徵表中的數據類型代碼相同。
(4)范圍檢查:根據入庫的數據,確定該類要素的大體范圍(如X、Y坐標等),在數據入庫前,比較入庫數據與范圍數據的大小,若入庫數據在該范圍內,則入庫,否則給出提示檢查信息。
(五)數據入庫
1.遙感影像數據
利用空間數據引擎———ArcSDE可實現遙感影像數據在Oracle資料庫中的存儲和管理,在影像數據進行入庫時,應加入相應的索引和影像描述欄位。
遙感影像入庫步驟:
(1)影像數據預處理:要將塔里木河遙感影像資料庫建成一個多解析度無縫影像資料庫系統,客觀上要求資料庫中的影像數據在幾何空間、灰度空間連續一致。因此,在數據採集階段就需要對影像數據進行預處理,包括圖像幾何校正、灰度拼接(無縫鑲嵌)、正射處理、投影變換等。
幾何校正的目的是使校正後的圖像重新定位到某種地圖投影方式,以適用於各種定位、量測、多源影像的復合及與矢量地圖、DTM等的套合顯示與處理。幾何校正多採用二次多項式演算法和圖像雙線性內插重采樣法進行圖像校正。將糾正後具有規定地理編碼的圖像按多邊形圈定需要拼接的子區,逐一鑲嵌到指定模版,同時進行必要的色彩匹配,使整體圖像色調一致,完成圖像的幾何拼接,再採用金字塔影像數據結構和「從粗到精」的分層控制策略實現逐級拼接。
數字正射影像具有統一的大地坐標系、豐富的信息量和真實的景觀表達,易於製作具有「獨立於比例尺」的多級金字塔結構影像。可以採用DTM和外方位元素經過數字微分糾正方法,獲得數字正射影像,它的基本參數包括原始影像與正射影像的比例尺、采樣解析度等(方濤等,1997)。
投影變換需根據資料庫系統定義的標准轉換到統一的投影體系下。
(2)影像數據壓縮:隨著感測器空間解析度的提高和對遙感信息需求的日益增長,獲取的影像數據量成幾何級數增大,如此龐大的數據將佔用較大的存儲空間,給影像的存儲和傳輸帶來不便(葛詠等,2000)。目前,系統處理的遙感影像數據已達數百千兆,單個文件的影像數據最大達到了2G,這樣的數據量在調用顯示時速度很慢,對影像數據進行壓縮存儲,將大大提高影像訪問效率。本系統採用ArcSDE軟體提供的無損壓縮模式對入庫影像進行壓縮。
(3)影像導入:遙感影像的入庫可通過ArcSDE或入庫程序進行導入,並填寫相關的索引信息,在入庫時對大型的遙感影像數據進行自動分割,分為若乾的塊(tiles)進行存儲。
(4)圖像金字塔構建:採用ArcSDE提供的金字塔構建工具在入庫時自動生成圖像金字塔,用戶只需要選擇相應的參數設置即可。圖像金字塔及其層級圖像按解析度分級存儲與管理。最底層的解析度最高,並且數據量最大,解析度越低,其數據量越小,這樣,不同的解析度遙感圖像形成了塔式結構。採用這種圖像金字塔結構建立的遙感影像資料庫,便於組織、存儲與管理多尺度、多數據源遙感影像數據,實現了跨解析度的索引與瀏覽,極大地提高了影像數據的瀏覽顯示速度。
2.數字線劃圖
對紙圖數字化、配准、校正、分層及拼接等處理後,生成標准分幅和拼接存儲的數字矢量圖,就可以進行圖形數據入庫。
(1)分幅矢量圖形數據、圖幅接合表:按圖形比例尺、圖幅號、製作時間、圖層等方式,通過入庫程序導入到資料庫中,同時導入與該地理信息相對應的屬性信息,建立空間信息與屬性信息的關聯。
(2)拼接矢量圖形數據:按圖形比例尺、製作時間、圖層等方式,通過入庫程序導入到資料庫中,同時導入與該地理信息相對應的屬性信息,建立空間信息與屬性信息的關聯。
3.柵格數據
對紙圖數字化、配准、校正、分層及拼接等處理後,生成標准分幅和整體存儲的數字柵格圖,然後進行圖形數據入庫。
(1)分幅柵格圖形數據、圖幅接合表:按圖形比例尺、圖幅號、製作時間等方式,通過入庫程序導入到資料庫中。
(2)整幅柵格圖形數據:按比例尺、製作時間等方式,通過入庫程序導入到資料庫中。
4.數字高程模型
(1)分幅數字高程模型數據、圖幅接合表:按圖形比例尺、圖幅號、製作時間等方式,通過入庫程序導入到資料庫中。
(2)拼接數字高程模型數據:按比例尺、製作時間等方式通過入庫程序導入到資料庫中。
5.多媒體數據
多媒體數據入庫可根據多媒體資料庫內容的需要對入庫數據進行預處理,包括音頻、視頻信息錄制剪接、文字編輯、色彩選配等。對多媒體信息的加工處理需要使用特定的工具軟體進行編輯。由於音頻信息和視頻信息數據量巨大,因此,對多媒體數據存儲時需採用數據壓縮技術,現在的許多商用軟體已能夠直接存儲或播放壓縮後的多媒體數據文件,這里主要考慮根據數據顯示質量要求選擇採用不同的存儲格式。圖4-2為各類多媒體數據的加工處理流程。
圖4-2 多媒體數據加工處理流程圖
6.屬性數據
將收集的社會經濟、水利工程、生態環境等屬性資料,進行分析整理,輸入計算機,最後經過程序的計算處理,存儲到資料庫中,具體流程如圖4-3所示。
圖4-3 屬性數據入庫流程圖