『壹』 數據倉庫的模型有哪些
1. 星型模式
星形模式(Star Schema)是最常用的維度建模方式。星型模式是以事實表為中心,所有的維度表直接連接在事實表上,像星星一樣。星形模式的維度建模由一個事實表和一組維表成,且具歷頌畢有以下特點:a. 維表只和事實表關聯,維表之間沒有關聯;b. 每個維表主鍵為單列,且該主鍵放置在事櫻鬧實表中,作為兩邊連接的外鍵;c. 以事實表為核心,維表圍繞核心呈星形分布;
星座模型
『貳』 資料庫系統的三種模型是什麼
數據模型主要有三種:層次模型、網狀模型和關系模型。其中,層次模型和網狀模型統稱為非關系模型,由此構成的資料庫居於非關系資料庫產品,目前較少使用,關系模型構成關系資料庫,是當前資料庫主流產品。
關系模型是通過滿足一定條件的二維表來表示數據及其數據間聯系的一種模型。
『叄』 資料庫主要有哪些模型這些模型的特點是什麼
兩大類數據模型:數據模型分為2類(分屬2個不同的層次,在開發和使用資料庫中使用不同的模型)。
概念模型,也稱信息模型,它是按用戶的觀點來對數據和信息建模,用於資料庫設計。
邏輯模型和物理模型,邏輯模型主要包括:網狀模型、層次模型、關系模型、面向對象模型等,按計算機系統的觀點對數據建模,用於DBMS實現。
物理模型,是對數據最底層的抽象,描述數據在系統內部的表示方式和存取方法,在磁碟或磁帶上的存儲方式和存取方法。
概念模型:信息世界中的基本概念。
用途:資料庫設計人員和用戶之間進行交流的語言。但要考E-R圖!
最常用的數據模型:非關系模型,有層次模型和網狀模型;關系模型;面向對象模型、對象關系模型。
『肆』 資料庫系統的三種模型是什麼
數據模型主要有三種:層次模型、網狀模型和層次模型、網狀模型和關系模型。
三種模型的特點如下:
1、層次模型 :滿足以下二個條件的基本層次聯系的集合笑埋:
有且只有一個結點沒有雙親結點。除根結點外的其他結點有且只有一個雙親結點。2、網狀模型 :滿足以下二個條件的基本層次聯系的集合:
允許一個以上的結點沒有雙親結點。一個結點可以有多個雙親結點。3、關系模型
關系模型用表的集合來表示數據和數據間的聯系。每個表有多個列,每列有唯一的列名.在關系模型中,無論是從客觀事物中抽象出的實體,還是實體之間的聯系碰絕螞,都用單一的結構類型宏純「關系」來表示。
『伍』 資料庫的概念模型是什麼其特點是什麼
資料庫的概念模型是面向對象資料庫系統是為了滿足新的資料庫應用需要而產生的新一代資料庫系統。面向對象是一種認識方法學,也是一種新的程序設計方法學。
資料庫概念模型實際上是現實世界到機器世界的一個中間層次。資料庫概念模型用於信息世界的建模,是現實世界到信息世界的第一層抽象,是資料庫設計人員進行資料庫設計的有力工具,也是資料庫設計人員和用戶之間進行交流的語言。
(5)儲能大資料庫模型擴展閱讀:
建立數據概念模型,就是從數據的觀點出發,觀察系統中數據的採集、傳輸、處理、存儲、輸出等,經過分析、總結之後建立起來的一個邏輯模型,它主要是用於描述系統中數據的各種狀態。這個模型不關心具體的實現方式(例如如何存儲)和細節,而是主要關心數據在系統中的各個處理階段的狀態。 實際上,數據流圖也是一種數據概念模型。
『陸』 資料庫的三種基本模型是什麼
傳統的基本數據模型有以下三種:
1、層次模型
層次模型是一種樹結構模型,它把數據按自然的層次關系組織起來,以反映數據之間的隸屬關系。層次模型是資料庫技術中發展最早、技術上比較成熟的一種數據模型。它的特點是地理數據組織成有向有序的樹結構,也叫樹形結構。結構中的結點代表數據記錄,連線描述位於不同結點數據間的從屬關系(一對多的關系)。
2、網狀數據模型
網狀模型將數據組織成有向圖結構,圖中的結點代表數據記錄,連線描述不同結點數據間的聯系。這種數據模型的基本特徵是,結點數據之間沒有明確的從屬關系,一個結點可與其它多個結點建立聯系,即結點之間的聯系是任意的,任何兩個結點之間都能發生聯系,可表示多對多的關系。
3、關系數據模型
由於關系資料庫結構簡單,操作方便,有堅實的理論基礎,所以發展很快,80年代以後推出的資料庫管理系統幾乎都是關系型的。涉及到的基礎知識有:關系模型的邏輯數據結構,表的操作符,表的完整性規則和視圖、範式概念。
關系模型可以簡單、靈活地表示各種實體及其關系,其數據描述具有較強的一致性和獨立性。在關系資料庫系統中,對數據的操作是通過關系代數實現的,具有嚴格的數學基礎。
『柒』 資料庫主要的模型有哪些
資料庫主要的模型有:層次結構模型、網狀結構模型、關系結構模型。
『捌』 資料庫概念模型
一、航空物探資料庫定位
資料庫是信息系統的基礎和核心,把大量的數據信息按一定的模型組織起來存儲在資料庫中,提供數據維護、數據檢索等功能,使信息系統能方便、及時、准確地從資料庫中獲得所需的信息。因此,資料庫結構設計是信息系統開發的重中之重。
經分析航空物探數據具有空間性、海量性、多源性和多尺度的特點,這說明航空物探數據具有典型的空間數據的特點,可以採用空間數據管理方式進行管理。
ESRI公司的Geodatabase(空間資料庫)是採用標准關系資料庫技術來表現地理信息的面向對象的高級GIS數據模型,是建立在DBMS之上的統一的、智能化的空間數據模型,是以一組相關聯的表來表達地理要素之間關系、有效性規則和值域。對於多源、海量的航空物探數據,Geodatabase能在一個統一的模型框架下很好地解決多源數據一體化存儲的問題,和採用標准關系資料庫技術來表現海量航空物探數據的地理信息特性。Geoda-tabase引入了地理空間實體的行為、有效性規則和關系,在處理Geodatabase中對象時,對象的基本行為和必須滿足的規則無需通過程序編碼實現,只需根據需要擴展其有效性規則(Geodatabase面向對象的智能化特性),即可支持航空物探數據模型擴展的需要。
因此,航空物探資料庫是空間資料庫,在航空物探資料庫建模過程中,以空間數據建模為主導,統領屬性數據建模。
二、統一空間坐標框架
為了用數學語言描述地球,人們用規則的幾何形體來替代地球表面,從地球自然表面、大地水準面、旋轉橢球面直到用簡單數學函數表達的參考橢球體,以便通過地圖投影將三維曲面轉化成二維平面。由於地球表面不同地區的地形起伏差異很大,採用單一橢球體勢必會造成某地區的誤差小而其他地區誤差很大的結果。因此,在20世紀初不同國家或地區先後採用了逼近本國或本地區地球表面的橢球體,如中國的克拉索夫斯基橢球體,美國的海福特橢球體、英國的克拉克橢球體等。這又造成了目前世界各國的地理信息空間坐標框架不統一,空間數據信息難以共享被動局面。為此,在實現數字地球計劃中,必須規范和統一世界上不同國家和地區的地球參考橢球體。
在小區域表達地球表面時,通常採用平面的方式,即投影坐標系統。如何科學地選擇投影坐標,一般要根據具體的地學應用、地理區域和范圍、比例尺條件等因素來確定,不同的國家有著不同的規定。
通過對航空物探數據的坐標系統進行分析可知,航空物探圖件的坐標框架與國家對基本比例尺制圖的規定相一致,即小比例尺編圖採用Lambert雙標准緯線等角圓錐投影;中比例尺採用Gauss6°帶的分帶投影;大比例尺採用Gauss3°帶的分帶投影(表2-1);對於低緯度的海上作業區通常採用Mecator等角圓柱投影。地球橢球體分別採用1954北京坐標系的Krassovsky橢球參數、WGS84橢球參數和未來的國家2000坐標系的橢球參數。
表2-1 航空物探地理坐標數據的投影方式
傳統的航空物探數據是按測區管理的,根據測區的測量比例尺來確定相應的坐標框架;因此,勘探目標不同的測區測量比例尺是不一致的,地坐標框架也不同。航空物探資料庫要將不同測區、不同比例尺、不同坐標框架的數據集中管理和可視表達,若沒有統一的空間坐標框架,就不可能正確地表達全國航空物探數據。所以,面對如此復雜的多坐標框架的航空物探數據,如何確定科學合理的空間坐標框架,將全國的航空物探數據整合到統一的空間參考框架下,實現數據的統一存儲和數據間無縫拼接,是航空物探資料庫建設的關鍵所在,是組織和管理多維、多格式、大跨度、跨平台的航空物探數據和多目標數字制圖的數學基礎。
統一的空間坐標框架必須支持我國領土覆蓋的海域和陸域航空物探數據的存儲和表達。我國領土東西跨度達70°,南北達55°,顯然採用任何投影坐標系都是不合適的。Gauss6°投影適合6°帶內空間數據表達,若全國航物探數據採用6°分帶表達,在高緯度地區會造成6°帶間數據裂縫問題;Lambert投影可滿足數據的無縫表達,但對大比例尺數據變形較大,無法滿足數據制圖的精度要求;Mecator投影也可滿足數據的無縫表達,低緯度地區也能滿足大比例尺數據制圖的精度要求,但在我國中高緯度區存在著嚴重變形問題。所以,航空物探數據模型採用地理坐標(無投影,圖2-1)格式存放,可根據實際應用的需要將航空物探數據變換到任何方式的投影坐標系統。
航空物探資料庫模型採用Beijing_1954地理坐標系,相關參數如下:
角度單位:°(0.017453292519943299rad)
零經線:格林尼治(0.000000000000000000)
基準:D_Beijing_1954
橢球:Krasovsky_1940
長軸半徑:6378245.000m
短軸半徑:6356863.019m
建立統一坐標框架是空間資料庫建設的一項基礎性工作,採用Beijing_1954地理坐標系作為航空物探資料庫統一空間坐標框架具有以下優點。
圖2-1 統一空間坐標框架示意圖
(一)無縫空間數據存儲
統一空間坐標框架解決了復雜的航空物探數據的坐標系統、投影、比例尺等不統一的問題,實現同一性質的物探數據在同一個主題中進行管理。如全國的航磁異常數據可放在一個圖層上進行管理。
(二)適合多尺度表達
按測區管理的多尺度、多框架的航空物探數據是處於一個相對坐標系統中,各個測區間相對位置關系會發生錯位。採用統一的Beijing_1954地理坐標框架,恢復了各測區間正確的位置關系,實現不同尺度數據的集成和正確表達,易於多源異構空間數據的融合。
(三)大區域數據集成
我國海陸面積近1300×104km2,地域跨度較大。在進行小比例尺的航空物探編圖時,需要選用與之相適應的投影坐標;在陸地和海域進行大比例尺制圖時,同樣需要選用合適投影系統。航空物探制圖的實踐也證明了這一點。1995年6月由中國、加拿大、美國、愛爾蘭和俄羅斯等國科學家共同編制的1:1000萬歐亞東北地區磁異常與大地構造圖,採用橫軸Mercator投影。中心編制的1:500萬全國航磁圖採用Lambert投影。2008年,由中國和吉爾吉斯斯坦科學家編制的1:100萬中吉天山金屬礦產成礦規律圖,採用Lambert投影,將兩個國家不同時期、不同尺度的數據進行了有效的集成,是地質、地球物理等綜合應用的典範。
隨著航空物探數據應用領域的不斷擴展,陸地、海域,甚至於洲際和全球航空物探數據的整體表達都需對坐標投影提出要求。採用統一的地理坐標框架的航空物探數據非常容易變換到指定的投影坐標框架,滿足多樣化的制圖要求。
三、要素類和對象類的劃分
Geodatabase空間資料庫模型結構(圖2-2)分為空間資料庫、要素數據集(Feature dataset)、要素類(Feature classes)、要素(Feature)4個層次。為了建立航空物探Geoda-tabase空間數據模型,我們依據Geodatabase模型關於要素類和對象類的劃分原則,結合相關的國家標准和地球物理行業標准,制定了《航空物探數據要素類和對象類劃分標准》,對航空物探數據進行數據分類。
圖2-2 空間資料庫模型結構
1)按照航空物探數據的空間特徵,將其劃分為5個要素數據集,即勘查項目概況要素數據集、基礎數據要素數據集、異常要素數據集、解釋要素數據集和評價要素數據集。
2)根據航空物探測量方法、數據處理過程以及推斷解釋方法和過程,進一步把航空物探數據劃分為若干要素類和對象類,定義了要素類的主題特徵和表達方式,確定子類和屬性域;定義對象類的結構和聯接欄位,建立了關系類。
3)定義要素類的內容、欄位名稱和存儲結構。在航空物探數據採集過程中,不同類型的數據采樣率不同,坐標數據采樣2次/s,重力場數據采樣2次/s,磁場數據采樣10次/s,這就造成了場值數據與坐標數據無法一一對應問題。若按場值數據采樣率內插坐標數據,將導致數據量成倍增長;若按坐標數據采樣率抽稀場值數據,將降低航空物探測量對地質體的分辨能力,影響測量效果。在綜合分析航空物探數據應用基礎上,提出了採用要素數據與屬性數據分置的方式,將測線坐標數據與地球物理場數據分離,分別建立獨立共享的航跡線數據要素類模型,磁場、重力場等數據對象類模型(圖2-3),很好地解決了航空物探數據的存儲問題。
圖2-3 要素數據與屬性數據分置示意圖
採用要素數據與屬性數據分置方式,不僅是基於航空物探數據屬性數據的多源性、不同采樣頻率等特點的考慮,還考慮到數據的綜合查詢和檢索的速度,特別是通過ArcSDE訪問空間資料庫的效率的問題。再者,對於大部分用戶來說,需求是屬性數據的綜合應用,因此在資料庫建模過程中,將屬性數據採用對象類的方式進行管理,不但提高了空間數據的操作能力,同時在ArcSDE的配置上採用直接訪問資料庫(對象類)方式,並且加快了數據查詢和統計的速度。
四、資料庫概念模型
用戶需求是資料庫建設的約束條件之一。航空物探數據的空間特性決定航空物探資料庫必須是空間資料庫,採用資料庫管理數據,利用GIS技術提供可視化服務,這是各個層次用戶的一致要求。因此,我們從現實世界出發,對航空物探數據的多源性、多尺度和不同采樣等問題進行了描述,提出了解決方案。此方案是不依賴於任何具體的硬體環境和資料庫管理系統(DBMS),建立了客觀反映現實世界的航空物探資料庫概念模型,把用戶需要管理的信息統一到整體概念結構中,表達了用戶需要。
在全面分析航空物探業務流程和數據流程,以及航空物探數據特性的基礎上,按照《航空物探數據要素類和對象類劃分標准》,以及空間實體點、線、面要素特徵的基本原則,對航空物探資料庫所涉及的實體進行歸類,劃分成12個主題。根據空間數據分主題表達的特點和航空物探空間數據坐標框架的定義,確定航空物探資料庫空間數據概念模型,明確各個主題的用途、數據來源、表達方式、空間參考、比例尺和精度等內容,按照ArcGIS定義空間資料庫的數據分層表達方式(圖2-4),完成航空物探資料庫概念模型設計(圖2-5)。
圖2-4 航空物探資料庫空間數據分層模型
圖2-5 航空物探資料庫空間數據概念模型
『玖』 大型資料庫的設計原則與開發技巧
隨著計算機技術越來越廣泛地應用於國民經濟的各個領域 在計算機硬體不斷微型化的同時 應用系統向著復雜化 大型化的方向發展 資料庫是整個系統的核心 它的設計直接關系系統執行的效率和系統的穩定性 因此在軟體系統開發中 資料庫設計應遵循必要的資料庫範式理論 以減少冗餘 保證數據的完整性與正確性 只有在合適的資料庫產品上設計出合理的資料庫模型 才能降低整個系統的編程和維護難度 提高系統的實際運行效率 雖然對於小項目或中等規模的項目開發人員可以很容易地利用範式理論設計出一套符合要求的資料庫 但對於一個包含大型資料庫的軟體項目 就必須有一套完整的設計原則與技巧
一 成立數據小組
大型資料庫數據元素多 在設計上有必要成立專門的數據小組 由於資料庫設計者不一定是使用者 對系統設計中的數據元素不可能考慮周全 資料庫設計出來後 往往難以找到所需的庫表 因此數據小組最好由熟悉業務的項目骨幹組成
數據小組的職能並非是設計資料庫 而是通過需求分析 在參考其他相似系顫腔統的基礎上 提取系統的基本數據元素 擔負對資料庫的審核 審核內容包括審核新的資料庫元素是否完全 能否實現全部業務需求 對舊資料庫(如果存在舊系統)的分析及數據轉換 資料庫設計的審核 控制及必要調整
二 設計原沖遲則
規范命名 所有的庫名 表名 域名必須遵循統一的命名規則 並進行必要說明 以方便設計 維護 查詢
控制欄位的引用 在設計時 可以選擇適當的資料庫設計管理工具 以方便開發人員的分布式設計和數據小組的集中審核管理 採用統一的命名規則 如果設計的欄位已經存在 可直接引用 否則 應重新設計
庫表重復控制 在設計過程中 如果發現大部分欄位都已存在 開發人員應懷疑所設計的庫表是否已存在 通過對欄位所在庫表及相應設計人員的查詢 可以確認庫表是否確實重復
並發控制 設計中應進行並發控制 即對於同一個庫表 在茄判衫同一時間只有一個人有控制權 其他人只能進行查詢
必要的討論 資料庫設計完成後 數據小組應與相關人員進行討論 通過討論來熟悉資料庫 從而對設計中存在的問題進行控制或從中獲取資料庫設計的必要信息
數據小組的審核 庫表的定版 修改最終都要通過數據小組的審核 以保證符合必要的要求
頭文件處理 每次數據修改後 數據小組要對相應的頭文件進行修改(可由管理軟體自動完成) 並通知相關的開發人員 以便進行相應的程序修改
三 設計技巧
分類拆分數據量大的表 對於經常使用的表(如某些參數表或代碼對照表) 由於其使用頻率很高 要盡量減少表中的記錄數量 例如 銀行的戶主賬表原來設計成一張表 雖然可以方便程序的設計與維護 但經過分析發現 由於數據量太大 會影響數據的迅速定位 如果將戶主賬表分別設計為活期戶主賬 定期戶主賬及對公戶主賬等 則可以大大提高查詢效率
索引設計 對於大的資料庫表 合理的索引能夠提高整個資料庫的操作效率 在索引設計中 索引欄位應挑選重復值較少的欄位 在對建有復合索引的欄位進行檢索時 應注意按照復合索引欄位建立的順序進行 例如 如果對一個 萬多條記錄的流水表以日期和流水號為序建立復合索引 由於在該表中日期的重復值接近整個表的記錄數 用流水號進行查詢所用的時間接近 秒 而如果以流水號為索引欄位建立索引進行相同的查詢 所用時間不到 秒 因此在大型資料庫設計中 只有進行合理的索引欄位選擇 才能有效提高整個資料庫的操作效率
數據操作的優化 在大型資料庫中 如何提高數據操作效率值得關注 例如 每在資料庫流水表中增加一筆業務 就必須從流水控製表中取出流水號 並將其流水號的數值加一 正常情況下 單筆操作的反應速度尚屬正常 但當用它進行批量業務處理時 速度會明顯減慢 經過分析發現 每次對流水控製表中的流水號數值加一時都要鎖定該表 而該表卻是整個系統操作的核心 有可能在操作時被其他進程鎖定 因而使整個事務操作速度變慢 對這一問題的解決的辦法是 根據批量業務的總筆數批量申請流水號 並對流水控製表進行一次更新 即可提高批量業務處理的速度 另一個例子是對插表的優化 對於大批量的業務處理 如果在插入資料庫表時用普通的Insert語句 速度會很慢 其原因在於 每次插表都要進行一次I/O操作 花費較長的時間 改進後 可以用Put語句等緩沖區形式等滿頁後再進行I/O操作 從而提高效率 對大的資料庫表進行刪除時 一般會直接用Delete語句 這個語句雖然可以進行小表操作 但對大表卻會因帶來大事務而導致刪除速度很慢甚至失敗 解決的方法是去掉事務 但更有效的辦法是先進行Drop操作再進行重建
資料庫參數的調整 資料庫參數的調整是一個經驗不斷積累的過程 應由有經驗的系統管理員完成 以Informix資料庫為例 記錄鎖的數目太少會造成鎖表的失敗 邏輯日誌的文件數目太少會造成插入大表失敗等 這些問題都應根據實際情況進行必要的調整
必要的工具 在整個資料庫的開發與設計過程中 可以先開發一些小的應用工具 如自動生成庫表的頭文件 插入數據的初始化 數據插入的函數封裝 錯誤跟蹤或自動顯示等 以此提高資料庫的設計與開發效率
避免長事務 對單個大表的刪除或插入操作會帶來大事務 解決的辦法是對參數進行調整 也可以在插入時對文件進行分割 對於一個由一系列小事務順序操作共同構成的長事務(如銀行交易系統的日終交易) 可以由一系列操作完成整個事務 但其缺點是有可能因整個事務太大而使不能完成 或者 由於偶然的意外而使事務重做所需的時間太長 較好的解決方法是 把整個事務分解成幾個較小的事務 再由應用程序控制整個系統的流程 這樣 如果其中某個事務不成功 則只需重做該事務 因而既可節約時間 又可避免長事務
適當超前 計算機技術發展日新月異 資料庫的設計必須具有一定前瞻性 不但要滿足當前的應用要求 還要考慮未來的業務發展 同時必須有利於擴展或增加應用系統的處理功能
lishixin/Article/program/SQL/201311/16498