Ⅰ 空間數據無縫鑲嵌技術
空間地理數據的表示主要有柵格和矢量兩種不同的形式。柵格形式是將地理表層空間劃分為一系列網格,空間目標由這些網格的位置及其量化值來表示; 矢量形式則是將地理空間的一切事物、概念進行抽象,形成點、線、面,再由點、線、面來組成各類空間目標。由於數據獲取、數據表達、地圖投影等方面的原因,在計算機世界裡,地理信息往往被表示成不連續的子空間,為了更好地模擬客觀世界,人們需要處理成連續無縫的數據( 朱欣焰等,2002) 。
塔里木河流域地域廣闊,地理坐標介於東經 73°10' ~94°05',北緯 34°55' ~43°08'之間,東西跨越了 4 個六度帶,而通過數據採集系統所採集的各種基礎圖件都是分幅的,採用平面直角坐標系統。如果將這些數據直接進行入庫將在跨帶處產生縫隙,不能形成邏輯意義上完整的河流表現,也無法完成基於整個流域的生態環境分析。因此,必須採用相應的數據處理與建庫技術,實現塔河整個流域數據的無縫集成管理,使之形成統一的整體。
空間數據的無縫管理是一個建立在用戶與空間資料庫介面基礎上的概念,它是空間資料庫中空間數據集成的結果,即在用戶的介面上實現對空間數據按空間、時間和專題的透明訪問。空間透明或空間無縫是指對空間數據集按空間三維進行集成,形成地理空間上無縫連接的整體集成信息。時間透明是指對空間資料庫中的數據按時間維進行集成,形成在時間上連續的整體集成信息。專題透明是指對空間資料庫中的數據按屬性維進行集成,形成在某一屬性上連續的整體集成信息。空間數據無縫鑲嵌技術主要應用在大范圍、跨帶區域數據的管理上。例如,在進行塔里木河整個流域范圍內的水資源分析時,需要調用出整個流域的水系數據。每一條水系均要求有完整而統一的信息表示,而這些數據在採集時可能是分區域、分專題採集的,用戶在分析時要求系統能夠自動進行數據的鑲嵌處理,形成無縫隙、統一坐標體系的數據。
要實現空間數據的無縫鑲嵌,就需要從基礎數據的獲取開始,進行精心設計和組織,分離出數據物理層和數據邏輯層,在統一的空間框架之下,將物理層歸化到邏輯層,以消除邏輯層的縫隙,從而實現用戶級的邏輯無縫空間資料庫。
本系統通過採集數據標準定義、空間數據框架設計等方面來實現空間無縫資料庫的構建。
對採集的數據從投影、坐標系統、比例尺、數據精度等方面進行規范。對不同投影和坐標系統的空間數據在投影和坐標系統上統一採用相同的標准,例如,對矢量數據要求轉換為無投影的地理坐標表示,柵格數據統一採用兩套坐標表示,即平面直角坐標和地理坐標,以滿足不同用戶的管理需求和精度要求;規定了採用經緯度表示時數據的精度和表示方式。
建立無縫空間數據的關鍵,在於在合適的空間信息框架上實現多源異構空間數據的融合。框架是基礎,融合是手段。空間信息框架的選擇,需要滿足多尺度和大區域表示兩個方面。大區域的表示,系統採用大地線尺度空間表示,根據確定的空間框架在綜合資料庫中按對象建立了各種數據的存儲表空間。多源異構空間數據的融合,可通過各類數據的元數據來實現。因此,系統也建立了相應的元資料庫,並具有動態維護功能。
Ⅱ 資料庫概念模型
一、航空物探資料庫定位
資料庫是信息系統的基礎和核心,把大量的數據信息按一定的模型組織起來存儲在資料庫中,提供數據維護、數據檢索等功能,使信息系統能方便、及時、准確地從資料庫中獲得所需的信息。因此,資料庫結構設計是信息系統開發的重中之重。
經分析航空物探數據具有空間性、海量性、多源性和多尺度的特點,這說明航空物探數據具有典型的空間數據的特點,可以採用空間數據管理方式進行管理。
ESRI公司的Geodatabase(空間資料庫)是採用標准關系資料庫技術來表現地理信息的面向對象的高級GIS數據模型,是建立在DBMS之上的統一的、智能化的空間數據模型,是以一組相關聯的表來表達地理要素之間關系、有效性規則和值域。對於多源、海量的航空物探數據,Geodatabase能在一個統一的模型框架下很好地解決多源數據一體化存儲的問題,和採用標准關系資料庫技術來表現海量航空物探數據的地理信息特性。Geodatabase引入了地理空間實體的行為、有效性規則和關系,在處理Geodatabase中對象時,對象的基本行為和必須滿足的規則無需通過程序編碼實現,只需根據需要擴展其有效性規則(Geodatabase面向對象的智能化特性),即可支持航空物探數據模型擴展的需要。
因此,航空物探資料庫是空間資料庫,在航空物探資料庫建模過程中,以空間數據建模為主導,統領屬性數據建模。
二、統一空間坐標框架
為了用數學語言描述地球,人們用規則的幾何形體來替代地球表面,從地球自然表面、大地水準面、旋轉橢球面直到用簡單數學函數表達的參考橢球體,以便通過地圖投影將三維曲面轉化成二維平面。由於地球表面不同地區的地形起伏差異很大,採用單一橢球體勢必會造成某地區的誤差小而其他地區誤差很大的結果。因此,在20世紀初不同國家或地區先後採用了逼近本國或本地區地球表面的橢球體,如中國的克拉索夫斯基橢球體,美國的海福特橢球體、英國的克拉克橢球體等。這又造成了目前世界各國的地理信息空間坐標框架不統一,空間數據信息難以共享被動局面。為此,在實現數字地球計劃中,必須規范和統一世界上不同國家和地區的地球參考橢球體。
在小區域表達地球表面時,通常採用平面的方式,即投影坐標系統。如何科學地選擇投影坐標,一般要根據具體的地學應用、地理區域和范圍、比例尺條件等因素來確定,不同的國家有著不同的規定。
通過對航空物探數據的坐標系統進行分析可知,航空物探圖件的坐標框架與國家對基本比例尺制圖的規定相一致,即小比例尺編圖採用Lambert雙標准緯線等角圓錐投影;中比例尺採用Gauss 6°帶的分帶投影;大比例尺採用Gauss 3°帶的分帶投影(表2-1);對於低緯度的海上作業區通常採用Mecator等角圓柱投影。地球橢球體分別採用1954北京坐標系的Krassovsky橢球參數、WGS84橢球參數和未來的國家2000坐標系的橢球參數。
表2-1 航空物探地理坐標數據的投影方式
傳統的航空物探數據是按測區管理的,根據測區的測量比例尺來確定相應的坐標框架;因此,勘探目標不同的測區測量比例尺是不一致的,地坐標框架也不同。航空物探資料庫要將不同測區、不同比例尺、不同坐標框架的數據集中管理和可視表達,若沒有統一的空間坐標框架,就不可能正確地表達全國航空物探數據。所以,面對如此復雜的多坐標框架的航空物探數據,如何確定科學合理的空間坐標框架,將全國的航空物探數據整合到統一的空間參考框架下,實現數據的統一存儲和數據間無縫拼接,是航空物探資料庫建設的關鍵所在,是組織和管理多維、多格式、大跨度、跨平台的航空物探數據和多目標數字制圖的數學基礎。
統一的空間坐標框架必須支持我國領土覆蓋的海域和陸域航空物探數據的存儲和表達。我國領土東西跨度達70°,南北達55°,顯然採用任何投影坐標系都是不合適的。Gauss 6°投影適合6°帶內空間數據表達,若全國航物探數據採用6°分帶表達,在高緯度地區會造成6°帶間數據裂縫問題;Lambert投影可滿足數據的無縫表達,但對大比例尺數據變形較大,無法滿足數據制圖的精度要求;Mecator投影也可滿足數據的無縫表達,低緯度地區也能滿足大比例尺數據制圖的精度要求,但在我國中高緯度區存在著嚴重變形問題。所以,航空物探數據模型採用地理坐標(無投影,圖2-1)格式存放,可根據實際應用的需要將航空物探數據變換到任何方式的投影坐標系統。
航空物探資料庫模型採用Beijing_1954地理坐標系,相關參數如下:
角度單位:°(0.017453292519943299rad)
零經線:格林尼治(0.000000000000000000)
基準:D_Beijing_1954
橢球:Krasovsky_1940
長軸半徑:6378245.000 m
短軸半徑:6356863.019 m
建立統一坐標框架是空間資料庫建設的一項基礎性工作,採用Beijing_1954 地理坐標系作為航空物探資料庫統一空間坐標框架具有以下優點。
圖2-1 統一空間坐標框架示意圖
(一)無縫空間數據存儲
統一空間坐標框架解決了復雜的航空物探數據的坐標系統、投影、比例尺等不統一的問題,實現同一性質的物探數據在同一個主題中進行管理。如全國的航磁異常數據可放在一個圖層上進行管理。
(二)適合多尺度表達
按測區管理的多尺度、多框架的航空物探數據是處於一個相對坐標系統中,各個測區間相對位置關系會發生錯位。採用統一的Beijing_1954地理坐標框架,恢復了各測區間正確的位置關系,實現不同尺度數據的集成和正確表達,易於多源異構空間數據的融合。
(三)大區域數據集成
我國海陸面積近1300×104km2,地域跨度較大。在進行小比例尺的航空物探編圖時,需要選用與之相適應的投影坐標;在陸地和海域進行大比例尺制圖時,同樣需要選用合適投影系統。航空物探制圖的實踐也證明了這一點。1995 年6 月由中國、加拿大、美國、愛爾蘭和俄羅斯等國科學家共同編制的1∶1000萬歐亞東北地區磁異常與大地構造圖,採用橫軸Mercator投影。中心編制的1∶500 萬全國航磁圖採用Lambert投影。2008 年,由中國和吉爾吉斯斯坦科學家編制的1∶100萬中吉天山金屬礦產成礦規律圖,採用Lambert投影,將兩個國家不同時期、不同尺度的數據進行了有效的集成,是地質、地球物理等綜合應用的典範。
隨著航空物探數據應用領域的不斷擴展,陸地、海域,甚至於洲際和全球航空物探數據的整體表達都需對坐標投影提出要求。採用統一的地理坐標框架的航空物探數據非常容易變換到指定的投影坐標框架,滿足多樣化的制圖要求。
三、要素類和對象類的劃分
Geodatabase空間資料庫模型結構(圖2-2)分為空間資料庫、要素數據集(Feature dataset)、要素類(Feature classes)、要素(Feature)4個層次。為了建立航空物探Geodatabase空間數據模型,我們依據Geodatabase模型關於要素類和對象類的劃分原則,結合相關的國家標准和地球物理行業標准,制定了《航空物探數據要素類和對象類劃分標准》,對航空物探數據進行數據分類。
圖2-2 空間資料庫模型結構
1)按照航空物探數據的空間特徵,將其劃分為5個要素數據集,即勘查項目概況要素數據集、基礎數據要素數據集、異常要素數據集、解釋要素數據集和評價要素數據集。
2)根據航空物探測量方法、數據處理過程以及推斷解釋方法和過程,進一步把航空物探數據劃分為若干要素類和對象類,定義了要素類的主題特徵和表達方式,確定子類和屬性域;定義對象類的結構和聯接欄位,建立了關系類。
3)定義要素類的內容、欄位名稱和存儲結構。在航空物探數據採集過程中,不同類型的數據采樣率不同,坐標數據采樣2次/s,重力場數據采樣2次/s,磁場數據采樣10次/s,這就造成了場值數據與坐標數據無法一一對應問題。若按場值數據采樣率內插坐標數據,將導致數據量成倍增長;若按坐標數據采樣率抽稀場值數據,將降低航空物探測量對地質體的分辨能力,影響測量效果。在綜合分析航空物探數據應用基礎上,提出了採用要素數據與屬性數據分置的方式,將測線坐標數據與地球物理場數據分離,分別建立獨立共享的航跡線數據要素類模型,磁場、重力場等數據對象類模型(圖2-3),很好地解決了航空物探數據的存儲問題。
圖2-3 要素數據與屬性數據分置示意圖
採用要素數據與屬性數據分置方式,不僅是基於航空物探數據屬性數據的多源性、不同采樣頻率等特點的考慮,還考慮到數據的綜合查詢和檢索的速度,特別是通過ArcSDE訪問空間資料庫的效率的問題。再者,對於大部分用戶來說,需求是屬性數據的綜合應用,因此在資料庫建模過程中,將屬性數據採用對象類的方式進行管理,不但提高了空間數據的操作能力,同時在ArcSDE的配置上採用直接訪問資料庫(對象類)方式,並且加快了數據查詢和統計的速度。
四、資料庫概念模型
用戶需求是資料庫建設的約束條件之一。航空物探數據的空間特性決定航空物探資料庫必須是空間資料庫,採用資料庫管理數據,利用GIS技術提供可視化服務,這是各個層次用戶的一致要求。因此,我們從現實世界出發,對航空物探數據的多源性、多尺度和不同采樣等問題進行了描述,提出了解決方案。此方案是不依賴於任何具體的硬體環境和資料庫管理系統(DBMS),建立了客觀反映現實世界的航空物探資料庫概念模型,把用戶需要管理的信息統一到整體概念結構中,表達了用戶需要。
在全面分析航空物探業務流程和數據流程,以及航空物探數據特性的基礎上,按照《航空物探數據要素類和對象類劃分標准》,以及空間實體點、線、面要素特徵的基本原則,對航空物探資料庫所涉及的實體進行歸類,劃分成12個主題。根據空間數據分主題表達的特點和航空物探空間數據坐標框架的定義,確定航空物探資料庫空間數據概念模型,明確各個主題的用途、數據來源、表達方式、空間參考、比例尺和精度等內容,按照ArcGIS定義空間資料庫的數據分層表達方式(圖2-4),完成航空物探資料庫概念模型設計(圖2-5)。
圖2-4 航空物探資料庫空間數據分層模型
圖2-5 航空物探資料庫空間數據概念模型
Ⅲ 什麼是邦聯資料庫啊
邦聯資料庫(Federated DataBase)的概念有別於分布式資料庫和數據倉庫。分布式資料庫和數據倉庫一般是指同種同類數據的組織管理。這里的邦聯資料庫除了包含分布式的概念以外,它還指異構資料庫和空間數據的多比例尺資料庫。異構數據有兩個概念,一個是同一種類型的數據,使用不同資料庫管理系統管理,如矢量圖形數據或屬性數據,不同的部門採用不同的系統管理,它們的數據類型相同,只是數據的物理存貯結構不同,形成異構數據;另一個概念是數據的類型也不相同,如DEM數據和影像數據,它們與矢量圖形數據的類型不同。
Ⅳ 無縫空間資料庫設計與構建
(一)問題的提出
塔里木河流域生態環境動態監測系統的運轉需要大量的空間數據支持。在空間資料庫構建前期,採集了塔里木河流域的各尺度基礎地形圖、生態環境專題圖以及遙感影像資料等圖形、圖像數據,這些數據都是以分幅的成果進行收集和提交的,需要進入綜合資料庫中,以實現數據的共享。
我國國土版圖大,而且大部分位於中、低緯度地區,因此我國現行的大於1∶50萬比例尺的各種地形圖都採用高斯-克里格投影即橫切橢圓柱正形投影。經過高斯-克里格投影後的平面直角坐標系是以相切的經線(中央經線)的投影為X軸,以赤道的投影為Y軸。高斯-克里格投影具有以下特點:
(1)中央經線投影為直線,而且是投影的對稱軸(也是投影平面的X軸);
(2)高斯-克里格投影是等角投影,投影後具有角度不變、伸長固定的特點(即同一地點各個方向的長度比不變),滿足等角的要求;
(3)中央經線上長度沒有變形,離中央經線越遠變形越大。為了限制投影變形,必須進行分帶投影。所謂分帶就是按照一定的經度差,將橢球體按經線劃分成若干個狹窄的區域,各個區域分別按高斯投影的規律進行投影,每一個區域就稱為一個投影帶。在每一個投影帶內,位於各帶中央的子午線就是軸子午線,各帶相鄰的子午線叫邊緣子午線。分帶之後,各帶均有自己的坐標軸和原點,形成各自獨立但又相同的坐標系統。根據國際通用方法,我國投影分帶主要有兩種:在我國1∶2.5萬到1∶50萬地形圖均採用6°分帶投影,1∶1萬及更大比例尺的地形圖採用3°分帶投影,以保證投影變形誤差滿足地圖的精度要求(王密等,2001)。
本系統所採集到的數據產品的空間參考大都是以高斯投影後的平面坐標為基礎的分幅數據。塔里木河流域地域廣闊,地理坐標介於東經73°10'~94°05',北緯34°55'~43°08'之間,以1∶10萬基礎地形圖數據為例,按照高斯投影後的坐標分成了13°、14°、15°、16°四個6°高斯投影帶,每個帶的坐標都是以本帶的坐標原點為參考點,空間基準不統一,如果將這些數據直接進行入庫,將在跨帶處產生縫隙,不能形成邏輯意義上完整的河流表現,也無法完成基於整個流域的生態環境分析,因此,必須採用相應的數據處理與建庫技術,實現塔河整個流域數據的無縫集成管理,使之形成統一的整體。從基礎數據的獲取開始,進行精心設計和組織,分離出數據物理層和數據邏輯層,在統一的空間框架之下,將物理層歸化到邏輯層,以消除邏輯層的縫隙,從而實現用戶級的邏輯無縫空間資料庫。
(二)無縫資料庫
隨著GIS數據發布與共享技術的發展,無縫空間資料庫逐漸分化出兩個層次的含義:一是GIS系統內部的數據無縫,一是不同GIS實現互操作時的數據無縫。前者是通常意義的無縫,後者主要通過數據標准化與操作標准化來實現。無縫空間資料庫的最終含義體現在邏輯無縫資料庫。無論是多源還是單源、同構還是異構,跨越數據層呈現在用戶面前的GIS空間資料庫必須是邏輯無縫的。
空間數據的無縫連接是一個建立在用戶與資料庫介面基礎上的概念,意味著GIS管理的數據不再是單一、被硬性割裂的圖幅,而是范圍更加廣闊的區域,這個區域小可到一個城市,大可到一個國家甚至整個地球(王卉、王家耀,2004)。由於硬軟體條件的限制,計算機系統尚不能同時處理海量的空間數據,因此從具體技術的實施上,可採用將空間數據分塊存儲於資料庫中,資料庫提供相應的圖塊拼接信息。物理上空間數據是有縫隙的,但空間資料庫提供圖塊之間的接圖信息及相應的拼接訪問手段,保障了空間數據在使用上的空間連貫性,即數據在邏輯使用上是無縫的(王密等,2001)。
(三)縫隙產生原因
在現實世界中,地理空間是由地貌、地物組成的連續的表層空間,地理信息則是有關地理空間的一切有用的知識。在計算機世界中,地理信息通過抽象、建模形成數字化的表示形式,通過空間資料庫來進行表達、存儲和管理(朱欣焰等,2002)。空間地理數據縫隙是在數據的獲取、表示與處理過程中產生的數據不連續現象。
1.數據源
由於歷史和現實的原因,地圖是絕大多數GIS系統直接的數據源。地圖是地球三維橢球面的二維平面表達,本身對真實世界有扭曲;地圖是對連續空間的割裂表達,實體被分割到不同的地圖空間中去;高斯投影是基本比例尺地形圖經常選用的投影,也是絕大多數GIS系統的數學基礎,由於分帶的原因,使得投影後帶有高斯投影平面坐標的地圖無法實現無縫拼接。
2.數據表達與組織方式
空間地理幾何數據的表示主要有柵格和矢量兩種不同的形式。柵格形式是將地理表層空間劃分為一系列網格,空間目標由這些網格的位置及其量化值來表示,這些網格本身就是連續空間信息的離散表達。矢量形式則是將地理空間的一切事物、概念進行抽象,形成點、線、面,由點、線、面來組成各類空間目標。按點、線、面來分類和按分層的思想來組織空間數據,也割裂了實體之間內在的聯系。
在空間資料庫組織與管理上,目前主要有文件型、文件與關系資料庫混合型、全關系型以及對象關系型。傳統的文件型空間資料庫、文件與關系混合型空間資料庫,按圖幅或一定的區域范圍以文件的形式來組織與存儲空間幾何數據,不同的圖幅或區域之間存在縫隙。在文件與關系資料庫混合型的空間資料庫中,空間幾何數據貯存在文件中,屬性數據貯存在關系資料庫中,屬性數據和幾何數據之間通過內部標識來鏈接,空間幾何數據和屬性數據之間存在縫隙。
3.數據處理
數據處理的過程中也會引入縫隙,產生這種縫隙的原因有:①數據處理過程的順序不一致;②選擇的處理參數不一致;③數字化的精度不一致。
4.多源異構數據共享
數據屬性(數學基礎、比例尺、用途、時間、精度等)的不同,導致了數據的差異,這些差異是多層次和多方面的,它們集中體現了數據的異構。數據異構和多源往往是一體的,多源異構是系統內部和系統之間數據裂隙的主要原因(劉仁峰,2005)。
(四)數據縫隙類別和表現
數據縫隙基本可以分為物理縫隙和邏輯縫隙兩類。物理縫隙是地理空間的分離存儲,本來連續的實體空間被分離到不同的存儲空間和存儲單元中去,例如空間數據的分幅、分層存儲。邏輯縫隙是指邏輯上本身連續的信息不能以邏輯連續的方式呈現,例如跨越多幅圖的一條河流,在圖幅內查詢河流屬性(如長度)時只能獲取其在本圖幅內的相關信息而不是實體整體的信息。顯然,由於空間信息本身的海量特性,要完全意義上的實現物理無縫的空間資料庫目前還是不可能的,也沒有必要。GIS用戶關心的不是空間數據是物理無縫,因為GIS呈現給用戶的是數據邏輯層,只需要保證用戶看到的數據是邏輯無縫的。
物理有縫的資料庫向邏輯無縫資料庫的轉換是無縫空間資料庫構建的重要一環。
(五)無縫鑲嵌技術
數據的無縫連接包含以下幾個問題:投影、坐標系統、比例尺、數據精度等。對不同投影和坐標系統的空間數據在投影和坐標系統上統一採用相同的標准,當空間數據具有多尺度時,無縫連接尋找數據集之間連續的表達方式,它表現為不同尺度數據之間的集成。建立無縫空間數據的關鍵在於在合適的空間信息框架上實現多源異構空間數據的融合,框架是基礎,融合是手段。
1.合適的空間框架選擇
(1)適合多尺度信息表達。地球是一個開放的非常復雜的巨大系統,隨著觀察視角的變化,我們希望空間地理信息比例尺也自動增減。由於地圖的自動綜合受諸多因素的影響,目前比較可行的是採用多尺度空間數據支持來達到目的。所謂多尺度就是指系統內包含幾種不同比例尺(或解析度)的空間數據,其目的是為了適度地反映系統所關心區域的空間地理信息,以避免地物信息的過粗、失真或地物信息的負載量過大而無法使用。無縫空間資料庫也應該符合多尺度空間資料庫要求。
(2)適合大區域表達。各種自然和人文現象的空間分布,有其內在的原因和規律,這些原因和規律的獲得,往往需要研究大區域多因素的綜合作用;另一方面,對於全球范圍的環境變異和氣候變遷的研究需要基於數字地球的空間框架。大區域的表達,還涉及空間尺度問題,不應繼續採用歐氏空間尺度,而應該採用大地線尺度空間。
2.多源異構空間數據的融合
(1)GIS的迅速發展和廣泛應用導致了多源空間數據的產生。如何實現不同的GIS軟體共享並操作不同來源的地理數據,即GIS多源空間數據的集成,成為GIS發展的關鍵。目前GIS多源空間數據的集成主要朝著三個方向發展,一是通過建立統一的數據交換標准來約束並規范已有的各類地理信息系統,採用數據交換標准來進行空間數據交換;二是建立開放式地理數據互操作規范,進行地理信息系統互操作;三是GIS數據中間件技術。
(2)統一數據交換標准存在很多實現上的困難。互操作是一個重要發展趨勢,是在異構分布式資料庫中實現信息共享的途徑,它需要將GIS技術、分布處理技術、面向對象方法、資料庫設計及實時信息獲取方法更有效地結合起來。所謂GIS數據中間件技術是指能夠嵌入各類GIS系統的軟體,GIS開發者通過中間件開發商提供的介面,訪問和操作特定的數據源。
(3)在多源異構數據集成技術尚未成熟的時候,人們再次把目光投向數據本身,如果可以提供關於數據的詳細描述,是否可以提高融合數據的能力呢?於是,對於「關於數據的數據」的研究,即對於元數據的研究便普遍展開。從DublinCore到CSDGM與OGC,都提出了相應的元數據標准體系,有了完整而完善的元數據描述,必將提高數據的效能,從而最終促進多源異構資料庫向無縫空間資料庫的歸化。
為實現塔河整個流域數據的無縫集成管理,使之形成統一的整體,設計從縫隙產生的地方開始,分離出數據物理層和數據邏輯層,在統一的空間框架之下,將物理層歸化到邏輯層,以消除邏輯層的縫隙,從而實現用戶級的邏輯無縫空間資料庫;同時制定統一的數據提交規范,如所有矢量數據在入庫前統一採用經緯度坐標,柵格數據統一提供兩套數據,即高斯坐標和經緯度坐標,以滿足不同用戶的管理需求和精度要求。
Ⅳ 地理信息系統功能的空間查詢與分析
對地理空間的查詢與分析功能,是GIS得以廣泛應用的重要原因之一。通過GIS提供的空間數據查詢與分析功能,用戶可以從已知的地理數據中得出隱含的重要結論,這對於許多應用領域(例如商業選址、搶險救災等)是至關重要的。 空間查詢是地理信息系統以及許多其他自動化地理數據處理系統應具備的最基本的分析功能,即可把滿足一定條件的空間對象查出,並將其按空間位置繪出,同時列出它們的相關屬性等。空間查詢是支持綜合圖形與文字的多種查詢的主要方法,它支持由圖查圖、由圖查文和由文查圖,並給出新圖和有關數據。
GIS通常使用空間數據引擎存儲和查詢空間資料庫。空間數據引擎在用戶和異構空間資料庫的數據之間提供一個開放的介面,它是一種處於應用程序和數據管理系統之間的中間件技術,空間數據引擎是開放且基於標準的,這些規范和標准包括OGC的Sample Feature sql Specification、IOS/IEC的SQL3以及SQL多媒體與應用程序包(SQL/MM)等。市場上主要的空間數據引擎產品都是與上述規范高度兼容的。 空間模型分析是在地理信息系統支持下,分析和解決現實世界中與空間相關的問題,它是地理信息系統應用深化的重要標志。空間分析是地理信息系統的核心功能,也是地理信息系統與其他計算機系統的根本區別,它以空間數據和屬性數據為基礎,回答真實地理客觀世界的有關問題。地理信息系統的空間分析可分為:拓撲分析、方位分析、度量分析、混合分析、柵格分析和地形分析等。
Ⅵ 大數據資料庫有哪些
問題一:大數據技術有哪些 非常多的,問答不能發link,不然我給你link了。有譬如Hadoop等開源大數據項目的,編程語言的,以下就大數據底層技術說下。
簡單以永洪科技的技術說下,有四方面,其實也代表了部分通用大數據底層技術:
Z-Suite具有高性能的大數據分析能力,她完全摒棄了向上升級(Scale-Up),全面支持橫向擴展(Scale-Out)。Z-Suite主要通過以下核心技術來支撐PB級的大數據:
跨粒度計算(In-Databaseputing)
Z-Suite支持各種常見的匯總,還支持幾乎全部的專業統計函數。得益於跨粒度計算技術,Z-Suite數據分析引擎將找尋出最優化的計算方案,繼而把所有開銷較大的、昂貴的計算都移動到數據存儲的地方直接計算,我們稱之為庫內計算(In-Database)。這一技術大大減少了數據移動,降低了通訊負擔,保證了高性能數據分析。
並行計算(MPP puting)
Z-Suite是基於MPP架構的商業智能平台,她能夠把計算分布到多個計算節點,再在指定節點將計算結果匯總輸出。Z-Suite能夠充分利用各種計算和存儲資源,不管是伺服器還是普通的PC,她對網路條件也沒有嚴苛的要求。作為橫向擴展的大數據平台,Z-Suite能夠充分發揮各個節點的計算能力,輕松實現針對TB/PB級數據分析的秒級響應。
列存儲 (Column-Based)
Z-Suite是列存儲的。基於列存儲的數據集市,不讀取無關數據,能降低讀寫開銷,同時提高I/O 的效率,從而大大提高查詢性能。另外,列存儲能夠更好地壓縮數據,一般壓縮比在5 -10倍之間,這樣一來,數據佔有空間降低到傳統存儲的1/5到1/10 。良好的數據壓縮技術,節省了存儲設備和內存的開銷,卻大大了提升計算性能。
內存計算
得益於列存儲技術和並行計算技術,Z-Suite能夠大大壓縮數據,並同時利用多個節點的計算能力和內存容量。一般地,內存訪問速度比磁碟訪問速度要快幾百倍甚至上千倍。通過內存計算,CPU直接從內存而非磁碟上讀取數據並對數據進行計算。內存計算是對傳統數據處理方式的一種加速,是實現大數據分析的關鍵應用技術。
問題二:大數據使用的資料庫是什麼資料庫 ORACLE、DB2、SQL SERVER都可以,關鍵不是選什麼資料庫,而是資料庫如何優化! 需要看你日常如何操作,以查詢為主或是以存儲為主或2者,還要看你的數據結構,都要因地制宜的去優化!所以不是一句話說的清的!
問題三:什麼是大數據和大數據平台 大數據技術是指從各種各樣類型的數據中,快速獲得有價值信息的能力。適用於大數據的技術,包括大規模並行處理(MPP)資料庫,數據挖掘電網,分布式文件系統,分布式資料庫,雲計算平台,互聯網,和可擴展的存儲系統。
大數據平台是為了計算,現今社會所產生的越來越大的數據量。以存儲、運算、展現作為目的的平台。
問題四:常用大型資料庫有哪些 FOXBASE
MYSQL
這倆可算不上大型資料庫管理系統
PB 是資料庫應用程序開發用的ide,根本就不是資料庫管理系統
Foxbase是dos時代的產品了,進入windows時代改叫foxpro,屬於桌面單機級別的小型資料庫系統,mysql是個中輕量級的,但是開源,大量使用於小型網站,真正重量級的是Oracle和DB2,銀行之類的關鍵行業用的多是這兩個,微軟的MS SQLServer相對DB2和Oracle規模小一些,多見於中小型企業單位使用,Sybase可以說是日薄西山,不行了
問題五:幾大資料庫的區別 最商業的是ORACLE,做的最專業,然後是微軟的SQL server,做的也很好,當然還有DB2等做得也不錯,這些都是大型的資料庫,,,如果掌握的全面的話,可以保證數據的安全. 然後就是些小的資料庫access,mysql等,適合於中小企業的資料庫100萬數據一下的數據.如有幫助請採納,謝!
問題六:全球最大的資料庫是什麼 應該是Oracle,第一,Oracle為商業界所廣泛採用。因為它規范、嚴謹而且服務到位,且安全性非常高。第二,如果你學習使用Oracle不是商用,也可以免費使用。這就為它的廣泛傳播奠定了在技術人員中的基礎。第三,Linux/Unix系統常常作為伺服器,伺服器對Oracle的使用簡直可以說極其多啊。建議樓梗多學習下這個強大的資料庫
問題七:什麼是大數據? 大數據(big data),或稱巨量資料,指的是所涉及的資料量規模巨大到無法通過目前主流軟體工具,在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的的資訊。(在維克托・邁爾-舍恩伯格及肯尼斯・庫克耶編寫的《大數據時代》中大數據指不用隨機分析法(抽樣調查)這樣的捷徑,而採用所有數據的方法[2])大數據的4V特點:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)。
說起大數據,就要說到商業智能:
商業智能(Business Intelligence,簡稱:BI),又稱商業智慧或商務智能,指用現代數據倉庫技術、線上分析處理技術、數據挖掘和數據展現技術進行數據分析以實現商業價值。
商業智能作為一個工具,是用來處理企業中現有數據,並將其轉換成知識、分析和結論,輔助業務或者決策者做出正確且明智的決定。是幫助企業更好地利用數據提高決策質量的技術,包含了從數據倉庫到分析型系統等。
商務智能的產生發展
商業智能的概念經由Howard Dresner(1989年)的通俗化而被人們廣泛了解。當時將商業智能定義為一類由數據倉庫(或數據集市)、查詢報表、數據分析、數據挖掘、數據備份和恢復等部分組成的、以幫助企業決策為目的技術及其應用。
商務智能是20世紀90年代末首先在國外企業界出現的一個術語,其代表為提高企業運營性能而採用的一系列方法、技術和軟體。它把先進的信息技術應用到整個企業,不僅為企業提供信息獲取能力,而且通過對信息的開發,將其轉變為企業的競爭優勢,也有人稱之為混沌世界中的智能。因此,越來越多的企業提出他們對BI的需求,把BI作為一種幫助企業達到經營目標的一種有效手段。
目前,商業智能通常被理解為將企業中現有的數據轉化為知識,幫助企業做出明智的業務經營決策的工具。這里所談的數據包括來自企業業務系統的訂單、庫存、交易賬目、客戶和供應商資料及來自企業所處行業和競爭對手的數據,以及來自企業所處的其他外部環境中的各種數據。而商業智能能夠輔助的業務經營決策既可以是作業層的,也可以是管理層和策略層的決策。
為了將數據轉化為知識,需要利用數據倉庫、線上分析處理(OLAP)工具和數據挖掘等技術。因此,從技術層面上講,商業智能不是什麼新技術,它只是ETL、數據倉庫、OLAP、數據挖掘、數據展現等技術的綜合運用。
把商業智能看成是一種解決方案應該比較恰當。商業智能的關鍵是從許多來自不同的企業運作系統的數據中提取出有用的數據並進行清理,以保證數據的正確性,然後經過抽取(Extraction)、轉換(Transformation)和裝載(Load),即ETL過程,合並到一個企業級的數據倉庫里,從而得到企業數據的一個全局視圖,在此基礎上利用合適的查詢和分析工具、數據挖掘工具、OLAP工具等對其進行分析和處理(這時信息變為輔助決策的知識),最後將知識呈現給管理者,為管理者的決策過程提供支持。
企業導入BI的優點
1.隨機查詢動態報表
2.掌握指標管理
3.隨時線上分析處理
4.視覺化之企業儀表版
5.協助預測規劃
導入BI的目的
1.促進企業決策流程(Facilitate the Business Decision-Making Process):BIS增進企業的資訊整合與資訊分析的能力,匯總公司內、外部的資料,整合成有效的決策資訊,讓企業經理人大幅增進決策效率與改善決策品質。
......>>
問題八:資料庫有哪幾種? 常用的資料庫:oracle、sqlserver、mysql、access、sybase 2、特點。 -oracle: 1.資料庫安全性很高,很適合做大型資料庫。支持多種系統平台(HPUX、SUNOS、OSF/1、VMS、 WINDOWS、WINDOWS/NT、OS/2)。 2.支持客戶機/伺服器體系結構及混合的體系結構(集中式、分布式、 客戶機/伺服器)。 -sqlserver: 1.真正的客戶機/伺服器體系結構。 2.圖形化用戶界面,使系統管理和資料庫管理更加直觀、簡單。 3.具有很好的伸縮性,可跨越從運行Windows 95/98的膝上型電腦到運行Windows 2000的大型多處理器等多種平台使用。 -mysql: MySQL是一個開放源碼的小型關系型資料庫管理系統,開發者為瑞典MySQL AB公司,92HeZu網免費贈送MySQL。目前MySQL被廣泛地應用在Internet上的中小型網站中。提供由於其體積小、速度快、總體擁有成本低,尤其是開放源碼這一特點,許多中小型網站為了降低網站總體擁有成本而選擇了MySQL作為網站資料庫。 -access Access是一種桌面資料庫,只適合數據量少的應用,在處理少量數據和單機訪問的資料庫時是很好的,效率也很高。 但是它的同時訪問客戶端不能多於4個。 -
問題九:什麼是大數據 大數據是一個體量特別大,數據類別特別大的數據集,並且這樣的數據集無法用傳統資料庫工具對其內容進行抓取、管理和處理。 大數據首先是指數據體量(volumes)?大,指代大型數據集,一般在10TB?規模左右,但在實際應用中,很多企業用戶把多個數據集放在一起,已經形成了PB級的數據量;其次是指數據類別(variety)大,數據來自多種數據源,數據種類和格式日漸豐富,已沖破了以前所限定的結構化數據范疇,囊括了半結構化和非結構化數據。接著是數據處理速度(Velocity)快,在數據量非常龐大的情況下,也能夠做到數據的實時處理。最後一個特點是指數據真實性(Veracity)高,隨著社交數據、企業內容、交易與應用數據等新數據源的興趣,傳統數據源的局限被打破,企業愈發需要有效的信息之力以確保其真實性及安全性。
數據採集:ETL工具負責將分布的、異構數據源中的數據如關系數據、平面數據文件等抽取到臨時中間層後進行清洗、轉換、集成,最後載入到數據倉庫或數據集市中,成為聯機分析處理、數據挖掘的基礎。
數據存取:關系資料庫、NOSQL、SQL等。
基礎架構:雲存儲、分布式文件存儲等。
數據處理:自然語言處理(NLP,NaturalLanguageProcessing)是研究人與計算機交互的語言問題的一門學科。處理自然語言的關鍵是要讓計算機理解自然語言,所以自然語言處理又叫做自然語言理解(NLU,NaturalLanguage Understanding),也稱為計算語言學(putational Linguistics。一方面它是語言信息處理的一個分支,另一方面它是人工智慧(AI, Artificial Intelligence)的核心課題之一。
統計分析:假設檢驗、顯著性檢驗、差異分析、相關分析、T檢驗、方差分析、卡方分析、偏相關分析、距離分析、回歸分析、簡單回歸分析、多元回歸分析、逐步回歸、回歸預測與殘差分析、嶺回歸、logistic回歸分析、曲線估計、因子分析、聚類分析、主成分分析、因子分析、快速聚類法與聚類法、判別分析、對應分析、多元對應分析(最優尺度分析)、bootstrap技術等等。
數據挖掘:分類 (Classification)、估計(Estimation)、預測(Prediction)、相關性分組或關聯規則(Affinity grouping or association rules)、聚類(Clustering)、描述和可視化、Description and Visualization)、復雜數據類型挖掘(Text, Web ,圖形圖像,視頻,音頻等)
模型預測:預測模型、機器學習、建模模擬。
結果呈現:雲計算、標簽雲、關系圖等。
要理解大數據這一概念,首先要從大入手,大是指數據規模,大數據一般指在10TB(1TB=1024GB)規模以上的數據量。大數據同過去的海量數據有所區別,其基本特徵可以用4個V來總結(Vol-ume、Variety、Value和Veloc-ity),即體量大、多樣性、價值密度低、速度快。
第一,數據體量巨大。從TB級別,躍升到PB級別。
第二,數據類型繁多,如前文提到的網路日誌、視頻、圖片、地理位置信息,等等。
第三,價值密度低。以視頻為例,連續不間斷監控過程中,可能有用的數據僅僅有一兩秒。
第四,處理速度快。1秒定律。最後這一點也是和傳統的......>>
問題十:國內真正的大數據分析產品有哪些 國內的大數據公司還是做前端可視化展現的偏多,BAT算是真正做了大數據的,行業有硬性需求,別的行業跟不上也沒辦法,需求決定市場。
說說更通用的數據分析吧。
大數據分析也屬於數據分析的一塊,在實際應用中可以把數據分析工具分成兩個維度:
第一維度:數據存儲層――數據報表層――數據分析層――數據展現層
第二維度:用戶級――部門級――企業級――BI級
1、數據存儲層
數據存儲設計到資料庫的概念和資料庫語言,這方面不一定要深鑽研,但至少要理解數據的存儲方式,數據的基本結構和數據類型。SQL查詢語言必不可少,精通最好。可從常用的selece查詢,update修改,delete刪除,insert插入的基本結構和讀取入手。
Access2003、Access07等,這是最基本的個人資料庫,經常用於個人或部分基本的數據存儲;MySQL資料庫,這個對於部門級或者互聯網的資料庫應用是必要的,這個時候關鍵掌握資料庫的庫結構和SQL語言的數據查詢能力。
SQL Server2005或更高版本,對中小企業,一些大型企業也可以採用SQL Server資料庫,其實這個時候本身除了數據存儲,也包括了數據報表和數據分析了,甚至數據挖掘工具都在其中了。
DB2,Oracle資料庫都是大型資料庫了,主要是企業級,特別是大型企業或者對數據海量存儲需求的就是必須的了,一般大型資料庫公司都提供非常好的數據整合應用平台。
BI級別,實際上這個不是資料庫,而是建立在前面資料庫基礎上的,企業級應用的數據倉庫。Data Warehouse,建立在DW機上的數據存儲基本上都是商業智能平台,整合了各種數據分析,報表、分析和展現!BI級別的數據倉庫結合BI產品也是近幾年的大趨勢。
2、報表層
企業存儲了數據需要讀取,需要展現,報表工具是最普遍應用的工具,尤其是在國內。傳統報表解決的是展現問題,目前國內的帆軟報表FineReport已經算在業內做到頂尖,是帶著數據分析思想的報表,因其優異的介面開放功能、填報、表單功能,能夠做到打通數據的進出,涵蓋了早期商業智能的功能。
Tableau、FineBI之類,可分在報表層也可分為數據展現層。FineBI和Tableau同屬於近年來非常棒的軟體,可作為可視化數據分析軟體,我常用FineBI從資料庫中取數進行報表和可視化分析。相對而言,可視化Tableau更優,但FineBI又有另一種身份――商業智能,所以在大數據處理方面的能力更勝一籌。
3、數據分析層
這個層其實有很多分析工具,當然我們最常用的就是Excel,我經常用的就是統計分析和數據挖掘工具;
Excel軟體,首先版本越高越好用這是肯定的;當然對excel來講很多人只是掌握了5%Excel功能,Excel功能非常強大,甚至可以完成所有的統計分析工作!但是我也常說,有能力把Excel玩成統計工具不如專門學會統計軟體;
SPSS軟體:當前版本是18,名字也改成了PASW Statistics;我從3.0開始Dos環境下編程分析,到現在版本的變遷也可以看出SPSS社會科學統計軟體包的變化,從重視醫學、化學等開始越來越重視商業分析,現在已經成為了預測分析軟體;
SAS軟體:SAS相對SPSS其實功能更強大,SAS是平台化的,EM挖掘模塊平台整合,相對來講,SAS比較難學些,但如果掌握了SAS會更有價值,比如離散選擇模型,抽樣問題,正交實驗設計等還是SAS比較好用,另外,SAS的學習材料比較多,也公開,會有收獲的!
JMP分析:SAS的一個分析分支
XLstat:Excel的插件,可以完......>>
Ⅶ ogc是什麼意思 ogc到底是什麼意思
1、ogc是什麼意思:OGC 全稱是開放地理空間信息聯盟(Open Geospatial Consortium),是一個非盈利的國際標准組織,它制定了數據和服務的一系列標准,GIS廠商按照這個標准進行開發可保證空間數據的互操作。
2、OGC是一個非盈利的志願的國際標准化組織,引領著空間地理信息標准及定位基本服務的發展。在空間數據互操作領域,基於公共介面訪問模式的互操作方法是一種基本的操作方法。通過國際標准化組織(ISO/TC211)或技術聯盟(如OGC)制定空間數據互操作的介面規范,GIS軟體商開發遵循這一介面規范的空間數據的讀寫函數,可以實現異構空間資料庫的互操作。
Ⅷ 什麼是多源異構數據
化學上,同分異構是一種有相同化學式,有同樣的化學鍵而有不同的原子排列的化合物的現象.它分為構造異構和立體異構2類.而立體異構又分為順反異構(Z)(E)、光學異構、構象異構3種:
⒈結構異構:結構不同引起異構,如正丁烷&異丁烷、乙醇&甲醚化學性質也截然不同。
2、立體異構:結構相似,但由於微小偏差導致結構不同。
(8)異構空間資料庫擴展閱讀:
數據表達與組織方式:
空間地理幾何數據的表示主要有柵格和矢量兩種不同的形式。柵格形式是將地理表層空間劃分為一系列網格,空間目標由這些網格的位置及其量化值來表示,這些格網本身就是連續空間信息的離散表達。
矢量形式則是將地理空間的一切事物、概念進行抽象,形成點、線、面,由點、線、面來組成各類空間目標。按點、線、面來分類和按分層的思想來組織空間數據,也割裂了實體之間內在的聯系。
在空間資料庫組織與管理上,目前主要有文件型、文件與關系資料庫混合型、全關系型以及對象關系型。傳統的文件型空間資料庫、文件與關系混合型空間資料庫,按圖幅或一定的區域范圍以文件的形式來組織與存儲空間幾何數據,不同的圖幅或區域之間存在縫隙。