當前位置:首頁 » 服務存儲 » 元數據支持信息資源的存儲和管理
擴展閱讀
webinf下怎麼引入js 2023-08-31 21:54:13
堡壘機怎麼打開web 2023-08-31 21:54:11

元數據支持信息資源的存儲和管理

發布時間: 2023-03-22 19:34:43

『壹』 元資料庫

元數據是「關於數據的數據」,存在於電子信息環境中,用於描述資源的屬性,呈現其關系,支持資源發現、管理與有效利用(徐筱紅,2006),是對所採集到的數據的說明。一般來說,它有兩方面的用途:首先,元數據能提供基於用戶的信息,如記錄數據項的業務描述信息的元數據能幫助用戶使用數據;其次,元數據能支持系統對數據的管理和維護,如關於數據項存儲方法的元數據能支持系統以最有效的方式訪問數據。具體來說,在塔里木河流域生態環境動態監測及輔助決策支持系統綜合資料庫系統中,元數據機制主要支持以下幾類系統管理功能:①描述哪些數據在綜合資料庫中;②定義要進入資料庫中的數據和從資料庫中產生的數據;③記錄並檢測系統數據一致性的要求和執行情況;④衡量數據質量。

(一)元數據分級與特徵

1.元數據分級

基本元數據:提供地理數據源基本文檔所需要的最少的元數據元素集。

完全元數據:提供完整的地理數據源(單獨的數據集、數據集系列、各種地理要素)文檔所需要的必選的和可選的元數據元素集。它完整地定義全部元數據,以便標識、評價、摘錄、使用和管理地理信息。

2.元數據特徵

(1)名稱:賦給元數據實體或元素的標記。

(2)標識碼:計算機中使用的定義每個元數據實體和元素的唯一代碼。代碼結構為:XXXXXX

前2位為元數據子集,2位數字碼;中間2位為元數據實體/獨立元素,2位數字碼;後2位為元數據實體包含的元素,2位數字碼。

(3)定義:對元數據實體和元素的說明。

(4)性質:說明元數據實體或元素是否總是出現,或有時出現的描述符。描述符分別為:M-必選;C-一定條件下必選;O-可選。

(5)條件:說明何種條件下元數據子集、實體或元素是必選的。如果對所說明的條件成立,那麼該子集、實體或元素就是必選的。

(6)最大出現次數:指定元數據實體或元素在實際使用時,可能重復出現的最大次數。只出現一次的表示為「1」,重復出現的表示為「N」。

(7)數據類型:表示元數據元素的一組不同的值,例如,「文本」、「整型」、「短語」、「坐標串」、「實型」和「日期」。

(8)值域:指定每個元數據元素的取值范圍。「任意長文本」表示所述內容不受限制,實型數和基於代碼的整型數等只能使用一個限定的(閉合的)值域內的值。

(二)元資料庫主要內容

塔里木河流域生態環境動態監測系統的元數據包括數字影像圖、數字柵格圖、數字高程模型、數字線劃圖等。大部分數據都有相應的國家或行業元數據標准規范,有國家或行業標準的按照標准規范採集;沒有規范的,按照元數據的分級特徵進行定義。主要包括有關數據源、數據分層、成果歸屬、空間參照系、數據質量(包含數據精度和數據評價)、數據更新、圖幅接邊等方面的信息(周騁等,2006)。其主要內容描述如下:

(1)標識信息:是唯一標識數據集的元數據信息。包括數據集名稱、發布時間、版本、語種、摘要、現狀、空間范圍(地理范圍、時間范圍)、表示方式、空間解析度、信息類別。

(2)數據質量信息:是數據集質量的總體評價。包括數據集內容完整性說明、數據集在概念、值域、格式和拓撲關系等方面的一致性程度、位置精度(空間位置絕對精度和相對精度)、時間精度(表示時間的精確程度、現勢性、有效性)、屬性精度(數據集屬性分類正確性、屬性值的精度和正確性)、數據質量保證措施。

(3)數據字典信息:包含數據集應用、數據源及生產數據集時所用工藝方法等信息。

(4)空間參照系信息:數據集使用的空間參照系統的說明。包括基於地理標識的空間參照系統、基於坐標的空間參照系統。

(5)內容信息:描述數據集的主要內容。包括主要要素類型名稱及相應的屬性名稱、影像數據集內容概述(波長、波段、灰階等級、合成處理方式)、柵格數據集內容概述(格網尺寸、格網尺寸單位、格網行列數、格網起始點坐標)。

(6)元數據參考信息:包括元數據發布或更新的時間,以及建立元數據單位的聯系信息。

以上6類由兩個公共數據類型聯系,公共數據類型包括:

(1)覆蓋范圍信息:數據集的空間范圍(經緯度坐標、地理標識符)、時間范圍(起始時間、終止時間)、垂向范圍(最小垂向坐標值、最大垂向坐標值、計量單位)。

(2)負責單位聯系信息:與數據集有關的單位標識(負責單位名稱、聯系人、職責)和聯系信息(電話、傳真、通信地址、郵政編碼、電子信箱地址、網址)。

(三)元數據入庫

元數據信息是一個純文本文件,在生產時採集了多項數據,它是與圖形數據、屬性數據緊密聯系在一起的,按照每幅圖一個文本文件存儲。為了實現資料庫系統中元數據與數據體的集成化管理,以及元數據與數據體的一體化相互檢索查詢,需將元數據信息空間化。採取的技術方法就是將元數據文件與圖幅結合表聯系起來,將每一幅圖形的區域作為一個目標對象,所採集的多項元數據信息作為其屬性項,構成一個以圖幅結合表為基礎的矢量格式元數據集。同圖形數據坐標系統一樣,元數據採用地理坐標系統,整個流域則以Coverage格式整體存儲,數據處理完成後全部導入到Oracle9i資料庫中。

『貳』 什麼叫元數據

元數據(Meta Date),主要記錄數據倉庫中模型的定義、各層級間的映射關系、監控數據倉庫的數據狀態及ETL的任務運行狀態。一般會通過元數據資料庫(Metadata Repository)來統一地存儲和管理元數據,其主要目的是使數據倉庫的設計、部署、操作和管理能達成協同和一致。

元數據是數據倉庫管理系統的重要組成部分,元數據管理是企業級數據倉庫中的關鍵組件,貫穿數據倉庫構建的整個過程,直接影響著數據倉庫的構建、使用和維護。

元數據不僅定義了數據倉庫中數據的模式、來源、抽取和轉換規則等,而且是整個數據倉庫系統運行的基礎,元數據把數據倉庫系統中各個鬆散的組件聯系起來,組成了一個有機的整體。

『叄』 什麼是元數據

元數據(Metadata),又稱中介數據、中繼數據,為描述數據的數據(data about data)。

元數據作用是:

1、描述數據屬性(property)的信息,用來支持如指示存儲位置、歷史數據、資源查找、文件記錄等功能。

2、元數據算是一種電子式目錄,為了達到編制目錄的目的,必須在描述並收藏數據的內容或特色,進而達成協助數據檢索的目的。

元數據的應用舉例:

1、數據結構:數據集的名稱、關系、欄位、約束等;

2、數據部署:數據集的物理位置;

3、數據流:數據集之間的流程依賴關系(非參照依賴),包括數據集到另一個數據集的規則;

4、質量度量:數據集上可以計算的度量;

5、度量邏輯關系:數據集度量之間的邏輯運算關系;

6、ETL過程:過程運行的順序,並行、串列;

7、數據集快照:一個時間點上,數據在所有數據集上的分布情況。

(3)元數據支持信息資源的存儲和管理擴展閱讀:

元數據的優點:

1、自描述:元數據自動提供 COM 中 IDL 的功能,允許將一個文件同時用於定義和實現。運行庫模塊和程序集甚至不需要向操作系統注冊。結果,運行庫使用的說明始終反映編譯文件中的實際代碼,從而提高應用程序的可靠性。

2、設計:元數據提供所有必需的有關已編譯代碼的信息,以供用戶從用不同語言編寫的 PE 文件中繼承類。用戶可以創建用任何託管語言(任何面向公共語言運行庫的語言)編寫的任何類的實例,而不用擔心顯式封送處理或使用自定義的互用代碼。

『肆』 什麼是元數據(MetaData)及

元數據是對數據資源的描述,英文名稱是「Metadata」,通常被解釋為data about data,即關於數據的數據。元數據是信息共享和交換的基礎和前提,用於描述數據集的內容、質量、表示方式、空間參考、管理方式以及數據集的其他特徵。


隨著信息技術不斷發展,以及人們對信息共享的迫切需求,元數據技術被應用於更多的領域,如:在圖書館與信息界,元數據被定為提供關於信息資源或數據的一種結構化的數據,是對信息資源的結構化的描述;在數據倉庫領域中,元數據被 被定義為描述數據及其環境的數據;在軟體構造領域,元數據被定義為在程序中不是被加工的對象,而是通過其值的改變來改變程序的行為的數據。