1. 資料庫有哪幾種
常用資料庫有:
1、關系型資料庫
關系型資料庫是由IBM的E.F. Codd於1970年發明的,它是一個表格資料庫,其中定義了數據,因此可以以多種不同的方式對其進行重組和訪問。關系資料庫由一組表組成,其中的數據屬於預定義的類別。每個表在一個列中至少有一個數據類別,並且每一行對於列中定義的類別都有一個特定的數據實例。
2、分布式資料庫
分布式資料庫是一種資料庫,資料庫存儲在多個物理位置,處理在網路中的不同點之間分散或復制。分布式資料庫可以是同構的,也可以是異構的。同構分布式資料庫系統中的所有物理位置都具有相同的底層硬體,並運行相同的操作系統和資料庫應用程序。異構分布式資料庫中的硬體、操作系統或資料庫應用程序在每個位置上可能是不同的。
3、雲資料庫
雲資料庫是針對虛擬化環境優化或構建的資料庫。雲資料庫提供了一些好處,比如可以按每次使用支付存儲容量和帶寬的費用,還可以根據需要提供可伸縮性和高可用性。雲資料庫還為企業提供了在軟體即服務部署中支持業務應用程序的機會。
4、NoSQL資料庫
NoSQL資料庫對於大型分布式數據集非常有用。NoSQL資料庫對於關系資料庫無法解決的大數據性能問題非常有效。當組織必須分析大量非結構化數據或存儲在雲中多個虛擬伺服器上的數據時,它們是最有效的。
5、面向對象的資料庫
使用面向對象編程語言創建的項通常存儲在關系資料庫中,但是面向對象資料庫非常適合於這些項。面向對象的資料庫是圍繞對象(而不是操作)和數據(而不是邏輯)組織的。例如,關系資料庫中的多媒體記錄可以是可定義的數據對象,而不是字母數字值。
6、圖形資料庫
面向圖形的資料庫是一種NoSQL資料庫,它使用圖形理論存儲、映射和查詢關系。圖資料庫基本上是節點和邊的集合,其中每個節點表示一個實體,每個邊表示節點之間的連接。
2. 分布式資料庫半連接 ρ 怎麼算
(1)方案一(資料庫保存所有伺服器索引信息)
全對稱結構,沒有中央伺服器
web方案:
只從本地資料庫檢索符合條件的記錄,給出結果
每次檢索都要從本地伺服器的海量數據中進行
資料庫方案:
資料庫保存所有伺服器的索引內容
緩存命中率高的記錄,減少檢索時間
伺服器負載分析:
伺服器負載假設:
一百個結點,每結點一百人同時使用,每個結點一萬條記錄
web伺服器:同時一百線程在本地資料庫伺服器檢索
資料庫伺服器:每次接收一百個查詢請求;每個請求要從一百萬條索引中檢索(最壞的情況);緩沖機制可以稍微減輕負擔
數據更新操作:
同時更新所有資料庫/只更新本地,伺服器間相互同步
方案二(資料庫保存本地索引及少量緩沖)
每高校作為一個結點
所有結點全對稱結構,網路中沒有一個中央伺服器
web方案:
接收到請求時同時多線程向其它伺服器同時搜索(伺服器壓力問題?)
資料庫方案:
資料庫保存本地數據
資料庫保存一定量緩沖數據,
伺服器負載分析:
伺服器負載假設:
一百個結點,每結點一百人同時使用
則每個web伺服器同時發起一萬個線程向其它數據伺服器搜索(oops!)
每個資料庫伺服器會同時接收到一萬個查詢請求(oops!)
採用學習過程只能少量減少查詢請求和web伺服器搜索線程
數據更新操作:
只更新本地
方案三(中央伺服器方案一)
每高校一個結點
每結點結構相同,連接到同一個中央伺服器
web方案
每個查詢向中央伺服器進行,由中央伺服器實行檢索,中央伺服器返回檢索結果
資料庫方案
中央資料庫保存所有索引信息
每結點可以只用小型資料庫保存本地用戶和其它信息即可
伺服器負載分析:
伺服器負載假設:
一百個結點,每結點一百人同時使用,每結點資料記錄一萬條
web伺服器:同時發起一百個進程向中央資料庫查詢
資料庫伺服器(中央):同時接收一萬條查詢請求並返回大容量結果
資料庫伺服器(結點):少量工作
數據更新操作:
只更新中央伺服器
方案四(中央伺服器方案二)
每高校一個結點
每結點結構相同,連接到同一中央伺服器
web方案:
每個查詢向中央伺服器進行,由中央伺服器根據查詢內容進行轉發到結點資料庫,再由結點資料庫返回結果
資料庫方案:
中央伺服器保存各結點分類信息,根據頁面請求的分類轉發查詢到相應伺服器
伺服器負載分析:
伺服器負載假設:
一百個結點,每結點一百人同時使用,每結點資料記錄一萬條,每結點一百個類別
web伺服器:同時一百個進程向中央資料庫查詢
資料庫伺服器(中央):同時接收一萬條請求並轉發
資料庫伺服器(結點):從中央伺服器接收查詢請求,最壞情況下每結點接收到一萬條查詢請求
數據更新操作:
只更新本地伺服器
分類變化時更新中央伺服器
3. 地理空間數據集成
早期GIS系統幾乎是完全獨立的系統,擁有自己特定的軟體組件、文件格式和自己專門採集的空間數據,不同GIS系統之間很少進行交互和集成。隨著網路和資料庫技術發展及GIS應用領域的擴大,發展了許多空間數據集成理論和方法。
根據側重點的不同,地球空間數據集成的概念有如下幾類:①GIS功能觀點,認為數據集成是地理信息系統的基本功能;②簡單組織轉化觀點,認為數據集成是數據層的簡單再組織;③過程觀點,認為地球空間數據集成是在一致的拓撲空間框架中地表描述的建立或使同一個地理信息系統中的不同數據集彼此之間兼容的過程;④關聯觀點,認為數據集成是屬性數據和空間數據的關聯。這些觀點,從不同角度揭示出地球空間數據集成的多樣性和綜合性(李軍,2000)。
按照數據集成的類型及實際應用中數據集成需求,地球空間數據集成分為4大類:①區域集成,指根據一定區域范圍集成各種類型的數據(Eugene,1992);②專題集成,以要素作為數據集成主要指標的集成;③時間集成,以時間為集成主體,內容包括多時間尺度數據集成、時間序列數據集成等;④數據綜合集成,即綜合度差異數據之間的集成,從數據與其表達的地學過程空間尺度的關系分析即是多空間尺度數據集成。
這四類集成中每一類都包含具體的集成類型,其中數據的綜合集成是最為復雜的一類,常規意義的制圖綜合和數據細化都包含在該類數據集成中。
按照數據集成模式可以把GIS數據集成分為3種模式:①數據轉換模式,是經專門的數據轉換程序進行不同數據格式的集成;②數據互操作模式,是根據OGC頒布的規范,所有數據源的軟體(數據伺服器)需要提供統一的數據訪問介面以便數據客戶進行訪問,並處理數據客戶的請求從而完成數據服務;③直接數據訪問模式,指在GIS系統中實現對其他數據格式的直接訪問、存取和分析,利用空間引擎的方法實現多源數據的無縫集成(宋關福等2000;閭國年等,2003)。
這三種集成模式各有利弊,其中,①模式是傳統的一種模式,但由於不同數據格式描述空間對象時採用的數據模型不同,因而轉換後不能完全准確表達源數據信息,此外由於這種數據格式轉換的涉及輸出和輸入兩個過程,相對比較復雜;②模式,由於實現各種數據格式宿主軟體的數據訪問介面,一定時期內還不現實,且對於數據客戶來講,同時需要擁有兩種格式的GIS軟體,並同時運行才能完成數據的互操作,給數據的集成帶來了局限性,因此目前還有很大的局限性。而③模式雖然提供了更為經濟實用的多源數據集成模式,是實現空間數據共享的理想方式,但由於構建成本比較大,且需要具備多源空間數據無縫集成技術和一種內置於GIS軟體中的特殊數據訪問體制,目前是相對比較困難且技術要求較高的集成模式。
綜上所述可知,關於地理空間數據集成,目前主要集中於物理實現和邏輯模型層次上的集成方法,是從數據本身入手來研究數據集成,屬一種微觀的數據集成。因此,數據集成必須同時集成數據的語義,才能滿足用戶應用的需要。
2.2.1.1 介面規范與標准
自從20世紀70年代開始,許多國家加強了地理信息標准化工作,迄今,已取得了長足進步。國際上地理信息產業的標准和規范發展十分迅速,各國對地理信息產業的標准和規范空前重視,在地理信息標准化的研究和標準的制定方面合作十分密切,國際標准化組織地理信息技術委員會(ISO/TC211)和以開放地理空間信息聯盟(OGC)為代表的國際論壇性地理信息標准化組織,以及CEN/TC287等區域性地理信息標准化組織,在其成員的積極參與下建立了完整的地理信息標准化體系,研究和制定出了一系列的國際通用或合作組織通用的標准或規范。國際地理信息標准化工作大體可分為兩部分:一是以已經發布實施的信息技術(IT)標准為基礎,直接引用或者經過修編採用;二是研製地理空間數據標准,包括數據定義、數據描述、數據處理等方面的標准。
我國於1997年成立了全國地理信息標准化技術委員會(CSBTS/TC230),負責我國地理信息國家標準的立項建議、組織協調、研究制定、審查上報等。
2.2.1.2 分布式空間查詢處理技術
國際上的研究主要集中在分布式空間索引技術和分布式查詢處理策略等方向上。英聯邦科學與工業研究組織(CSIRO)的Abel和新加坡國立大學的Ooi等人(1995)基於分布式資料庫理論中的半連接思想,首先研究了分布式空間資料庫的空間連接查詢處理問題,提出了空間半連接運算元,並基於空間對象的一維索引結構,提出了一種空間半連接查詢處理演算法。新加坡國立大學的Tan等人(2000)將上述演算法擴展到多維索引結構,並分析了演算法在不同數據分布和網路帶寬情況下的性能。實驗結果表明,採用空間半連接操作可以極大地降低網路數據傳輸量,這對於網路帶寬有限的分布式環境來說,如網路將很好地改善查詢的整體響應時間。但是,空間半連接操作也帶來了額外的CPU和I/O開銷,在高速網路環境下,且傳輸數據量較小時,採用基於空間半連接操作的查詢處理策略反而可能引起性能的下降。此外,還有學者研究了在並行計算體系結構下的分布式空間查詢處理問題,Patel等(2000)提出在並行計算體系結構下的兩種空間連接查詢處理策略。
2.2.1.3 組織管理與集成體系結構
對於組織管理與集成體系結構即空間數據組織管理與集成技術研究,分為三個階段:①傳統的空間數據組織管理與集成階段。②面向服務的空間數據的組織管理與集成階段。③網格環境下空間數據的組織管理與集成階段。海洋時空數據屬於地理空間數據的范疇,但是由於海洋現象的復雜性、多樣性以及海洋時空數據自身的特點,決定了海洋時空數據與其他空間數據的組織管理與集成有著很大的區別。
4. 資料庫教程的目錄
第1部分 概念篇
第1章 資料庫基本概念
1. 1 數據管理技術的發展
1. 1. 1 人工管理階段
1. 1. 2 文件系統階段
1. 1. 3 資料庫階段
1. 1. 4 高級資料庫階段
1. 1. 5 資料庫的基本術語
1. 2 數據描述
1. 2. 1 概念設計中的數據描述
1. 2. 2 邏輯設計中的數據描述
1. 2. 3 存儲介質層次及數據描述
1. 2. 4 數據聯系的描述
1. 3 數據抽象的級別
1. 3. 1 數據抽象的過程
1. 3. 2 概念模型
1. 3. 3 邏輯模型
1. 3. 4 外部模型
1. 3. 5 內部模型
1. 3. 6 高度的數據獨立性
1. 4 資料庫管理系統
1. 4. 1 DBMS的工作模式
1. 4. 2 DBMS的主要功能
1. 5 資料庫系統
1. 5. 1 DBS的組成
1. 5. 2 DBS的全局結構
1. 5. 3 應用程序的演變
1. 5. 4 DBS的效益
1. 6 小結
習題1
第2部分 關系篇
第2章 關系運算理論
2. 1 關系模型的基本概念
2. 1. 1 基本術語
2. 1. 2 關系的定義和性質
2. 1. 3 三類完整性規則
2. 1. 4 關系模型的形式定義和優點
2. 1. 5 關系查詢語言和關系運算
2. 2 關系代數
2. 2. 1 關系代數的5個基本操作
2. 2. 2 關系代數的4個組合操作
2. 2. 3 關系代數運算的應用實例
2. 2. 4 關系代數的兩個擴充操作
*2. 3 關系演算
2. 3. 1 元組關系演算
2. 3. 2 域關系演算
2. 3. 3 關系運算的安全約束和等價性
*2. 4 關系邏輯
2. 4. 1 關系邏輯的成分
2. 4. 2 從關系代數到關系邏輯的轉換
2. 4. 3 遞歸過程
2. 4. 4 關系邏輯與關系代數的差異
2. 5 關系代數表達式的優化
2. 5. 1 關系代數表達式的優化問題
2. 5. 2 關系代數表達式的等價變換規則
2. 5. 3 關系代數表達式的啟發式優化演算法
2. 6 小結
習題2
第3章 SQL語言
3. 1 SQL簡介
3. 1. 1 SQL發展史
3. 1. 2 SQL資料庫的體系結構
3. 1. 3 SQL的組成
3. 1. 4 SQL的特點
3. 2 SQL的數據定義
3. 2. 1 SQL模式的創建和撤銷
3. 2. 2 基本數據類型
3. 2. 3 基本表的創建. 修改和撤銷
3. 2. 4 索引的創建和撤銷
3. 3 SQL的數據查詢
3. 3. 1 SELECT查詢語句的基本結構
3. 3. 2 SELECT語句的使用技術
3. 3. 3 聚合函數
3. 3. 4 SELECT語句完整的句法
3. 4 SQL數據查詢中的限制和規定
3. 4. 1 SELECT語句中的規定
3. 4. 2 條件表達式中的比較操作
3. 4. 3 嵌套查詢的改進寫法
3. 4. 4 基本表的連接操作
*3. 4. 5 SQL3中的遞歸查詢
3. 5 數據更新
3. 5. 1 數據插人
3. 5. 2 數據刪除
3. 5. 3 數據修改
3. 6 視圖
3. 6. 1 視圖的創建和撤銷
3. 6. 2 對視圖的操作
3. 7 嵌入式SQL
3. 7. 1 嵌入式SQL的實現方式
3. 7. 2 嵌入式SQL的使用規定
3. 7. 3 嵌入式SQL的使用技術
3. 7. 4 動態SQL語句
3. 8 小結
習題3
第4章 資料庫管理
4. 1 事務
4. 1. 1 事務的定義
4. 1. 2 事務的ACID性質
4. 2 資料庫的恢復
4. 2. 1 典型的恢復策略
4. 2. 2 故障類型和恢復方法
4. 2. 3 檢查點技術
4. 2. 4 SQL對事務的支持
4. 3 資料庫的並發控制
4. 3. 1 並發操作帶來的4個問題
4. 3. 2 封鎖技術
4. 3. 3 封鎖帶來的問題
4. 3. 4 並發操作的調度
4. 3. 5 SQL對並發處理的支持
4. 4 資料庫的完整性
4. 4. 1 完整性子系統
4. 4. 2 SQL中的完整性約束
4. 4. 3 約束可延遲性
*4. 4. 4 SQL3中的觸發器
4. 5 資料庫的安全性
4. 5. 1 安全性問題
4. 5. 2 SQL中的安全性機制
4. 5. 3 常用的安全性措施
4. 6 小結
習題4
第3部分 設計篇
第5章 關系模式設計理論
5. 1 關系模式的設計准則
5. 1. 1 關系模式的冗餘和異常問題
5. 1. 2 關系模式的非形式化設計准則
5. 2 函數依賴
5. 2. 1 函數依賴的定義
5. 2. 2 FD的閉包
5. 2. 3 FD的推理規則
5. 2. 4 FD和關鍵碼的聯系
5. 2. 5 屬性集的閉包
5. 2. 6 FD集的最小依賴集
5. 3 關系模式的分解特性
5. 3. 1 關系模式的分解
5. 3. 2 無損分解
5. 3. 3 模式分解的優缺點
5. 3. 4 無損分解的測試方法
5. 3. 5 保持函數依賴的分解
5. 3. 6 模式分解與模式等價問題
5. 4 範式
5. 4. 1 第一範式 1NF
5. 4. 2 第二範式 2NF
5. 4. 3 第三範式 3NF
5. 4. 4 BCNF Boyce-CoddNF
5. 4. 5 分解成BCNF模式集的分解演算法
5. 4. 6 分解成3NF模式集的合成演算法
5. 4. 7 模式設計方法小結
5. 5 其他數據依賴和範式
5. 5. 1 多值依賴
5. 5. 2 關於FD和MVD的推理規則集
5. 5. 3 第四範式 4NF
5. 5. 4 嵌人多值依賴
5. 5. 5 連接依賴和第五範式
5. 6 小結
習題5
第6章 基於ER模型的資料庫設計
6. 1 資料庫工程與資料庫系統生存期
6. 1. 1 規劃階段
6. 1. 2 需求分析階段
6. 1. 3 概念設計階段
6. 1. 4 邏輯設計階段
6. 1. 5 物理設計階段
6. 1. 6 資料庫的實現
6. 1. 7 資料庫的運行與維護
6. 2 ER模型
6. 2. 1 ER模型的基本元素
6. 2. 2 屬性的分類
6. 2. 3 聯系的設計
6. 2. 4 ER模型的操作
6. 2. 5 採用ER模型的資料庫概念設計步驟
6. 3 ER模型到關系模型的轉換
6. 3. 1 ER圖轉換成關系模式集的演算法
6. 3. 2 採用ER模型的邏輯設計步驟
6. 4 ER模型實例分析
6. 4. 1 庫存管理信息系統的ER模型及轉換
6. 4. 2 人事管理信息系統的ER模型
6. 4. 3 住院管理信息系統的ER模型
6. 4. 4 公司車隊信息系統的ER模型
6. 5 增強的ER模型
6. 5. 1 弱實體
6. 5. 2 子類實體與超類實體
6. 6 小結
習題6
第7章 面向對象的高級概念建模
7. 1 面向對象的數據類型系統
7. 2 對象聯系圖
7. 2. 1 對象聯系圖的成分
7. 2. 2 數據的概化/特化
7. 3 UML類圖
7. 3. 1 統一建模語言 UML 概述
7. 3. 2 用類圖表達類和關聯
7. 3. 3 用類圖表達關聯類
7. 3. 4 用類圖表達概化/特化
7. 3. 5 用類圖表達聚合
7. 4 小結
習題7
第4部分 對象篇
第8章 對象關系資料庫ORDB
8. 1 關系模型的發展歷程
8. 1. 1 從關系模型到後關系模型
8. 1. 2 從後關系模型到對象關系模型
8. 2 ORDB的定義語言
8. 2. 1 對象關系數據模型的定義
8. 2. 2 數據類型的定義
8. 2. 3 繼承性的定義
8. 2. 4 引用類型的定義
8. 2. 5 SQL3中的定義語言
8. 3 0RDB的查詢語言
8. 3. 1 對SELECT語句的新規定
8. 3. 2 嵌套與解除嵌套
8. 3. 3 復合值的創建和查詢
8. 3. 4 Oracle中查詢的兩種技術
8. 4 函數和過程
8. 4. 1 SQL函數和過程
8. 4. 2 外部語言程序
8. 4. 3 過程的構造
8. 5 小結
習題8
第9章 面向對象資料庫OODB
9. 1 00DBS的基本概念
9. 1. 1 ODMG標准
9. 1. 2 OODBS的定義
9. 1. 3 OODB的基本概念
9. 2 ODMG對象模型
9. 2. 1 對象和文字
9. 2. 2 介面. 類和繼承
9. 2. 3 類外延. 關鍵碼和工廠對象
9. 3 ODMGODL
9. 4 ODMGOQL
9. 4. 1 OQL中的SELECT語句
9. 4. 2 OQL表達式的附加格式
9. 4. 3 OQL中對象的賦值和建立
9. 5 C 語言的綁定
9. 6 OODB. ORDB與RDB的比較
9. 6. 1 OODB與RDB在概念設計上的區別
9. 6. 2 OODB與ORDB的比較
9. 7 小結
習題9
第5部分 分布篇
第10章 分布式資料庫
10. 1 DDBS的定義和特點
10. 1. 1 從集中式. 分散式到分布式
10. 1. 2 DDBS的定義
10. 1. 3 DDBS的特點
10. 1. 4 DDBS的優缺點
10. 1. 5 DDBS的分類
10. 2 分布式數據存儲
10. 2. 1 數據分片
10. 2. 2 數據分配
10. 3 DDB的體系結構
10. 3. 1 體系結構
10. 3. 2 分布透明性
10. 4 DDBMS
10. 4. 1 DDBS的組成
10. 4. 2 DDBMS的功能
10. 4. 3 DDBMS的組成
10. 4. 4 DDBMS的同構性程度和局部自治性程度
10. 4. 5 FDBS的異構性
10. 4. 6 FDBS的5層模式結構
10. 5 分布式查詢處理
10. 5. 1 查詢代價的估算方法
10. 5. 2 基於半連接的優化策略
10. 5. 3 基於連接的優化方法
10. 6 分布式資料庫中的並發控制和恢復技術
10. 6. 1 DDB中的問題
10. 6. 2 基於數據項識別拷貝的分布式並發控制
10. 6. 3 基於投票方法的分布式並發控制
10. 6. 4 分布式恢復
10. 7 小結
習題10
第11章 異構多數據源的訪問
11. 1 中間件
11. 1. 1 中間件的定義
11. 1. 2 中間件的作用
11. 2 ODBC結構
11. 2. 1 ODBC概念
11. 2. 2 ODBC的體系結構
11. 2. 3 ODBC的特性
11. 3 ODBC介面
11. 3. 1 ODBC應用程序的基本流程
11. 3. 2 ODBC句柄
11. 3. 3 數據源的連接與斷開
11. 3. 4 SQL語句的執行
11. 3. 5 查詢結果的獲取
11. 4 ODBC的符合性級別
11. 4. 1 API符合性的三個級別
11. 4. 2 SQL符合性的三個級別
11. 4. 3 ODBCAPI與SQLCLI之間的協調
11. 4. 4 SQLCLI與嵌入式SQL的比較
11. 4. 5 典型的資料庫應用系統開發工具
11. 5 JDBC結構
11. 5. 1 JDBC的提出
11. 5. 2 JDBC的基本功能
11. 5. 3 JDBC資料庫設計方法
11. 5. 4 保持一致性的措施
11. 5. 5 JDBC驅動程序
11. 6 JDBCAPI
11. 6. 1 JDBCAPI的目標
11. 6. 2 JDBCAPI介面概貌
11. 6. 3 JDBC的介面和類
11. 6. 4 JDBC資料庫應用程序的編寫
11. 7 小結
習題11
第12章 XML技術
12. 1 XML概述
12. 1. 1 XML的誕生
12. 1. 2 XML文擋
12. 1. 3 文檔類型定義 DTD
12. 1. 4 XML模式
12. 2 XML編程介面
12. 2. 1 文檔對象模型 DOM
12. 2. 2 簡單的應用程序設計介面 SAX
12. 3 常用的XML查詢語言XQuery
12. 3. 1 XQuery的基本功能
12. 3. 2 XQuery的基本概念
12. 3. 3 簡單查詢
12. 3. 4 各種類型的查詢
12. 4 小結
習題12
第6部分 決策篇
第13章 數據倉庫
13. 1 DW概述
13. 1. 1 從DB到DW的演變
13. 1. 2 DB數據和DW數據的區別
13. 1. 3 DW的定義和特點
13. 1. 4 DW的類型
13. 2 DW的組織結構
13. 2. 1 DW的數據組織結構
13. 2. 2 粒度與分割
13. 2. 3 DWS的結構
13. 2. 4 DW的運行結構
13. 3 DW存儲的多維數據模型
13. 3. 1 多維立方體
13. 3. 2 星形模式
13. 3. 3 雪花模式
13. 3. 4 事實星座模式
13. 4 DW的數據獲取與管理
13. 4. 1 DW的數據獲取
13. 4. 2 DW的數據管理
13. 5 DW的設計和發展階段
13. 5. 1 DW設計的原則
13. 5. 2 DW設計的步驟
13. 5. 3 DW的發展階段
13. 6 小結
習題13
第14章 聯機分析處理技術
14. 1 OLAP概述
14. 1. 1 OLAP的定義
14. 1. 2 OLAP准則
14. 1. 3 OLAP的基本概念
14. 1. 4 OLAP與OLTP之間的比較
14. 2 OLAP的數據組織
14. 2. 1 MOLAP
14. 2. 2 ROLAP
14. 2. 3 HOLAP
14. 2. 4 OLAP數據的處理方式
14. 3 OLAP的多維數據分析
14. 3. 1 切片和切塊
14. 3. 2 鑽取
14. 3. 3 旋轉
14. 3. 4 OLAP應用開發實例
14. 3. 5 廣義OLAP操作
14. 4 OLAP的數據索引技術
14. 4. 1 點陣圖索引
14. 4. 2 連接索引
14. 5 基於Web的OLAP系統結構
14. 6 小結
習題14
第15章 數據挖掘
15. 1 DM概述
15. 1. 1 DM的由來
15. 1. 2 DM的定義
15. 1. 3 DM與DW的聯系與區別
15. 1. 4 DM與OLAP的聯系與區別
15. 2 DM過程
15. 3 DM的關聯分析方法
15. 3. 1 DM的分析方法
15. 3. 2 關聯規則的定義
15. 3. 3 關聯規則的分類
15. 3. 4 關聯規則的挖掘演算法
15. 3. 5 多層和多維關聯規則的挖掘
15. 3. 6 關聯規則價值衡量的方法
15. 4 DM的其他分析方法
15. 4. 1 序列模式分析方法
15. 4. 2 分類分析方法
15. 4. 3 聚類分析方法
15. 5 DM的應用領域
15. 5. 1 DM的應用行業
15. 5. 2 商業化的DM工具
15. 6 新決策支持系統概述
15. 6. 1 新DSS的結構圖
15. 6. 2 新DSS的成功實例
15. 6. 3 新DSS與傳統DSS的比較
15. 6. 4 綜合DSS的結構圖
15. 7 小結
習題15
參考文獻
5. 數據存儲原則根據數據分布希么方式
定義:
分布式資料庫是指利用高速計算機網路將物理上分散的多個數據存儲單元連接起來組成一個邏輯上統一的資料庫。分布式資料庫的基本思想是將原來集中式資料庫中的數據分散存儲到多個通過網路連接的數據存儲節點上,以獲取更大的存儲容量和更高的並發訪問量。近年來,隨著數據量的高速增長,分布式資料庫技術也得到了快速的發展,傳統的關系型資料庫開始從集中式模型向分布式架構發展,基於關系型的分布式資料庫在保留了傳統資料庫的數據模型和基本特徵下,從集中式存儲走向分布式存儲,從集中式計算走向分布式計算。
特點:
1.高可擴展性:分布式資料庫必須具有高可擴展性,能夠動態地增添存儲節點以實現存儲容量的線性擴展。
2
高並發性:分布式資料庫必須及時響應大規模用戶的讀/寫請求,能對海量數據進行隨機讀/寫。
3.
高可用性:分布式資料庫必須提供容錯機制,能夠實現對數據的冗餘備份,保證數據和服務的高度可靠性。
6. 分布式資料庫的查詢優化
指在執行分布式查詢時選擇查詢執行計劃的方法和關系運算符的實現演算法。根據系統環境的不同,查詢優化所使用的演算法也有所不同,通常分為遠程廣域網環境和高速區域網環境,其區別主要在網路的帶寬。對於一元運算符可以採用集中式資料庫中的查詢優化方法。而對於二元運算符,由於涉及場地間的數據傳輸,因此必須考慮通信代價。分布式查詢中常見的連接運算執行策略包括:
(1)半連接方法:利用半連接運算的轉換方法R∞S=(RµS)∞S。假設場地1和場地2上分別有關系R和關系S,首先在S上執行連接屬性上的投影並將結果傳輸至場地1,在場地1上執行關系R與投影的連接操作,再將結果傳輸至場地2與關系S執行連接操作。這種方法能夠降低執行連接運算時的網路通信代價,主要適用於帶寬較低的遠程廣域網路。
(2)枚舉法方法:指枚舉關系運算符的物理執行計劃,通過對比執行計劃的代價選擇執行演算法的方法。其中,連接運算符的物理執行計劃包括嵌套循環方法、哈希連接法和歸並連接法。枚舉法主要適用於以磁碟IO代價為主的高速區域網環境。
7. 概念:分布式資料庫中的半連接
兩個關系連接後只保留第一個關系中的全部屬性
8. 分布式資料庫半連接優化中ρ =Val(A[S])/Val(Dom(A)) 解釋下分母Val(Dom(A))是什麼意思啊,具體怎麼算
N/A是not applicable的縮寫,中文的含義是不適合的,未設置的意思。
9. 什麼叫分布式資料庫,有什麼優點和缺點
1.分布式資料庫是資料庫的一種,是資料庫技術和網路技術的結合產物。
2.各有優點和缺點.分布式資料庫分為邏輯上分部物理上分布及邏輯上分布物理上集中兩種。
是的,分布式數據文件便於資料庫的管理維護。
10. 簡述分布式資料庫的模式結構
分布式資料庫系統是在集中式資料庫系統的基礎上發展來的。是資料庫技術與網路技術結合的產物。什麼是分布式資料庫: 分布式資料庫系統是在集中式資料庫系統的基礎上發展來的。是資料庫技術與網路技術結合的產物。分布式資料庫系統有兩種:一種是物理上分布的,但邏輯上卻是集中的。這種分布式資料庫只適宜用途比較單一的、不大的單位或部門。另一種分布式資料庫系統在物理上和邏輯上都是分布的,也就是所謂聯邦式分布資料庫系統。由於組成聯邦的各個子資料庫系統是相對「自治」的,這種系統可以容納多種不同用途的、差異較大的資料庫,比較適宜於大范圍內資料庫的集成。分布式資料庫系統(DDBS)包含分布式資料庫管理系統(DDBMS)和分布式資料庫(DDB)。在分布式資料庫系統中,一個應用程序可以對資料庫進行透明操作,資料庫中的數據分別在不同的局部資料庫中存儲、由不同的DBMS進行管理、在不同的機器上運行、由不同的操作系統支持、被不同的通信網路連接在一起。一個分布式資料庫在邏輯上是一個統一的整體:即在用戶面前為單個邏輯資料庫,在物理上則是分別存儲在不同的物理節點上。一個應用程序通過網路的連接可以訪問分布在不同地理位置的資料庫。它的分布性表現在資料庫中的數據不是存儲在同一場地。更確切地講,不存儲在同一計算機的存儲設備上。 這就是與集中式資料庫的區別。從用戶的角度看,一個分布式資料庫系統在邏輯上和集中式資料庫系統一樣,用戶可以在任何一個場地執行全局應用。就好那些數據是存儲在同一台計算機上,有單個資料庫管理系統(DBMS)管理一樣,用戶並沒有什麼感覺不一樣。分布式資料庫中每一個資料庫伺服器合作地維護全局資料庫的一致性。分布式資料庫系統是一個客戶/伺服器體系結構。