1. 什麼叫分布式資料庫,有什麼優點和缺點
1.分布式資料庫是資料庫的一種,是資料庫技術和網路技術的結合產物。
2.各有優點和缺點.分布式資料庫分為邏輯上分部物理上分布及邏輯上分布物理上集中兩種。
是的,分布式數據文件便於資料庫的管理維護。
2. 快速了解分布式資料庫的主要特點
分布式資料庫系統通常使用較小的計算機系統 每台計算機可單獨放在一個地方 每台計算機中都有DBMS的一份完整拷貝副本 並具有自己局部的資料庫 位於不同地點的許多計算機通過網路互相連接 共同組成一個完整的 全局的大型資料庫
這種組織資料庫的方法克服了物理中心資料庫組織的弱點 首先 降低了數據傳送代價 因為大多數的對資料庫的訪問操作都是針對局部資料庫的 而不是對其他位置的資料庫訪問 其次 系統的可靠性提高了很多 因為當網路出現故障時 仍然允許對局部資料庫的操作 而且一個位置的故障不影響其他位置的處理工作 只有當訪問出現故障位置的數據時 在某種程度上才受影響 第三 便於系統的擴充 增加一個新的局部資料庫 或在某個位置擴充一台適當的小型計算機 都很容易實現 然而有些功能要付出更高的代價 例如 為了調配在幾個位置上的活動 事務管理的性能比在中心資料庫時花費更高 而且甚至抵消許多其他的優點
分布式資料庫系統主要特點
多數處理就地完成
各地的計算機由數據通信網路相聯系
克服了中心資料庫的弱點 降低了數據傳輸代價
提高了系統的可靠性 局部系統發生故障 其他部分還可繼續工作
各個資料庫的位置是透明的 方便系統的擴充
為了協調整個系統的事務活動 事務管理的性能花費高
數據分片
類型
( )水平分片 按一定的條件把全局關系的所有元組劃分成若干不相交的子集 每個子集為關系的一個片段
( )垂直分片 把一個全局關系的屬性集分成若乾子集 並在這些子集上作投影運算 每個投影稱為垂直分片
( )導出分片 又稱為導出水平分片 即水平分片的條件不是本關系屬性的條件 而是其他關系屬性的條件
( )混合分片 以上三種方法的混合 可以先水平分片再垂直分片 或先垂直分片再水平分片 或其他形式 但他們的結果是不相同的
條件
( )完備性條件 必須把全局關系的所有數據映射到片段中 決不允許有屬於全局關系的數據卻不屬於它的任何一個片段
( )可重構條件 必須保證能夠由同一個全局關系的各個片段來重建該全局關系 對於水平分片可用並操作重構全局關系 對於垂直分片可用聯接操作重構全局關系
( )不相交條件 要求一個全局關系被分割後所得的各個數據片段互不重疊(對垂直分片的主鍵除外)
數據分配方式
( )集中式 所有數據片段都安排在同一個場地上
( )分割式 所有數據只有一份 它被分割成若干邏輯片段 每個邏輯片段被指派在一個特定的場地上
( )全復制式 數據在每個場地重復存儲 也就是每個場地上都有一個完整的數據副本
lishixin/Article/program/Oracle/201311/18621
3. 分布式資料庫的分布式資料庫相對傳統集中式資料庫的優點
大數據時代,面對日益增長的海量數據,傳統的集中式資料庫的弊端日益顯現,分布式資料庫相對傳統的集中式資料庫有如下優點。
● 更高的數據訪問速度:分布式資料庫為了保證數據的高可靠性,往往採用備份的策略實現容錯,所以,在讀取數據的時候,客戶端可以並發地從多個
備份伺服器同時讀取,從而提高了數據訪問速度。
● 更強的可擴展性:分布式資料庫可以通過增添存儲節點來實現存儲容量的線性擴展,而集中式資料庫的可擴展性十分有限。
● 更高的並發訪問量:分布式資料庫由於採用多台主機組成存儲集群,所以相對集中式資料庫,它可以提供更高的用戶並發訪問量。
4. 分布式資料庫系統的主要優點
(1)具有靈活的體系結構。
(2)適應分布式的管理和控制機構。
(3)經濟性能優越。
(4)系統的可靠性高、可用性好。
(5)局部應用的響應速度快。
(6)可擴展性好,易於集成現有系統。
5. 使用分布式資料庫有什麼優勢
華為雲、阿里雲、騰訊雲都推出了分布式資料庫服務。
無限擴容
自動水平拆分。
支持字元串、數字、日期等多種拆緯度。
業務不中斷平滑擴容。
性能卓越
性能通過水平擴展可線性提升。
簡單易用
兼容MYSQL 協議、語法、客戶端。
輕松數據導入,資料庫上雲。
一鍵實現資料庫擴容。
業務零代碼改動,實現讀寫分離。
快速部署
可在線快速部署實例,節省采購、部署、配置等自建資料庫工作,縮短項目周期,幫助業務快速上線。
低成本
穩定的產品,完善的運維和技術支持,相比開源產品總體性價比更高;多種實例規格配置覆蓋不同業務規模場景,按需購買。
單機資料庫容易產生容量與性能瓶頸
當前的硬體條件下,主流資料庫可以支持單表千萬級數據量的存儲,但是難以支撐密集的並發讀寫,存在性能瓶頸。
傳統的分區分表或分庫方案限制太多
採用分區表方案,數據不能跨實例存儲,擴展性和維護性較差。
採用分庫方案,客戶端需要自行管理各庫連接,資料庫連接管理和升級復雜,擴容遷移困難。
單機資料庫伺服器成本高昂
普通X86伺服器支撐能力有限,品牌廠商的伺服器價格高昂,通過增加硬體規格來提升並發性能的成本太高,且能到達的性能高度有限。
數據分布存儲
DDM採用水平拆分方式,將數據記錄數龐大的單表,按指定的拆分規則,分布式存儲到各個分片中。同時DDM提供路由分發功能,應用服務無需考慮數據該寫入哪個分片,該從哪個分片讀取。
讀寫分離
用戶可以根據數據讀取壓力負載情況,為每個RDS實例配置一個或者多個只讀實例,提高查詢並發性能。
高性能
在實際業務訪問中,SQL主要的性能瓶頸集中在物理資料庫節點上。
DDM實例關聯多個RDS節點,減少單個RDS存儲的數據量,同時實現並行計算,支持PB級數據量訪問,以及百萬級高並發。
在線平滑擴容
DDM在不中斷業務的情況下,支持新增RDS實例,水平擴容存儲空間。一鍵式擴容,輕松解決單機資料庫的容量瓶頸。
單機資料庫的現狀與困境
隨著互聯網飛速發展,企業數據越來越龐大,應用對性能要求也越來越高。單機資料庫對大批量數據的處理存在一定的局限性:
DDM輕松應對海量數據與高並發
DDM解決了單機關系型資料庫對硬體依賴性強、擴展能力有限、數據量增大後擴容困難、資料庫響應變慢等難題,通過分布式集群架構方案實現了「平滑擴容」,擴容過程中保持業務不中斷。
6. 集中式數據處理和分布式數據處理的優缺點
集中式數據處理優點:
1、部署結構簡單。
2、數據容易備份,只需要把中央計算機上的數據備份即可。
3、不易感染病毒,只要對中央計算機做好保護,終端一般不需要外接設備,感染病毒的幾率很低。
4、總費用較低,中央計算機的功能非常強大,終端只需要簡單、便宜的設備。
缺點:
1、中央計算機需要執行所有的運算,當終端很多時,會導致響應速度變慢。
2、如果終端用戶有不同的需要,要對每個用戶的程序和資源做單獨的配置,在集中式系統上做起來比較困難,而且效率不高。
分布式數據處理優點:
1、分布式網路中的每台機器都能存儲和處理數據,降低了對機器性能的要求,所以不必購買昂貴的高性能機器,這大大降低了硬體投資成本。
2、擴展性極佳。在當前系統存儲或計算能力不足時,可以簡單地通過增加廉價PC機的方式來增加系統的處理和存儲能力。
3、處理能力極強。龐大的計算任務可以在合理分割後由分布式網路中的機器並行地處理
缺點
1、計算程序全負荷運行時仍會對計算機的各個部件造成一定壓力。
2、對項目方來說,參加分布式計算的志願者不是項目方自己的人員,不是全體可信任,因此必須引入一定的冗餘計算機制,才能防止計算錯誤、惡意作弊等。
(6)分布式資料庫優勢擴展閱讀
分布式計算為信息不只分布在一個軟體或計算機上,而是分布於多個軟體上,可以用多台或一台計算機同時運行若干個軟體,通過網路實現信息的共享。與其他演算法相比,分布式演算法有明顯的優勢:
1、共享資源更加方便。
2、能夠實現計算負載的平衡,用多台計算機同時處理任務。
3、可以根據實際需要合理選擇適當的計算機運行該程序。計算機分布式計算的靈魂是平衡負載和共享資源。分布式計算具有高效、快捷、准確的優勢
7. 分布式資料庫相比自建資料庫具備哪些優勢
自建資料庫:
容易產生容量與性能瓶頸
當前的硬體條件下,主流資料庫可以支持單表千萬級數據量的存儲,但是難以支撐密集的並發讀寫,存在性能瓶頸。
分區分表或分庫方案限制太多
採用分區表方案,數據不能跨實例存儲,擴展性和維護性較差。
採用分庫方案,客戶端需要自行管理各庫連接,資料庫連接管理和升級復雜,擴容遷移困難。
伺服器成本高昂
普通X86伺服器支撐能力有限,品牌廠商的伺服器價格高昂,通過增加硬體規格來提升並發性能的成本太高,且能到達的性能高度有限。
在分布式資料庫面前,上面這些都不是問題,有很長廠商都已經把分布式資料庫做的不錯了,如阿里雲,華為雲等。
如下以我熟悉的華為雲分布式資料庫中間件DDM為例為你介紹下,如果感興趣可以去官網了解一下,現在好像還有試用活動:華為雲分布式資料庫中間件DDM
分布式資料庫:
數據分布存儲
DDM採用水平拆分方式,將數據記錄數龐大的單表,按指定的拆分規則,分布式存儲到各個分片中。同時DDM提供路由分發功能,應用服務無需考慮數據該寫入哪個分片,該從哪個分片讀取。
讀寫分離
用戶可以根據數據讀取壓力負載情況,為每個RDS實例配置一個或者多個只讀實例,提高查詢並發性能。
高性能
在實際業務訪問中,SQL主要的性能瓶頸集中在物理資料庫節點上。
DDM實例關聯多個RDS節點,減少單個RDS存儲的數據量,同時實現並行計算,支持PB級數據量訪問,以及百萬級高並發。
在線平滑擴容
DDM在不中斷業務的情況下,支持新增RDS實例,水平擴容存儲空間。一鍵式擴容,輕松解決單機資料庫的容量瓶頸。
8. 分布式資料庫的特徵
分布式資料庫的特徵:
1、獨立透明性
數據獨立性是資料庫方法追求的主要目標之一,分布透明性指用戶不必關心數據的邏輯分區,不必關心數據物理位置分布的細節,也不必關心重復副本(冗餘數據)的一致性問題,同時也不必關心局部場地上資料庫支持哪種數據模型。
分布透明性的優點是很明顯的。有了分布透明性,用戶的應用程序書寫起來就如同數據沒有分布一樣。當數據從一個場地移到另一個場地時不必改寫應用程序。
當增加某些數據的重復副本時也不必改寫應用程序。數據分布的信息由系統存儲在數據字典中。用戶對非本地數據的訪問請求由系統根據數據字典予以解釋、轉換、傳送。
2、復制透明性
用戶不用關心資料庫在網路中各個節點的復制情況,被復制的數據的更新都由系統自動完成。在分布式資料庫系統中,可以把一個場地的數據復制到其他場地存放,應用程序可以使用復制到本地的數據在本地完成分布式操作,避免通過網路傳輸數據,提高了系統的運行和查詢效率。
但是對於復制數據的更新操作,就要涉及到對所有復制數據的更新。
3、易於擴展性
在大多數網路環境中,單個資料庫伺服器最終會不滿足使用。如果伺服器軟體支持透明的水平擴展,那麼就可以增加多個伺服器來進一步分布數據和分擔處理任務。
主要優點:
(1)具有靈活的體系結構。
(2)適應分布式的管理和控制機構。
(3)經濟性能優越。
(4)系統的可靠性高、可用性好。
(5)局部應用的響應速度快。
(6)可擴展性好,易於集成現有系統。