❶ 分布式和集中式數據資源的調度有何不同
1)集中式數據處理
集中式計算機網路由一個大型的中央系統,其終端是客戶機,數據全部存儲在中央系統,由資料庫管理系統進行管理,所有的處理都由該大型系統完成,終端只是用來輸入和輸出。終端自己不作任何處理,所有任務都在主機上進行處理。
集中式數據存儲的主要特點是能把所有數據保存在一個地方,各地辦公室的遠程終端通過電纜同中央計算機(主機)相聯,保證了每個終端使用的都是同一信息。備份數據容易,因為他們都存儲在伺服器上,而伺服器是唯一需要備份的系統。這還意味這伺服器是唯一需要安全保護的系統,終端沒有任何數據。銀行的自動提款機(ATM)採用的就是集中式計算機網路。另外所有的事務都在主機上進行處理,終端也不需要軟碟機,所以網路感染病毒的可能性很低。這種類型的網路總費用比較低,因為主機擁有大量存儲空間、功能強大的系統,而使終端可以使用功能簡單而便宜的微機和其他終端設備。
這類網路不利的一面是來自所有終端的計算都由主機完成,這類網路處理速度可能有些慢。另外,如果用戶有各種不同的需要,在集中式計算機網路上滿足這些需要可能是十分困難的,因為每個用戶的應用程序和資源都必須單獨設置,而讓這些應用程序和資源都在同一台集中式計算機上操作,使得系統效率不高。還有,因為所有用戶都必須連接到一台中央計算機,集中連接可能成為集中式網路的一個大問題。由於這些限制,如今的大多數網路都採用了分布式和協作式網路計算模型。
2)分布式數據處理
由於個人計算機的性能得到極大的提高及其使用的普及,使處理能力分布到網路上的所有計算機成為可能。分布式計算是和集中式計算相對立的概念,分布式計算的數據可以分布在很大區域。
分布式網路中,數據的存儲和處理都是在本地工作站上進行的。數據輸出可以列印,也可保存在軟盤上。通過網路主要是得到更快、更便捷的數據訪問。因為每台計算機都能夠存儲和處理數據,所以不要求伺服器功能十分強大,其價格也就不必過於昂貴。這種類型的網路可以適應用戶的各種需要,同時允許他們共享網路的數據、資源和服務。在分布式網路中使用的計算機既能夠作為獨立的系統使用,也可以把它們連接在一起得到更強的網路功能。
❷ 分布式存儲和傳統存儲比較在哪些應用場景比較有優勢
1、分布式存儲優勢
分布式存儲可以使生產系統在線運行的情況下進行縱向擴展(Scale-Up)或橫向擴展(Scale-Out),且存儲系統在擴展後可以達到容量與性能均線性擴展的效果。其具有以下特性:
高性能
分布式存儲系統能夠將所有存儲節點的處理器資源、硬碟資源、網路資源進行整合,將任務切分給多台存儲節點,進行並發數據處理,避免了單個硬碟或設備造成的瓶頸,提升整個集群的處理能力。分布式存儲系統具有良好的性能擴展能力,可以滿足應用程序對存儲性能不斷增長的要求。
高擴展性
分布式存儲系統通過擴展集群存儲節點規模從而提高系統存儲容量、計算和性能的能力,通過增加和升級伺服器硬體,或者指通過增加存儲節點數量來提升服務能力。分布式存儲系統支持在線增加存儲節點,對前端業務透明,系統整體性能與存儲節點數量呈線性關系。
高可用性
分布式存儲系統同時基於硬體及軟體設計了高可用機制,在面對多種異常時(如存儲節點宕機、網路中斷、硬碟故障、數據損壞等)仍可提供正常服務,提高分布式存儲系統硬體的可用性可以通過增加存儲節點數量或者採用多種硬體冗餘機制保證。分布式存儲系統多採用副本機制或糾刪碼機制保證數據的高可用性,副本機制可以提供較高的數據冗餘度,但會降低存儲系統有效空間的利用率,糾刪碼機制可以在保證一定數據冗餘度的情況下,大幅提高存儲系統的有效空間利用率。
高安全性
分布式存儲系統支持可靠的許可權控制及互信確認機制,同時採用私有的數據切片及數據編碼機制,可以從多重角度保證集群系統不受惡意訪問和攻擊,保護存儲數據不被竊取。
2、分布式存儲應用場景
分布式的「四高」特性,使得其在高性能計算、大數據視頻雲及大數據分析等應用場景中有著廣泛的應用。
高性能計算場景
在如氣象氣候、地質勘探、航空航天、工程計算、材料工程等領域,基於集群的高性能計算,已成為必需的輔助工具。集群系統有極強的伸縮性,可通過在集群中增加或刪減節點的方式,在不影響原有應用與計算任務的情況下,隨時增加和降低系統的處理能力。根據不同的計算模式與規模,構成集群系統的節點數可以從幾個到成千上萬個。這些業務對後端的存儲系統提出了新的需求,包括統一的存儲空間、高效率的文件檢索、高帶寬的吞吐性能,高可靠的數據安全保障等。
大數據視頻雲應用場景
隨著視頻高清技術及超高清技術的普及,視頻大數據應用場景,如雪亮工程、平安城市、廣電媒資、影視製作、視頻網站等領域,對存儲設備提出了大容量、高讀寫性能、高可靠性、低延時及可擴展性等需求。針對這樣大規模視頻數據應用場景,就需要一個技術先進、性能優越的存儲系統作為後端數據存儲的支撐者。
大數據分析應用場景
伴隨著互聯網技術及人工智慧的發展,各種基於海量用戶/數據/終端的大數據分析及人工智慧業務模式不斷涌現,同樣需要充分考慮存儲功能集成度、數據安全性、數據穩定性,系統可擴展性、性能及成本各方面因素。
在數據爆發增長的「數字時代」,軟體定義的分布式存儲是存儲技術高速發展的結晶,並具有著很大的成長空間,必將應用於更廣泛的大數據業務場景。
❸ 分布式塊存儲和 分布式文件存儲有是什麼區別
分布式塊存儲和 分布式文件存儲有是什麼區別
分布式文件系統(dfs)和分布式資料庫都支持存入,取出和刪除。但是分布式文件系統比較暴力,可以當做key/value的存取。分布式資料庫涉及精煉的數據,傳統的分布式關系型資料庫會定義數據元組的schema,存入取出刪除的粒度較小。
分布式文件系統現在比較出名的有GFS(未開源),HDFS(Hadoop distributed file system)。分布式資料庫現在出名的有Hbase,oceanbase。其中Hbase是基於HDFS,而oceanbase是自己內部實現的分布式文件系統,在此也可以說分布式資料庫以分布式文件系統做基礎存儲。
分布式存儲是什麼?選擇什麼樣的分布式存儲更好?
分布式存儲系統,是將數據分散存儲在多台獨立的設備上。傳統的網路存儲系統採用集中的存儲伺服器存放所有數據,存儲伺服器成為系統性能的瓶頸,也是可靠性和安全性的焦點,不能滿足大規模存儲應用的需要。分布式網路存儲系統採用可擴展的系統結構,利用多台存儲伺服器分擔存儲負荷,利用位置伺服器定位存儲信息,它不但提高了系統的可靠性、可用性和存取效率,還易於擴展。
聯想超融合ThinkCloud AIO超融合雲一體機是聯想針對企業級用戶推出的核心產品。ThinkCloud AIO超融合雲一體機實現了對雲管理平台、計算、網路和存儲系統的無縫集成,構建了雲計算基礎設施即服務的一站式解決方案,為用戶提供了一個高度簡化的一站式基礎設施雲平台。這不僅使得業務部署上線從周縮短到天,而且與企業應用軟體、中間件及資料庫軟體完全解耦,能夠有效提升企業IT基礎設施運維管理的效率和關鍵應用的性能
MongoDB 適合做分布式圖片文件存儲么?
如果硬體上捨得投入(比如N台32GB起的大內存機),gridfs很合適海量小文件, 不過兩台機我覺得還不如把靜態文件這塊外包給第三方雲存儲
軟體定義存儲和 分布式存儲的區別
軟體定義存儲其實是個偽命題,你可以看下冬瓜哥的一篇文章。你也可以這么理解,分布式存儲就是軟體定義存儲的一種方式。
集中式存儲和分布式存儲有什麼區別
分布式 存儲就是DAS ,就是伺服器裡面放著硬碟,多台伺服器的話就是分布式存儲,數據分散,不易於管理。
集中存儲就是 NAS,SAN,將伺服器和硬碟分開,數據都存放NAS設備中,NAS設備再級聯磁碟陣列,然後多個伺服器對這個NAS設備進行訪問,操作,集中數據管理,提高利用率,解放伺服器!
分布式存儲與軟體定義存儲的區別?
分布式存儲是一種存儲的方式,其「分布式」的理念是軟體定義存儲的基礎,從概念上來說,軟體定義存儲的范圍更大,除了存儲之外,還包括管理、計算、網路介面等相關概念。或者說,分布式存儲就是一種鏈接方式,而軟體定義存儲就是類似元核雲存儲、華為等企業所研發的軟體產品。
統一存儲和融合存儲以及分布式存儲的區別
統一存儲具體概念:
統一存儲,實質上是一個可以支持基於文件的網路附加存儲(NAS)以及基於數據塊的SAN的網路化的存儲架構。由於其支持不同的存儲協議為主機系統提供數據存儲,因此也被稱為多協議存儲。
基本簡介:
統一存儲(有時也稱網路統一存儲或者NUS)是一個能在單一設備上運行和管理文件和應用程序的存儲系統。為此,統一存儲系統在一個單一存儲平台上整合基於文件和基於塊的訪問,支持基於光纖通道的SAN、基於IP的SAN(iSCSI)和NAS(網路附加存儲)。
工作方式:
既然是一個集中化的磁碟陣列,那麼就支持主機系統通過IP網路進行文件級別的數據訪問,或通過光纖協議在SAN網路進行塊級別的數據訪問。同樣,iSCSI亦是一種非常通用的IP協議,只是其提供塊級別的數據訪問。這種磁碟陣列配置多埠的存儲控制器和一個管理介面,允許存儲管理員按需創建存儲池或空間,並將其提供給不同訪問類型的主機系統。最通常的協議一般都包括了NAS和FC,或iSCSI和FC。當然,也可以同時支持上述三種協議的,不過一般的存儲管理員都會選FC或iSCSI中的一種,它們都提供塊級別的訪問方式,和文件級別的訪問方式(NAS方式)組成統一存儲。
什麼是分布式數據存儲
定義:
分布式資料庫是指利用高速計算機網路將物理上分散的多個數據存儲單元連接起來組成一個邏輯上統一的資料庫。分布式資料庫的基本思想是將原來集中式資料庫中的數據分散存儲到多個通過網路連接的數據存儲節點上,以獲取更大的存儲容量和更高的並發訪問量。近年來,隨著數據量的高速增長,分布式資料庫技術也得到了快速的發展,傳統的關系型資料庫開始從集中式模型向分布式架構發展,基於關系型的分布式資料庫在保留了傳統資料庫的數據模型和基本特徵下,從集中式存儲走向分布式存儲,從集中式計算走向分布式計算。
特點:
1.高可擴展性:分布式資料庫必須具有高可擴展性,能夠動態地增添存儲節點以實現存儲容量的線性擴展。
2 高並發性:分布式資料庫必須及時響應大規模用戶的讀/寫請求,能對海量數據進行隨機讀/寫。
3. 高可用性:分布式資料庫必須提供容錯機制,能夠實現對數據的冗餘備份,保證數據和服務的高度可靠性。
❹ 分布式存儲相對於單機存儲的挑戰是
1、分布式相比於傳統存儲系統的優點
①高性能:它通常可以高效地管理讀緩存和寫緩存,支持自動的分布式存儲通過將熱點區域2映射到高速緩存,提高響應速度。一旦不在是熱點,那麼存儲系統將會把他們移除。寫緩存技術可配合高速存儲明顯改變整體存儲的性能,按照一定的策略先將數據寫入高速存儲,再在適當的時間進行同步落盤。
②支持分布式存儲:通過網路進行松耦合鏈接,允許高速村塾和低速存儲分開部署。一定條件下分層存儲的優勢可以發揮到最佳。解決了最大的問題是當性能池讀不命中後,從冷池提取數據的粒度太大,導致延遲高,從而給造成整體的性能的抖動的問題。
③多副本一致性:他相比傳統的存儲框架使用RAID不同。它採用了多分本備份機制,存儲之前進行分片,之後按照一定的規則存在集群的節點上,為了保證數據一致性,布式存儲通常採用的是一個副本寫入,多個副本讀取的強一致性技術,讀取數據失敗,從其他副本獲取,重新寫入該副本恢復。
④容災與備份:對於容災採用最重要的手段就是快照,可以實現一定時間下的數據的保存。他有利於故障重現,有助於分析研究,避免災難,備份就是為了數據的安全性。
⑤彈性擴展:分布式存儲可預估並且彈性擴展計算、存儲容量和性能,節點擴展後,舊數據自動遷移到新節點上,實現負載均衡,避免單點問題。水平擴展只需要將節點和原來的集群鏈接到同一網路,整個過程不會對業務造成影響,當加節點時,集群系統的容量和性能隨之線性擴展,新節點資源會被平台接管,分配或吸收。
⑥存儲系統標准化:隨著分布式存儲的發展,存儲行業的標准化進程也不斷推進,分布式存儲優先採用行業標准介面(SMI-S或OpenStack Cinder)進行存儲接入,在平台層面,通過將異構存儲資源進行抽象化,將傳統的存儲設備級的操作封裝成面向存儲資源的操作,從而簡化異構存儲基礎架構的操作,以實現存儲資源的集中管理,並能夠自動執行創建、變更、回收等整個存儲生命周期流程。基於異構存儲整合的功能,用戶可以實現跨不同品牌、介質地實現容災,如用中低端陣列為高端陣列容災,用不同磁碟陣列為快閃記憶體陣列容災等等,從側面降低了存儲采購和管理成本。
2、分布式相比於傳統存儲系統的缺點
首先,從部署與維護的角度來看,分布式存儲部署過程較為復雜,需要專門的人才進行部署,維護與管理,需要一定的時間培養專門的人才。其次,從硬體設備角度來看,分布式存儲使用的均為X86架構伺服器,穩定性可能不如傳統的硬體存儲。尤其對於銀行,金融,政府等重要行業,穩定永遠大於一切,他們既是新技術的實踐者但同時也需要最穩定的環境保持業務的良好運行。最後,對於數據保護技術,大部分都是通過副本技術實現數據保護機制,常見的有兩副本三副本等,這樣也會造成可用存儲容量的降低。
❺ 分布式存儲和超融合區別及優勢
分布式存儲是什麼
關於分布式存儲實際上並沒有一個明確的定義,甚至名稱上也沒有一個統一的說法,大多數情況下稱作 Distributed Data Store 或者 Distributed Storage System。
其中維基網路中給 Distributed data store 的定義是:分布式存儲是一種計算機網路,它通常以數據復制的方式將信息存儲在多個節點中。
在網路中給出的定義是:分布式存儲系統,是將數據分散存儲在多台獨立的設備上。分布式網路存儲系統採用可擴展的系統結構,利用多台存儲伺服器分擔存儲負荷,利用位置伺服器定位存儲信息,它不但提高了系統的可靠性、可用性和存取效率,還易於擴展。
盡管各方對分布式存儲的定義並不完全相同,但有一點是統一的,就是分布式存儲將數據分散放置在多個節點中,節點通過網路互連提供存儲服務。這一點與傳統集中式存儲將數據集中放置的方式有著明顯的區分。
超融合是什麼
參考維基網路中的超融合定義:
超融合基礎架構(hyper-converged infrastructure)是一個軟體定義的 IT 基礎架構,它可虛擬化常見「硬體定義」系統的所有元素。HCI 包含的最小集合是:虛擬化計算(hypervisor),虛擬存儲(SDS)和虛擬網路。HCI 通常運行在標准商用伺服器之上。
超融合基礎架構(hyper-converged infrastructure)與 融合基礎架構(converged infrastructure)最大的區別在於,在 HCI 裡面,無論是存儲底層抽象還是存儲網路都是在軟體層面實現的(或者通過 hypervisor 層面實現),而不是基於物理硬體實現的。由於所有軟體定義的元素都圍繞 hypervisor 實現,因此在超融合基礎架構上的所有實例可以聯合共享所有受管理的資源。
分布式存儲和超融合區別及優勢?
分布式存儲,它的最大特點是多節點部署, 數據通過網路分散放置。分布式存儲的特點是擴展性強,通過多節點平衡負載,提高存儲系統的可靠性與可用性。
超融合基礎架構從定義中明確提出包含軟體定義存儲(SDS),具備硬體解耦的能力,可運行在通用伺服器之上。超融合基礎架構與 Server SAN 提倡的理念類似,計算與存儲融合,通過全分布式的架構,有效提升系統可靠性與可用性,並具備易於擴展的特性。
SMTX ZBS 分布式塊存儲架構
除此之外,超融合基礎架構有更進一步的擴展,它強調以虛擬化計算(hypervisor)為核心,以軟體定義的方式整合包括虛擬化計算, 軟體定義存儲以及虛擬網路資源。從筆者來看超融合基礎架構未來的可能性更多,可促進計算,存儲,網路,安全,容災等等 IT 服務大融合,降低IT 基礎架構的復雜性,重新塑造」軟體定義的數據中心」。
❻ 分布存儲和集中存儲有什麼本質區別
分布式 存儲就是DAS ,就是伺服器裡面放著硬碟,多台伺服器的話就是分布式存儲,數據分散,不易於管理。
集中存儲就是 NAS,SAN,將伺服器和硬碟分開,數據都存放NAS設備中,NAS設備再級聯磁碟陣列,然後多個伺服器對這個NAS設備進行訪問,操作,集中數據管理,提高利用率,解放伺服器!
❼ 集中式數據處理和分布式數據處理的優缺點
集中式數據處理優點:
1、部署結構簡單。
2、數據容易備份,只需要把中央計算機上的數據備份即可。
3、不易感染病毒,只要對中央計算機做好保護,終端一般不需要外接設備,感染病毒的幾率很低。
4、總費用較低,中央計算機的功能非常強大,終端只需要簡單、便宜的設備。
缺點:
1、中央計算機需要執行所有的運算,當終端很多時,會導致響應速度變慢。
2、如果終端用戶有不同的需要,要對每個用戶的程序和資源做單獨的配置,在集中式系統上做起來比較困難,而且效率不高。
分布式數據處理優點:
1、分布式網路中的每台機器都能存儲和處理數據,降低了對機器性能的要求,所以不必購買昂貴的高性能機器,這大大降低了硬體投資成本。
2、擴展性極佳。在當前系統存儲或計算能力不足時,可以簡單地通過增加廉價PC機的方式來增加系統的處理和存儲能力。
3、處理能力極強。龐大的計算任務可以在合理分割後由分布式網路中的機器並行地處理
缺點
1、計算程序全負荷運行時仍會對計算機的各個部件造成一定壓力。
2、對項目方來說,參加分布式計算的志願者不是項目方自己的人員,不是全體可信任,因此必須引入一定的冗餘計算機制,才能防止計算錯誤、惡意作弊等。
(7)分布式存儲和集中式存儲性能對比擴展閱讀
分布式計算為信息不只分布在一個軟體或計算機上,而是分布於多個軟體上,可以用多台或一台計算機同時運行若干個軟體,通過網路實現信息的共享。與其他演算法相比,分布式演算法有明顯的優勢:
1、共享資源更加方便。
2、能夠實現計算負載的平衡,用多台計算機同時處理任務。
3、可以根據實際需要合理選擇適當的計算機運行該程序。計算機分布式計算的靈魂是平衡負載和共享資源。分布式計算具有高效、快捷、准確的優勢
❽ 分布式資料庫的分布式資料庫相對傳統集中式資料庫的優點
大數據時代,面對日益增長的海量數據,傳統的集中式資料庫的弊端日益顯現,分布式資料庫相對傳統的集中式資料庫有如下優點。
● 更高的數據訪問速度:分布式資料庫為了保證數據的高可靠性,往往採用備份的策略實現容錯,所以,在讀取數據的時候,客戶端可以並發地從多個
備份伺服器同時讀取,從而提高了數據訪問速度。
● 更強的可擴展性:分布式資料庫可以通過增添存儲節點來實現存儲容量的線性擴展,而集中式資料庫的可擴展性十分有限。
● 更高的並發訪問量:分布式資料庫由於採用多台主機組成存儲集群,所以相對集中式資料庫,它可以提供更高的用戶並發訪問量。
❾ 集中式存儲和分布式存儲的區別在哪裡如何選擇
如今全球數據存儲量呈現爆炸式增長,企業及互聯網數據以每年50%的速率在增長,據Gartner預測,到2020年,全球數據量將達到35ZB,等於80億塊4TB硬碟。數據結構變化給存儲系統帶來新的挑戰。非結構化數據在存儲系統中所佔據比例已接近80%。
互聯網的發展使得數據創造的主體由企業逐漸轉向個人用戶,而個人所產生的絕大部分數據均為圖片、文檔、視頻等非結構化數據;企業辦公流程更多通過網路實現,表單、票據等都實現了以非結構化為主的數字化存檔;同時,基於資料庫應用的結構化數據仍然在企業中占據重要地位,存儲大量的核心信息。
數據業務的急劇增加,傳統單一的SAN存儲或NAS存儲方式已經不適應業務發展需要。SAN存儲:成本高,不適合PB級大規模存儲系統。數據共享性不好,無法支持多用戶文件共享。NAS存儲:共享網路帶寬,並發性能差。隨系統擴展,性能會進一步下降。因此,集中式存儲再次活躍。
那麼集中式存儲和分布式存儲的有缺點分別有哪些呢?在面對二者時我們該如何選擇呢?下面我將為大家介紹和分析集中式存儲和分布式存儲的不同之處以及在應用中我們應做的選擇。
分布式和集中式存儲的選擇
集中存儲的優缺點是,物理介質集中布放;視頻流上傳到中心對機房環境要求高,要求機房空間大,承重、空調等都是需要考慮的問題。
分布存儲,集中管理的優缺點是,物理介質分布到不同的地理位置;視頻流就近上傳,對骨幹網帶寬沒有什麼要求;可採用多套低端的小容量的存儲設備分布部署,設備價格和維護成本較低;小容量設備分布部署,對機房環境要求低。