1. 什麼是分布式數據存儲
什麼是分布式存儲
這個詞彙是源於國外,簡稱是DSS,簡單來說,就是存儲設備分布在不同的地理位置,數據就近存儲,將數據分散在多個存儲節點上,各個節點通過網路相連,對這些節點的資源進行統一的管理,從而大大緩解帶寬壓力,同時也解決了傳統的本地文件系統在文件大小、文件數量等方面的限制。
為什麼分布式存儲這么重要
分布式存儲的誕生有著很強的優越性,主要體現在靈活性、速度、成本等方面。
靈活性方面:分布式存儲系統使用強大的標准伺服器(在CPU,RAM以及網路連接/介面中),它不再需要專門的盒子來處理存儲功能。而且允許標准伺服器運行存儲,這是一項重大突破,這意味著簡化IT堆棧並為數據中心創建單個構建塊。通過添加更多伺服器進行擴展,從而線性地增加容量和性能。
速度方面:如果你研究一個專門的存儲陣列,你會發現它本質上是一個伺服器,但是他只能用於存儲,為了擁有快速存儲系統,你要花費的成本非常高。即使在今天大多數系統中,當你為存儲系統進行擴展時,也不會提高整個系統的性能,因為所有流量都必須通過「頭節點」或主伺服器(充當管理節點)。但是在分布式存儲系統中,任何伺服器都有CPU,RAM,驅動器和網路介面,它們都表現為一個組。因此,每次添加伺服器時,都會增加總資源池,從而提高整個系統的速度。
成本方面:分布式存儲組織將最大限度地降低基礎設施成本高達90%!沒錯,是90%,因為驅動器和網路所花費的成本非常低,極大的提高了伺服器的使用效率,同時,數據中心所花費的電力、空調費、所佔空間等費用也減少了,管理起來更加方面,所需要的人也更少。這也是為什麼如今各大公司都在部署分布式存儲。
2. 如何實現高性能分布式文件存儲
其實分布式文件存儲,最復雜的就是元數據的保存和處理,而我使用的XGFS文件存儲軟體只需要三個全快閃記憶體元數據高可用節點,就可以高效保存和處理 100 億文件規模的數據,可以靈活擴展,滿足公司不斷增長的業務對性能和容量的需求,XSKY星辰天合這款產品還是很有性價比的。
3. 分布式存儲有哪幾種類型
分布式存儲,分為文件存儲,塊存儲和對象存儲,是存儲設備提供的不同類型的服務,適配不同的使用場景。
分布式是存儲設備的部署方式,是部署在一台機器上,還是一個多台設備組成的集群中。軟體定義這個概念比較寬泛,是指通過軟體功能來實現曾經通過專用硬體完成的工作,也就是說,對於存儲硬體已經沒有要求了,用通用硬體+存儲軟體來實現將一台伺服器,變成存儲設備。其實無論是不是軟體定義存儲,其內部都運行著存儲系統軟體,把這個詞單拿出來,就是更加強調其對於硬體的無要求。
4. 分布式存儲和超融合區別及優勢
分布式存儲是什麼
關於分布式存儲實際上並沒有一個明確的定義,甚至名稱上也沒有一個統一的說法,大多數情況下稱作 Distributed Data Store 或者 Distributed Storage System。
其中維基網路中給 Distributed data store 的定義是:分布式存儲是一種計算機網路,它通常以數據復制的方式將信息存儲在多個節點中。
在網路中給出的定義是:分布式存儲系統,是將數據分散存儲在多台獨立的設備上。分布式網路存儲系統採用可擴展的系統結構,利用多台存儲伺服器分擔存儲負荷,利用位置伺服器定位存儲信息,它不但提高了系統的可靠性、可用性和存取效率,還易於擴展。
盡管各方對分布式存儲的定義並不完全相同,但有一點是統一的,就是分布式存儲將數據分散放置在多個節點中,節點通過網路互連提供存儲服務。這一點與傳統集中式存儲將數據集中放置的方式有著明顯的區分。
超融合是什麼
參考維基網路中的超融合定義:
超融合基礎架構(hyper-converged infrastructure)是一個軟體定義的 IT 基礎架構,它可虛擬化常見「硬體定義」系統的所有元素。HCI 包含的最小集合是:虛擬化計算(hypervisor),虛擬存儲(SDS)和虛擬網路。HCI 通常運行在標准商用伺服器之上。
超融合基礎架構(hyper-converged infrastructure)與 融合基礎架構(converged infrastructure)最大的區別在於,在 HCI 裡面,無論是存儲底層抽象還是存儲網路都是在軟體層面實現的(或者通過 hypervisor 層面實現),而不是基於物理硬體實現的。由於所有軟體定義的元素都圍繞 hypervisor 實現,因此在超融合基礎架構上的所有實例可以聯合共享所有受管理的資源。
分布式存儲和超融合區別及優勢?
分布式存儲,它的最大特點是多節點部署, 數據通過網路分散放置。分布式存儲的特點是擴展性強,通過多節點平衡負載,提高存儲系統的可靠性與可用性。
超融合基礎架構從定義中明確提出包含軟體定義存儲(SDS),具備硬體解耦的能力,可運行在通用伺服器之上。超融合基礎架構與 Server SAN 提倡的理念類似,計算與存儲融合,通過全分布式的架構,有效提升系統可靠性與可用性,並具備易於擴展的特性。
SMTX ZBS 分布式塊存儲架構
除此之外,超融合基礎架構有更進一步的擴展,它強調以虛擬化計算(hypervisor)為核心,以軟體定義的方式整合包括虛擬化計算, 軟體定義存儲以及虛擬網路資源。從筆者來看超融合基礎架構未來的可能性更多,可促進計算,存儲,網路,安全,容災等等 IT 服務大融合,降低IT 基礎架構的復雜性,重新塑造」軟體定義的數據中心」。
5. 現階段的區塊鏈技術中的分布式儲存與傳統的相比的差異是什麼
一是區塊鏈每個節點都按照塊鏈式結構存儲完整的數據,傳統分布式存儲一般是將數據按照一定的規則分成多份進行存儲。
二是區塊鏈每個節點存儲都是獨立的、地位等同的,依靠共識機制保證存儲的一致性,而傳統分布式存儲一般是通過中心節點往其他備份節點同步數據。
數據節點可以是不同的物理機器,也可以是雲端不同的實例。
以上就是金窩窩網路分析的區塊鏈技術中與傳統的分布式儲存的差異化,可供參考。
6. 分布式文件存儲系統通過什麼方式提高可用性和安全性
分布式存儲的六大優點
1. 高性能
一個具有高性能的分布式存戶通常能夠高效地管理讀緩存和寫緩存,並且支持自動的分級存儲。分布式存儲通過將熱點區域內數據映射到高速存儲中,來提高系統響應速度;一旦這些區域不再是熱點,那麼存儲系統會將它們移出高速存儲。而寫緩存技術則可使配合高速存儲來明顯改變整體存儲的性能,按照一定的策略,先將數據寫入高速存儲,再在適當的時間進行同步落盤。
2. 支持分級存儲
由於通過網路進行松耦合鏈接,分布式存儲允許高速存儲和低速存儲分開部署,或者任意比例混布。在不可預測的業務環境或者敏捷應用情況下,分層存儲的優勢可以發揮到最佳。解決了目前緩存分層存儲最大的問題是當性能池讀不命中後,從冷池提取數據的粒度太大,導致延遲高,從而給造成整體的性能的抖動的問題。
3. 多副本的一致性
與傳統的存儲架構使用RAID模式來保證數據的可靠性不同,分布式存儲採用了多副本備份機制。在存儲數據之前,分布式存儲對數據進行了分片,分片後的數據按照一定的規則保存在集群節點上。為了保證多個數據副本之間的一致性,分布式存儲通常採用的是一個副本寫入,多個副本讀取的強一致性技術,使用鏡像、條帶、分布式校驗等方式滿足租戶對於可靠性不同的需求。在讀取數據失敗的時候,系統可以通過從其他副本讀取數據,重新寫入該副本進行恢復,從而保證副本的總數固定;當數據長時間處於不一致狀態時,系統會自動數據重建恢復,同時租戶可設定數據恢復的帶寬規則,最小化對業務的影響。
4. 容災與備份
在分布式存儲的容災中,一個重要的手段就是多時間點快照技術,使得用戶生產系統能夠實現一定時間間隔下的各版本數據的保存。特別值得一提的是,多時間點快照技術支持同時提取多個時間點樣本同時恢復,這對於很多邏輯錯誤的災難定位十分有用,如果用戶有多台伺服器或虛擬機可以用作系統恢復,通過比照和分析,可以快速找到哪個時間點才是需要回復的時間點,降低了故障定位的難度,縮短了定位時間。這個功能還非常有利於進行故障重現,從而進行分析和研究,避免災難在未來再次發生。多副本技術,數據條帶化放置,多時間點快照和周期增量復制等技術為分布式存儲的高可靠性提供了保障。
5. 彈性擴展
得益於合理的分布式架構,分布式存儲可預估並且彈性擴展計算、存儲容量和性能。分布式存儲的水平擴展有以下幾個特性:
1) 節點擴展後,舊數據會自動遷移到新節點,實現負載均衡,避免單點過熱的情況出現;
2) 水平擴展只需要將新節點和原有集群連接到同一網路,整個過程不會對業務造成影響;
3) 當節點被添加到集群,集群系統的整體容量和性能也隨之線性擴展,此後新節點的資源就會被管理平台接管,被用於分配或者回收。
6. 存儲系統標准化
隨著分布式存儲的發展,存儲行業的標准化進程也不斷推進,分布式存儲優先採用行業標准介面(SMI-S或OpenStack Cinder)進行存儲接入。在平台層面,通過將異構存儲資源進行抽象化,將傳統的存儲設備級的操作封裝成面向存儲資源的操作,從而簡化異構存儲基礎架構的操作,以實現存儲資源的集中管理,並能夠自動執行創建、變更、回收等整個存儲生命周期流程。基於異構存儲整合的功能,用戶可以實現跨不同品牌、介質地實現容災,如用中低端陣列為高端陣列容災,用不同磁碟陣列為快閃記憶體陣列容災等等,從側面降低了存儲采購和管理成本。
7. 什麼是分布式存儲
分布式存儲系統,是將數據分散存儲在多台獨立的設備上。傳統的網路存儲系統採用集中的存儲伺服器存放所有數據,存儲伺服器成為系統性能的瓶頸,也是可靠性和安全性的焦點,不能滿足大規模存儲應用的需要。分布式網路存儲系統採用可擴展的系統結構,利用多台存儲伺服器分擔存儲負荷,利用位置伺服器定位存儲信息,它不但提高了系統的可靠性、可用性和存取效率,還易於擴展。
(7)分布式存儲硬解擴展閱讀:
分布式存儲,集中管理,在這個方案中,共有三級:
1、上級監控中心:上級監控中心通常只有一個,主要由數字矩陣、認證伺服器和VSTARClerk軟體等。
2、本地監控中心:本地監控中心可以有多個,可依據地理位置設置,或者依據行政隸屬關系設立,主要由數字矩陣、流媒體網關、iSCSI存儲設備、VSTARRecorder軟體等組成;音視頻的數據均主要保存在本地監控中心,這就是分布式存儲的概念。
3、監控前端:主要由攝像頭、網路視頻伺服器組成,其中VE4000系列的網路視頻伺服器可以帶硬碟,該硬碟主要是用於網路不暢時,暫時對音視頻數據進行保存,或者需要在前端保存一些重要數據的情況。
8. 什麼是分布式存儲
分布式存儲簡單的來說,就是將數據分散存儲到多個存儲伺服器上,並將這些分散的存儲資源構成一個虛擬的存儲設備,實際上數據分散的存儲在企業的各個角落。
還可以這樣理解:
利用分布式技術將標准X86伺服器的本地HDD、SSD等存儲介質組織成一個大規模存儲資源池,同時,對上層的應用和虛擬機提供工業界標準的SCSI、iSCSI和對象訪問介面,進而打造一個虛擬的分布式統一存儲產品。
9. 分布存儲和集中存儲有什麼本質區別
分布式 存儲就是DAS ,就是伺服器裡面放著硬碟,多台伺服器的話就是分布式存儲,數據分散,不易於管理。
集中存儲就是 NAS,SAN,將伺服器和硬碟分開,數據都存放NAS設備中,NAS設備再級聯磁碟陣列,然後多個伺服器對這個NAS設備進行訪問,操作,集中數據管理,提高利用率,解放伺服器!