vsan存儲有冗餘_VSAN存儲環境不穩定存儲空間突然變成0是什麼原因

1. vsan網路分區組如何調整

一種解決方法：把vlan信息刪掉，在虛擬交換機中把vlan標簽刪掉即可。第二種解決方法：把交換機埠開啟trunk即可。 Virtual SAN (VSAN) 可以為對象創建鏡像。這種功能可在一種策略（即虛擬機存儲策略，又稱基於存儲策略的管理）來定義。此時，您可以將名為「failures to tolerate（允許的故障數目）」的選項定義為 0和 3 之間的任意數字。默認情況下，此選項設置為 1。這意味著，數據會有兩個副本。除了 VSAN 之外，還需要一個見證/仲裁，以幫助您確定發生事件後所有者是誰。那麼，情況會是怎樣的呢？請注意，在下圖中，為了簡單起見，我會使用術語「vmdk」和「見證」，實際上，這可以是虛擬機中的任何一種組件。

2. VSAN存儲環境不穩定，存儲空間突然變成0，是什麼原因

可以參考這里的VMware VSAN（1.0版）中文版FAQ：，
主機配置
Q1.在1.0 版本中，一個VSAN 集群中至少需要幾台主機？
A1.3 台

Q2.至少需要多少台主機貢獻本地存儲？
A2.至少需要3 台主機貢獻本地存儲

Q3.是否VSAN 集群中的所有ESXi主機都需要貢獻存儲？
A3.不是。主機可以不貢獻本地存儲，只使用vsanDatastore。但是作為最佳實踐，VMware推薦所有主機的配置都類似/相同。

Q4.對1.0 版本而言，VSAN集群中最多可以有幾台主機？
A4.VSAN設計的上限是vSphere集群，但是在beta版本中，我們加了一個軟限制：每個集群的最大節點數目是8。

Q5.那些不為集群貢獻本地存儲的主機，也計入8台主機的軟限制中么？
A5.是的。VSAN中的所有主機，不管它是否貢獻本地存儲，都會被計算入「每個集群8台主機」的軟限制中。

Q6.VSAN 需要哪個版本的vSphere？
A6.vSphere5.5。VSAN已經包含在這個發行版中，不需要額外安裝組件或者VIB。

Q7.如何擴大VSAN集群？
A7.和添加1台主機到集群中一樣容易。

3. 如何理解cisco企業架構

思科系統公司(Cisco Systems, Inc.)，簡稱侍信思科公司或思科，1984年12月正式成立，是互聯網解決方案的領先提供者，其設備和軟體產品主要用於連接計算機網路系統，總部位於美國加利福尼亞州聖何塞。1986年，Cisco第一台多協議路由器面市。1993年，思科建成了世界上第一個由1000台路由器連接的網路，由此進入了一個迅猛發展的時期。競爭方面，思科與華為一直是老對手。2012年10月，美國眾議院認定華為和中興危害其國家安全，而華為在其後的反駁中指出，華為、中興被認定威脅美國國家安全，正是思科在背後推波助瀾。正是思科在背後推波助瀾。
概述
為保護、優化和發展業務，制定任何業務連續性計劃時，都必須包含可靠的網路基礎設施，以便滿足各機構的數據保護需求，使應用能夠快速恢復正常運作，並保證用戶訪問的連續性。思科系統®公司以可以擴展、自適應的企業數據中心架構為基礎，為企業的數據中心經理提供業務連續性網路解決方案，除多種用戶訪問技術外，還能在多個數據中心和恢復站點之間提供經濟有效的通信。
挑戰
企業數據中心支持著對業務運作至關重要的很多應用，是各機構業務連續性戰略的焦點。如果應用和數據不可用，或者用戶無法訪問，企業不但會損失收入，還會降低生產率。更糟糕的是，這種情況還會破壞客戶和合作夥伴對企業的印象，或者受到法律訴訟。為實現保護、優化和發展業務的管理目標，很多IT機構都在重新思考自己的業務連續性計劃。業務連續性是對風險和威脅、新法規以及數據中心內IT與業務資源的整合趨勢高度敏感的企業最關注的問題。
目前，很多數據中心基礎設施都是分立的，不但難以管理和維護，也難以適應新技術和應用。不僅如此，一旦發生中斷或災難，相互隔離的應用環境既難以實施一致、適當的保護，維護成本又非常高。
為建立能夠支持業務永續性戰略的網路時，數據中心和業務連續性經理面臨很多問題：
磁帶備份存在很多限制——作為傳統的主流災難恢復方式，磁帶備份的速度慢，而且很難按時恢復關鍵應用和數據，因而難以滿足恢復時間的要求。但是，它在保持完整性方面所起的作用仍然不容忽視。
費用高——盡管業務連續性技術的成本近年來一直在下降，但配備鏡像軟體、冗餘設施和資源、電信服務和相應人力的成本仍然很高。因此，IT經理還需要利用一系列解決方案控制資本成本和運營成本，並保證企業能夠實現業務連續性目標。
延遲長——由於零數據損失同步鏡像要求在確認事務處理之前同時將數據寫至本地和遠程位置，因而影響了應用的性能。城域光網等傳輸技術可有效縮短延遲。一般情況下，由於光速的限制，對於多數實時事務處理應用，同步鏡像站點之間的實際距離最長為200km。
網路設施成本高——雖然帶寬成本持續下降，但大型數據中心鏡像和復制需要極高的容量。如果採用傳統的租用線路服務，這項費用將非常可觀。
用戶訪問——業務連續性計劃通常注重數據和應用可用性，但常常忽略了用戶訪問恢復數據和應用的需求。
業務連續性基本要素
業務影響評估表示了與應用停運、數據損失和用戶訪問中斷相關的風險和潛在成本。盡管最理想的情況是能夠最行春大程度地防止運行中斷和數據損失，但實現這一目標要麼成本太高，要麼不切實際。事實上，很多應用允許一定程度的停運，只有一部分關鍵業務應用需要隨時可用。風險評估利用兩個業務連續性指標對應用進行評價：
恢復點目標(RPO)——確定機構願意承受的數據損失風險，從零到幾分鍾或幾小時;
恢復時間目標(RTO)——量化應用的最長不可用時間檔談耐。
盡管RPO和RTO指標對數據和應用級評估十分有用，但思科系統公司又提出了直接適用於網路的第三個指標——恢復訪問目標(RAO)。RAO確定了將用戶恢復應用的時間，不論從哪個時間點開始恢復。如果沒有RAO，實現應用RPO和RTO的實際價值就十分有限。例如，在正常運行期間，分支機構用戶可能會通過企業內部網WAN訪問位於主數據中心內的關鍵業務應用。如果應用發生故障，用戶需要利用回退方法，例如通過互聯網服務供應商(ISP)網路快速構建站點到站點虛擬專用網(VPN)連接，與支持恢復應用的備用數據中心建立連接。
各機構必須考慮所有備用數據中心或備用站點的遠近。因為只有備用數據中心或備用站點設立得足夠遠，才能減小斷電、火山爆發、颶風或地震等災難的影響。
圖1 業務連續性解決方案示意圖
利用RPO、RTO和RAO指標以及距離要求，業務連續性經理可以為每個應用配備一個與其業務角色相對應的技術解決方案(圖1)。這些解決方案可能包含下面介紹的一個或多個選項：
高可用性存儲網路——存儲區域網(SAN)或網路連接存儲(NAS)解決方案能夠應對本地伺服器故障，因為它能夠提供對備用或集群伺服器系統的訪問，以保證連續運作。共享存儲環境可以利用高級存儲系統，保證磁碟故障不會影響應用的正常運行。
集中備份——定期備份是多數商業應用的標准操作規程的一部分。作為最便宜的解決方案，集中磁帶備份需要的恢復時間最長，但它十分適合用於防止數據受損。目前，由於磁碟存儲介質的成本已越來越接近於磁帶存儲，因此，基於磁碟的「近線」備份系統越來越受到企業的歡迎，因為它的備份時間和恢復時間都很短。
遠程非同步復制——將數據變化復制到另一位置的遠程系統。根據數據的重要性，數據變化可以在每天規定的時間執行定時復制，也可以利用存儲系統、NAS設備、主機系統或嵌入在網路中的高級軟體在變化發生時執行非同步復制。這些解決方案的非同步特性具有很強的優勢。由於距離不會影響性能，因而不存在延遲限制。數據復制的恢復時間比磁帶備份短，但非同步特性不能保證恢復所有數據。
同步磁碟復制和鏡像——對於既要求以最快的速度恢復，又不允許數據損失的應用，可以利用存儲系統、主機上或集中在存儲網路中的高級軟體實施同步磁碟復制和鏡像解決方案。等到所有磁碟寫操作都通過高性能網路同步復制到遠程站點之後，事務處理才算完成，從而消除了任何事務處理損失。對這種方法的限制是延遲量，它限制了站點之間的實際距離。對於寫操作密集型應用和聯機事務處理應用，例如企業資源規劃和客戶關系管理，這一點尤為重要。
數據中心鏡像——為實現最高級連續性，越來越多的企業建立了兩個主數據中心，並在兩個站點之間構建了擴展伺服器集群。某些企業平常只使用一個主數據中心，另一個數據中心只在發生故障或災難時使用。但事實上，兩個數據中心可以同時作為「熱」數據中心或當前活動數據中心，即將一個數據中心的所有事務處理同步鏡像到另一個數據中心。這種解決方案共包含兩種操作模式。在第一種操作模式中，兩個數據中心共同承擔應用的事務處理負載，完全同步，利用全局負載均衡將用戶流量分布至兩個站點。鏡像數據中心和主數據中心能夠保證，任何一個數據中心的故障恢復都對用戶透明。另外，這種模式還能更好地利用昂貴投資，提高投資回報率。在第二種模式中，每個數據中心將作為部分應用的主數據中心，同時對另一數據中心的應用提供鏡像。如果某個數據中心發生故障，另一個數據中心將接管其全部應用。無論採用哪種模式，數據中心鏡像都能提供最高級業務連續性。
連續用戶訪問和連接——業務連續性必須包含RAO戰略，以便在情況發生變化時保持用戶與應用的正常連接。根據災難的嚴重程度，有的訪問方法對用戶透明，有的則需要人工重配置。對用戶透明的技術包括鏡像數據中心之間的全局負載均衡，遇到故障鏈路時自動轉換路徑，以及自動恢復到備用組件或設備等。需要重配置的技術包含用戶連接修改。例如，如果LAN因公司大樓火災而遭到破壞，用戶可以利用VPN連接進行遠程通信和訪問應用。
思科企業數據中心架構
思科®企業數據中心架構是一種和諧的網路架構，不但能滿足數據中心對融合、業務連續性和安全性的當前要求，還能滿足數據中心對刀片伺服器、虛擬化、Web服務和GRID等服務導向技術和應用計算技術的未來需求。通過這種架構，數據中心網路領域的全球領先廠商思科系統公司能夠為IT和網路經理提供適當的基礎設施，實現完整、廣泛的業務連續性戰略。思科企業數據中心以智能網路為基礎，不但能幫助企業消除當前面臨的應用中斷風險，還能幫助企業制定相應的計劃，為分散在各地的數據中心實現更先進的業務連續性功能。思科能夠幫助IT經理採用這種架構，利用經過測試和驗證的架構、切實可行的設計最佳實踐，以及既通用又考慮到每個合作夥伴的特點的配置模板，降低風險，縮短備份和恢復時間，並降低投資要求。利用其靈活性，企業能夠部署既有助於實現企業目標，又有助於有效實施新服務和應用的計算、存儲和軟體技術。實施這種自適應數據中心網路架構之後，IT機構能夠更好地實現保護、優化和發展業務的企業目標。它不但能保護關鍵應用和保密數據，還能提高數據中心的運作效率，快速建立安全的新應用環境，有效支持新的業務流程。利用高度靈活、有效的自適應數據中心網路，企業可以緩解競爭壓力，擴大市場規模，並加快新服務上市過程，因而能夠重新協調各種資源，促進企業發展。
思科企業數據中心架構包含三個層次(圖2)：
基本基礎設施包括智能IP網路基礎設施、智能存儲網路和數據中心互聯;
網路系統智能包括安全性、供應優化、可管理性和可用性;
嵌入式應用和存儲服務包括存儲虛擬化、數據復制和分布以及高級應用服務。
圖2 業務連續性網路：企業數據中心架構的組成
思科業務連續性網路解決方案
業務連續性網路是任何業務連續性戰略的關鍵基礎。它不但能提供應用與存儲/備份源之間的連接、主數據中心與備用數據中心之間的連接，還能在故障發生之前、之中和之後優化用戶對應用的訪問。思科能夠提供最先進、最全面的業務連續性網路解決方案套件，並能夠與業界領先合作夥伴開發的業務連續性技術相集成。
思科為企業提供的靈活的大容量網路解決方案能夠支持從備份到數據中心鏡像的全套業務連續性IT解決方案。思科業務連續性網路解決方案具有以下特性：
永續性極高的數據中心IP網路;
可以擴展的智能存儲網路;
大容量、低延遲的SAN擴展和數據中心互聯;
永續、靈活的用戶訪問。
下面，我們將詳細介紹這些特性。
思科業務連續性網路的優點
這些解決方案具有以下優點：
靈活性——最豐富的業務連續性網路解決方案，能夠滿足各種企業應用對RTO和RPO的不同要求;
網路可用性——採用了切實可行的設計，實施了分層硬體和鏈路冗餘性，具有較高的軟體永續性;
能夠與領先存儲和系統廠商的產品互操作——風險低，集成和部署的速度快、成本低;
總擁有成本低——使企業能夠將業務連續性通信集成到一個能夠可靠支持多種應用的靈活網路基礎設施中，以降低電信成本;
採用了業界領先的技術——包括存儲網路內的高級數據復制智能和多協議支持，以及光網內的高密度流量和協議靈活性。
永續性極高的數據中心IP網路基礎設施
為保證對應用和伺服器的連續訪問，以及數據中心內伺服器之間的互聯，必須設計和部署數據中心IP網路基礎設施。網路可用性取決於設計的多個方面：交換機和路由器內的冗餘模塊化組件，交換機、路由器和伺服器之間的冗餘鏈路，以及用於快速、透明地切換到備用組件、設備和鏈路的高可用性智能。恢復還應該能夠提供高層服務，例如伺服器和應用的負載均衡和安全性。數據中心員工應遵循運作最佳實踐、工具和支持，以便快速響應技術問題，防止人為故障。
便於擴展的強大存儲網路
存儲網路是業務連續性戰略的關鍵組件。它能夠將存儲與伺服器分開，創建可由多台伺服器訪問的存儲「池」，從而改善數據可用性。這種方法的永續性高於直接連接存儲，因為即使伺服器發生故障，數據仍然可用。
存儲網路有助於提高應用和數據可用性，因為它能夠實現業務連續性解決方案的標准化和集中管理，例如磁帶備份、數據復制和多個系統之間的數據鏡像。利用存儲網路，能夠通過光纖通道或互聯網小型計算機系統介面(iSCSI)協議實現磁帶備份服務的整合。與傳統的SCSI備份解決方案相比，它能夠縮短備份和恢復時間，因為備份發生在與主數據中心LAN分開的網路上。思科採用了稱為虛擬存儲區域網(VSAN)的獨特存儲技術，這種技術能夠將相互分離的存儲「孤島」集成為可以擴展、可以集中管理的統一物理網路，而且不會影響邏輯獨立SAN的可用性或安全性。例如，VSAN可以為磁帶備份建立一個邏輯上獨立的網路。磁帶備份的專用帶寬不會影響使用SAN的其它時間關鍵型應用的性能或可用性(圖3)。思科存儲網路解決方案的其它優點還包括，它能夠將高級存儲智能集成到網段中。這種智能包括思科合作夥伴提供的虛擬化和數據復制軟體。利用這種智能，存儲管理員能夠集中控制存儲的增加，實現一致、透明的數據復制和鏡像。
圖3 多層智能存儲網路
思科提供以Cisco MDS 9000系列多層交換機為基礎，提供這種強大的智能化存儲網路基礎設施。
高容量、低延遲的數據中心互聯
目前，很多機構都將多種應用、伺服器和存儲集成到少數設施上，因此，保證這些整合數據中心不會成為單故障點已成為當務之急。根據預定風險，備用數據中心可以位於另一個辦公區、另一個城市、另一個國家或者地球的任何一個地方。為支持企業選定的業務連續性解決方案，企業需要制定相應的互聯戰略，通用的部署方案有兩種：辦公區/城域數據中心互聯和遠程長途連接(圖4)。
圖4 數據復制和SAN擴展方式
辦公區/城域數據中心互聯
在同一辦公區或城市范圍內部署備用數據中心的方案最多。由於距離短，因而能夠最大程度地縮短網路延遲，並支持任何業務連續性解決方案，包括同步磁碟和數據中心鏡像。很多高容量技術，包括密集波分多路復用(DWDM)、SONET、SDH和千兆/萬兆城域乙太網都具有很高的靈活性，能夠實現成本、管理和技術目標之間的均衡。不僅如此，企業還可以建立自己的城域光網，從電信運營商那裡租用容量，或者採用託管式服務。
DWDM——作為第一層技術，DWDM能夠經濟有效地增加光纖的可用帶寬。它能夠支持任何存儲協議，包括IBM光纖連接、企業系統連接(ESCON)、IBM Sysplex和耦合鏈路、光纖通道以及iSCSI。DWDM支持所有主LAN協議，支持數據、語音和視頻傳輸。思科能夠為城域DWDM系統提供超高網路容量(32通道，總吞吐量高達320Gbps)、高密度服務匯聚、通過靈活的收發方式在多種客戶機介面實現的服務透明性、綜合服務保護方式以及需要的放大功能。
SONET/SDH——SONET和SDH是大家熟知並已廣為部署的技術，能夠同時通過電子介面和光介面傳輸數據和時分多路復用(TDM)流量。最近的增強使乙太網和DWDM技術能夠與SONET/SDH集成在一起，從而充分展示了它能夠滿足不斷變化的網路要求的靈活性。SONET/SDH可以用於多項服務，例如SAN擴展。思科是下一代SONET/SDH解決方案的行業領先廠商，能夠在一個平台——目前可通過SONET/SDH同時支持光纖通道和ESCON的Cisco ONS 15454——上提供多種服務、帶寬和介面。
城域乙太網——作為城域網路(MAN)環境中提供千兆和萬兆乙太網的行業領先的解決方案廠商，思科能夠將通過乙太網MAN將基於IP和乙太網的業務連續性解決方案連接在一起，實現平滑的高容量傳輸，因而能夠為企業提供易操作性和管理性。由於思科支持IP光纖通道(FCIP)等標准協議，因而可實施經濟有效的業務連續性部署(圖5)。
圖5 選擇適當的城域乙太網技術
遠程連接
為了將超過城域距離(大於200km)的數據中心互聯在一起，思科提供多種傳輸方式。由於多數應用會因長途傳輸而產生過量延遲，思科並不建議企業為距離超過200km的多數應用採用同步鏡像解決方案，而是建議企業採用非同步復制技術。業務連續性應用的最佳服務選擇是SONET/SDH和IP。Cisco ONS 15454多服務供應平台通過SONET/SDH傳輸復制流量，並可選用多種協議，包括FCIP、IP和光纖通道。IP WAN服務可以利用IPSec和/或多協議標簽交換(MPLS)技術通過安全VPN服務傳輸FCIP和IP復制流量。
思科利用智能網路解決方案實現遠程非同步復制，以便提供協議轉換、高可用性、服務質量和安全性，使企業能夠可靠、經濟、有效地部署遠程業務連續性解決方案。
永續、靈活的用戶訪問
具有永續性的數據中心網路，網路間的高容量、低延遲互聯，以及強大的存儲網路是業務連續性網路解決方案的三大部分。第四部分也非常重要，其目的是利用具有永續性的靈活技術保證用戶對應用的訪問，以實現RAO目標。創建能夠滿足RAO要求的網路基礎設施時，網路經理應當制定關於本地和遠程員工、應用和通信的意外計劃和後勤計劃。這些計劃應解決以下問題：
用戶或遠程站點是否需要訪問數據中心應用和通信服務?
用戶是否能以適當的方式及時重新建立與備用站點的連接?
如果主訪問方法失敗，將採用哪種回退訪問方法?這些方法能否實現RAO目標?
網路是否能在發生網路故障時自動重新路由?
遠程位置是否需要多條不同ISP提供的鏈路與數據中心/備用數據中心相連?
如果主工作園區不可用，用戶是否需要特定的接入功能，例如從旅館或家裡接入?
這些問題可以用兩種方式解決：透明重定向和人工重連接。
透明重定向——這種技術對用戶不可見，它採用了負載均衡、伺服器和「路徑狀態敏感」路由、互聯網多路傳輸和高級路由技術。負載均衡可以在數據中心內部或之間執行。智能站點選擇能夠發現用戶的物理位置，並將用戶信息發送至距離最近或響應能力最高的數據中心。這種技術能夠檢測到某地點是否聯網，並確定路徑和伺服器的「狀況」。如果檢測到問題，負載均衡技術通常會在用戶不知情的情況下把連接流量轉移至另一個數據中心。
人工重連接——當主地點出現網路故障或者應用不可用時，需要用戶建立與應用的新連接。思科是訪問聯網的行業領先廠商，能夠為企業提供多種解決方案。對於人工重連接，思科在其路由器、交換機、防火牆和VPN集中器中提供可以擴展的靈活VPN終端選項。Cisco IOS® 軟體採用了強有力的故障切換和重路由技術，不但能從任何網路故障快速恢復，而且通常對用戶透明。為滿足快速創建移動辦公室的需要，思科以IEEE 802.11標准為基礎開發了安全無線網路解決方案(圖6)。
圖6 使用戶能夠對應用和數據執行連續、均衡的訪問
遷移到思科業務連續性網路
思科建議，企業應按照以下步驟開發並實施相應的業務連續性網路解決方案：
對所有企業應用執行業務影響評估，評價應用中斷的風險和成本;
與業務、IT和網路決策者一起制定業務連續性計劃，滿足應用影響評估要求;
與思科及其合作夥伴一起部署相應的業務連續性解決方案;
持續修改和測試計劃和解決方案，滿足不斷變化的需求。
利用思科提供的指導，企業可以將業務連續性網路部署為企業數據中心網路架構的主要組件之一。客戶可以提供高級服務，以便設計和審核相應的數據中心基礎設施和業務連續性解決方案，從而保持連續正常運行。
業務連續性合作夥伴關系
思科智能網路和存儲技術為業務連續性產品奠定了基礎，能夠幫助數據中心廠商出現故障時的業務永續性。思科能夠以多種方式與業界領先廠商合作，以便實現數據中心和業務連續解決方案的集成式順利供應，使企業不但能滿足當前要求，還能在發展和變化之後不斷調整。這些合作夥伴關系為數據中心經理提供了設計、部署和維護靈活數據中心，有效實現其企業目標所需的各種資源。
思科：業務連續性網路領域的領先廠商
業務連續性是開展業務的關鍵。目前，很多企業都在進行數據中心資源的整合，並追求效率的提高，因此，必須將業務連續性戰略融入到IT的各個層次，而且應該從支持所有數據中心通信的基礎網路開始。此網路不但能保證對關鍵業務應用的持續訪問，還能通過復制和鏡像保證應用和數據的適當恢復。無論發生任何故障和災難，思科為數據中心經理提供的有效的設計、模板、最佳實踐和網路解決方案都能幫助數據中心保持業務的正常運行。
以上內容來源互聯網，希望對大家有所幫助

4. VSAN為什麼聲明磁碟選項，我的沒有可用磁碟

VSAN配置磁碟組要求是裸盤，也就是磁碟里沒有數據或未被使用（ESXI系統所在的磁碟除外）。不然就得去把磁碟格式化或者把分區刪除了，讓其恢復沒有數據的狀態然後才能聲明磁碟為緩存盤和容量層，讓vSAN使用。

選中磁碟所在的ESXi主機→配置→存儲設備→選中磁碟→清除分區

5. 2020-03-03 VMwarevSAN雙活（延伸集群）站點間帶寬設計(轉載)

原文地址：
https://www.tinymind.net.cn/articles/98e64d56d38a52

筆者之前也分享過vSAN延伸集群的一些資料。在雙活的設計中，站點之間帶寬預估、腦列處理等問題，都是需要重點考慮的。本次向大家分享一下vSAN帶寬頻寬的設計原則。建議讀者參照此前我分享過的《VMware的災備與雙活----我在vForum 2015分會場的分享（2）》一起進行閱讀，這篇文章中已經包含的內容，本文將不再進行贅述。

一．總體架構

vSAN延伸集群整體架構如下：一個有三個故障域，兩個數據站點分別是一個故障域，仲裁站點是一個故障域。需要注意的是，vSAN延伸的三個故障域都屬於是一個vSAN集群，而不是三個。

二．常規建議

兩個數據站點之間的帶寬很大程度上取決於vSAN承擔的負載、總體數據量、可能的故障場景。

通常的建議參考如下：

（1）vSAN的數據站點之間，或者數據站點和仲裁站點之間的網路，二層和三層網路都可以支持，這降低了對大二層的要求。但是，我們推薦在數據站點之間使用二層網路。

（2）數據站點站點之間小於5ms之間的延遲（RTT）。數據站點與仲裁站點之間200的延遲不能超過200ms。

（3）數據站點和仲裁站點之間的帶寬最不小於50-100Mbps.

（4）網路劃分

管理網路：連接三個站點。二層或者三層網路

vSAN網路：連接三個站點。數據中心之間建議二層網路，與仲裁站點之間使用三層網路。

VM network：連接數據中心。建議二層網路，這樣當虛擬機從一個數據站點vMotion或HA到另外一個數據站點時，IP地址不變。

vMotion網路：連接數據中心。二層，三層網路都可以。

三．數據站點之間的帶寬需求

1.計算公式

在真實的業務場景中，全讀或者全寫的情況很少。更多的時候，用讀寫比率來衡量業務I/O特性是比較格式。以VDI場景的負載舉例子。在負載峰值的情況下，讀寫比率通常是3：7。

例如：業務需要求IOPS的總量是10萬，讀寫比率為3：7。由於vsan延伸集群本地讀的特性，讀操作不需要跨站點，因此考慮數據站點之間帶寬只考慮跨站點寫即可。

數據站點帶寬計算公式是：

B=Wb md mr

B：Bandwidth。數據站點之間的帶寬。

WB：Write Bandwidth數據站點之間的寫帶寬。

MD: Data Multiplier：數據乘數

MR：Resynchronization multiplier 再同步乘數

其中，數據乘數由vSAN元數據跨站點寫開銷等相關的操作組成的（除了數據意外，元數據也需要跨站點寫）。VMware建議將這個數值設置為1.4。

再同步乘數指的是數據站點之間同步事件（例如vSAN組件的狀態信息）的所需要的總開銷。這是數值VMware建議設置為1.25。再同步乘數和數據乘數其實都是跨站點寫數據的額外開銷。這兩個數值使用vSAN推薦值即可。

2．案例分析

案例1.

vSAN運行一個IOPS為1萬的全寫負載業務。寫的block為4KB。這需要消耗40MB/s的數據站點間的帶寬（4KB*10000），也就是320Mbps。

按照上一小節的計算公式：

B=320Mbps 1.4 1.25=560Mbps

因此，在這個負載情況下，vSAN數據站點之間需要的帶寬至少應為560Mbps。

案例2.

vSAN運行負載為3萬全寫IOPS，4KB block size，這需要120MB/s（960Mbps）跨站點寫數據吞吐量。

按照公式：

B=960Mbps 1.4 1.25=1680Mbps約等於1.7Gbps.

因此，在這個案例中，數據站點之間的帶寬至少應為1.7Gbps.

四．數據站點與仲裁站點之間的帶寬需求

1.計算公式

數據站點並不存放虛擬機的數據，只是用於投票使用，因此數據站點與仲裁站點之間的帶寬計算公式與上面的不一樣。

我在之前的文章提到過，vSAN是基於策略驅動的分布式存儲。數據是以對象的方式存儲在vSAN中的，一個VM在vSAN存儲中的數據由一個或者多個組件組成，組件有如下類型：

VM Folder
VMware swap file
VMDK
快照
在vSAN中，當一個對象的大小大於255GB的時候，就會被自動劃分成多個組件。仲裁站點與數據站點之間的計算公式如下：

1138B*NumComp/5seconds

其中，1138B這個數字是：當主站點down，備站點接管所有組件所需要的時間。我們想像一下，當主站點down，備站點將成為master。仲裁站點將會向新的master發送確認信息，確認master的角色已經發生了變更。從本質上講，1138B是當主站點down以後，仲裁站點需要從元數據信息中獲取主站點上所有組件已經failed並且隨後由備站點take ownership的狀態信息更新開銷。當主站點down以後，仲裁站點與數據站點之間的帶寬應足以讓集群中所有部件的master ownership變更在5秒內發變更完成。

2．案例分析

案例1：

虛擬機由如下內容組成：

三個對象：

VM namespace
VMKD（小於255GB）
VM Swap file
FTT=1
Stripe width=1
以上配置的虛擬機數量是166個，那麼仲裁站點就需要獲取到996個組件信息。996=3 2 1*166.

我們用1000進行計算：B=1138B 8 1000/5s=1820800bps=1.82Mbps

VMware推薦預留10%的額外帶寬用於信息雙向傳輸：1.82*1.1=2Mbps。因此，在這個場景下，數據站點與仲裁站點的帶寬應為2Mbps。
案例2：
虛擬機由如下內容組成：
三個對象：
VM namespace
VMDK（小於255GB）
VM Swapfile
此外：
FTT=1
Stripe width=2

如果具有以上配置的虛擬機數量為1500，那麼仲裁站點將會維持18000個組件的狀態信息。3 2 2 1 1500=18000
按照案例1中的演算法：
B=1138B 8 18000/5s=32.78Mbps
B*1.2=36.05Mbps

因此，在這個場景下，數據站點與仲裁站點之間的帶寬需要36.06Bbps。

根據上面的演算法，可以提煉一個簡單的公式用於在日常的評估，那就是2Mbps帶寬可以維系1000個組件的狀態信息。因此，在這個場景下，維系18000個組件，所需要的帶寬是：18000/1000*2Mbps=36Mbps。

七．2-Node vSAN配置仲裁站點的帶寬
在vSAN6.1中，支持2節點的vSAN集群。也就是我在< VMware的災備與雙活----我在vForum 2015分會場的分享（2）>中提到的vSAN延伸集群最小1+1+1，最大15+15+1的配置。

案例1：
2-Node配置中的虛擬機特性如下：虛擬機數量：25；VMDK/VM：1TB；FTT=1；Stripe width=1
上面我們提到過，vSAN中，一個vmdk組件最大為255G，因此每個VMDK由4個組件組成，此外由於FTT=1，在包含副本的情況下，每個vmdk由8個組件組成。加上VM namespace和swap文件（有副本），那麼一個虛擬機的組件總數為12=4 2+2 2。25個虛擬機組件總量為300=25 12。
使用通用公式：300/1000 2Mbps=600Kbps。因此，在這種場景下，數據站點與仲裁站點之間的帶寬應為600Kbps。
案例2：
在2-Node配置中，每個主機上有100個虛擬機，每個虛擬機有1TB的VMDK，FTT和stripe width均為1。那麼，組件的總量為：(1000/255+1+1) 2 100(VMs) 2(Hosts)=2400
按照通用公式，2400個組件，需要的帶寬為2400/1000 2Mbps=4.8Mbps。因此在這個場景中，仲裁站點到數據站點之間的帶寬需要4.8Mbps。
需要注意的是，如果一套vSAN延伸集群承擔多個類型的業務負載，那麼需要把這些業務負載先單獨計算其需要的帶寬，然後將其累加在一起。

6. vsan 虛擬機存儲策略不合規怎麼處理

vsan 虛擬機存儲策略不合規的處理方法

到vm storage policy修改已經創建好的存儲策略
選中一條，我們修改它
我們新增一條，添加
我們選擇了一個增加磁碟條帶功能，選擇3條，點擊ok
這里看到，這條存儲策略已經在使用了，問你是否要現在更新，還是晚點手動更新，我們這裏手動晚點更新
然後我們回到應用了剛改修改了vm 存儲策略的虛擬機的位置，進入存儲策略，看到之前的策略已經過期了，我們要手動更新它
選中下圖圈中的按鈕，Reapply the VM Storage Policy to all out of date entities
它會提示是否更新，我們選擇是

7. 分布式存儲最佳緩存比

作者：深入細節的 SmartX 一線技術團隊

近日，VMware 發布了 vSAN 8，對存儲架構進行了重大更新。其中最主要的變化，即引入了新的 Express Storage Architecture（ESA）架構：用「存儲池」替代了原存儲架構（OSA）中的「磁碟組」，並不再需要專用 SSD 承擔緩存加速功能，一定程度上避免了 8.0 之前版本中的專用緩存檔利用率低、易發生緩存擊穿等問題。
而值得一提的是，在 vSAN 大版本更新之前，SmartX 即通過統一緩存空間和智能冷熱數據管理優化了分布式存儲緩存機制，有效規避了上述問題。本文將通過重點解讀 vSAN（以 vSAN 7 為例）和 SmartX 分布式塊存儲組件 ZBS* 緩存機制的原理，並測試對比兩種緩存機制下虛擬機性能表現，讓讀者更好地了解兩種技術實現機制的區別對業務可能帶來的實際影響。

* ZBS 內置於 SmartX 超融合軟體 SMTX OS，可與 SmartX 原生虛擬化 ELF 搭配提供服務。

本文重點
vSAN 7 採用劃分讀寫緩存空間的機制，將緩存磁碟按照容量佔比劃分為寫緩沖區（30%）和讀緩存區（70%）。這種方式可能出現緩存利用率低、在訪問數據量過大時導致緩存擊穿，進而引起性能下降等問題。
ZBS 採用統一緩存空間的機制，並通過 2 級 LRU 演算法對冷熱數據進行管理，在充分利用緩存容量的同時避免了因訪問量激增導致虛擬機性能下降的情況。
本文基於相同的硬體配置和 I/O 讀寫場景，分別測試 VMware 超融合（vSphere 虛擬化 + vSAN 分布式存儲）寫入 300 GB 數據、SMTX OS（ELF + ZBS）寫入 500 GB 數據時虛擬機的性能表現。結果顯示，vSAN 7 難以充分利用緩存介質，發生緩存擊穿，導致存儲性能下降；而 SMTX OS 即便在寫入更多數據的情況下也未發生緩存擊穿，虛擬機性能保持穩定。
場景問題
混閃配置是超融合或分布式存儲現階段的主流落地模式。混閃配置是指機器中的磁碟使用 SSD + HDD 混合組成，其中 SSD 磁碟作為數據緩存層，而 HDD 磁碟作為數據容量層。以該模式構建的分布式存儲池通過軟體演算法進行冷熱數據自動判斷，在提供高性能的同時，還可獲得較大的存儲容量，進而提升資源利用率，獲得相對全快閃記憶體儲更高的性價比。

在將 SSD 磁碟用作數據緩存層時，部分超融合產品會將緩存容量（Cache）劃分為讀和寫各自獨立的兩部分。例如，vSAN 7 及更早版本會將每個磁碟組（Disk Group）中的緩存磁碟，按照容量佔比劃分為寫緩沖區（30%）和讀緩存區（70%），當讀取數據未命中緩存或者寫緩存已滿，將會直接從容量層進行讀寫。

8. VSAN 如何處理磁碟或主機故障

原則上，一個VSAN cluster至少需要三個node（容錯為1，冗餘為1），每個node上至少有一個disk group。這些disk group可構成一個VSAN的datastore，對外提供存儲池服務。存放在這個VSAN datastore上的每個object，會在根據容錯和冗餘要求在多個disk group上創建副本。所以當一個磁碟或者node故障了，VSAN還有其他node和disk group上的副本數據可以用。

vsan存儲有冗餘

與vsan存儲有冗餘相關的內容