vsan存储有冗余_VSAN存储环境不稳定存储空间突然变成0是什么原因

1. vsan网络分区组如何调整

一种解决方法：把vlan信息删掉，在虚拟交换机中把vlan标签删掉即可。第二种解决方法：把交换机端口开启trunk即可。 Virtual SAN (VSAN) 可以为对象创建镜像。这种功能可在一种策略（即虚拟机存储策略，又称基于存储策略的管理）来定义。此时，您可以将名为“failures to tolerate（允许的故障数目）”的选项定义为 0和 3 之间的任意数字。默认情况下，此选项设置为 1。这意味着，数据会有两个副本。除了 VSAN 之外，还需要一个见证/仲裁，以帮助您确定发生事件后所有者是谁。那么，情况会是怎样的呢？请注意，在下图中，为了简单起见，我会使用术语“vmdk”和“见证”，实际上，这可以是虚拟机中的任何一种组件。

2. VSAN存储环境不稳定，存储空间突然变成0，是什么原因

可以参考这里的VMware VSAN（1.0版）中文版FAQ：，
主机配置
Q1.在1.0 版本中，一个VSAN 集群中至少需要几台主机？
A1.3 台

Q2.至少需要多少台主机贡献本地存储？
A2.至少需要3 台主机贡献本地存储

Q3.是否VSAN 集群中的所有ESXi主机都需要贡献存储？
A3.不是。主机可以不贡献本地存储，只使用vsanDatastore。但是作为最佳实践，VMware推荐所有主机的配置都类似/相同。

Q4.对1.0 版本而言，VSAN集群中最多可以有几台主机？
A4.VSAN设计的上限是vSphere集群，但是在beta版本中，我们加了一个软限制：每个集群的最大节点数目是8。

Q5.那些不为集群贡献本地存储的主机，也计入8台主机的软限制中么？
A5.是的。VSAN中的所有主机，不管它是否贡献本地存储，都会被计算入“每个集群8台主机”的软限制中。

Q6.VSAN 需要哪个版本的vSphere？
A6.vSphere5.5。VSAN已经包含在这个发行版中，不需要额外安装组件或者VIB。

Q7.如何扩大VSAN集群？
A7.和添加1台主机到集群中一样容易。

3. 如何理解cisco企业架构

思科系统公司(Cisco Systems, Inc.)，简称侍信思科公司或思科，1984年12月正式成立，是互联网解决方案的领先提供者，其设备和软件产品主要用于连接计算机网络系统，总部位于美国加利福尼亚州圣何塞。1986年，Cisco第一台多协议路由器面市。1993年，思科建成了世界上第一个由1000台路由器连接的网络，由此进入了一个迅猛发展的时期。竞争方面，思科与华为一直是老对手。2012年10月，美国众议院认定华为和中兴危害其国家安全，而华为在其后的反驳中指出，华为、中兴被认定威胁美国国家安全，正是思科在背后推波助澜。正是思科在背后推波助澜。
概述
为保护、优化和发展业务，制定任何业务连续性计划时，都必须包含可靠的网络基础设施，以便满足各机构的数据保护需求，使应用能够快速恢复正常运作，并保证用户访问的连续性。思科系统®公司以可以扩展、自适应的企业数据中心架构为基础，为企业的数据中心经理提供业务连续性网络解决方案，除多种用户访问技术外，还能在多个数据中心和恢复站点之间提供经济有效的通信。
挑战
企业数据中心支持着对业务运作至关重要的很多应用，是各机构业务连续性战略的焦点。如果应用和数据不可用，或者用户无法访问，企业不但会损失收入，还会降低生产率。更糟糕的是，这种情况还会破坏客户和合作伙伴对企业的印象，或者受到法律诉讼。为实现保护、优化和发展业务的管理目标，很多IT机构都在重新思考自己的业务连续性计划。业务连续性是对风险和威胁、新法规以及数据中心内IT与业务资源的整合趋势高度敏感的企业最关注的问题。
目前，很多数据中心基础设施都是分立的，不但难以管理和维护，也难以适应新技术和应用。不仅如此，一旦发生中断或灾难，相互隔离的应用环境既难以实施一致、适当的保护，维护成本又非常高。
为建立能够支持业务永续性战略的网络时，数据中心和业务连续性经理面临很多问题：
磁带备份存在很多限制——作为传统的主流灾难恢复方式，磁带备份的速度慢，而且很难按时恢复关键应用和数据，因而难以满足恢复时间的要求。但是，它在保持完整性方面所起的作用仍然不容忽视。
费用高——尽管业务连续性技术的成本近年来一直在下降，但配备镜像软件、冗余设施和资源、电信服务和相应人力的成本仍然很高。因此，IT经理还需要利用一系列解决方案控制资本成本和运营成本，并保证企业能够实现业务连续性目标。
延迟长——由于零数据损失同步镜像要求在确认事务处理之前同时将数据写至本地和远程位置，因而影响了应用的性能。城域光网等传输技术可有效缩短延迟。一般情况下，由于光速的限制，对于多数实时事务处理应用，同步镜像站点之间的实际距离最长为200km。
网络设施成本高——虽然带宽成本持续下降，但大型数据中心镜像和复制需要极高的容量。如果采用传统的租用线路服务，这项费用将非常可观。
用户访问——业务连续性计划通常注重数据和应用可用性，但常常忽略了用户访问恢复数据和应用的需求。
业务连续性基本要素
业务影响评估表示了与应用停运、数据损失和用户访问中断相关的风险和潜在成本。尽管最理想的情况是能够最行春大程度地防止运行中断和数据损失，但实现这一目标要么成本太高，要么不切实际。事实上，很多应用允许一定程度的停运，只有一部分关键业务应用需要随时可用。风险评估利用两个业务连续性指标对应用进行评价：
恢复点目标(RPO)——确定机构愿意承受的数据损失风险，从零到几分钟或几小时;
恢复时间目标(RTO)——量化应用的最长不可用时间档谈耐。
尽管RPO和RTO指标对数据和应用级评估十分有用，但思科系统公司又提出了直接适用于网络的第三个指标——恢复访问目标(RAO)。RAO确定了将用户恢复应用的时间，不论从哪个时间点开始恢复。如果没有RAO，实现应用RPO和RTO的实际价值就十分有限。例如，在正常运行期间，分支机构用户可能会通过企业内部网WAN访问位于主数据中心内的关键业务应用。如果应用发生故障，用户需要利用回退方法，例如通过互联网服务供应商(ISP)网络快速构建站点到站点虚拟专用网(VPN)连接，与支持恢复应用的备用数据中心建立连接。
各机构必须考虑所有备用数据中心或备用站点的远近。因为只有备用数据中心或备用站点设立得足够远，才能减小断电、火山爆发、飓风或地震等灾难的影响。
图1 业务连续性解决方案示意图
利用RPO、RTO和RAO指标以及距离要求，业务连续性经理可以为每个应用配备一个与其业务角色相对应的技术解决方案(图1)。这些解决方案可能包含下面介绍的一个或多个选项：
高可用性存储网络——存储局域网(SAN)或网络连接存储(NAS)解决方案能够应对本地服务器故障，因为它能够提供对备用或集群服务器系统的访问，以保证连续运作。共享存储环境可以利用高级存储系统，保证磁盘故障不会影响应用的正常运行。
集中备份——定期备份是多数商业应用的标准操作规程的一部分。作为最便宜的解决方案，集中磁带备份需要的恢复时间最长，但它十分适合用于防止数据受损。目前，由于磁盘存储介质的成本已越来越接近于磁带存储，因此，基于磁盘的“近线”备份系统越来越受到企业的欢迎，因为它的备份时间和恢复时间都很短。
远程异步复制——将数据变化复制到另一位置的远程系统。根据数据的重要性，数据变化可以在每天规定的时间执行定时复制，也可以利用存储系统、NAS设备、主机系统或嵌入在网络中的高级软件在变化发生时执行异步复制。这些解决方案的异步特性具有很强的优势。由于距离不会影响性能，因而不存在延迟限制。数据复制的恢复时间比磁带备份短，但异步特性不能保证恢复所有数据。
同步磁盘复制和镜像——对于既要求以最快的速度恢复，又不允许数据损失的应用，可以利用存储系统、主机上或集中在存储网络中的高级软件实施同步磁盘复制和镜像解决方案。等到所有磁盘写操作都通过高性能网络同步复制到远程站点之后，事务处理才算完成，从而消除了任何事务处理损失。对这种方法的限制是延迟量，它限制了站点之间的实际距离。对于写操作密集型应用和联机事务处理应用，例如企业资源规划和客户关系管理，这一点尤为重要。
数据中心镜像——为实现最高级连续性，越来越多的企业建立了两个主数据中心，并在两个站点之间构建了扩展服务器集群。某些企业平常只使用一个主数据中心，另一个数据中心只在发生故障或灾难时使用。但事实上，两个数据中心可以同时作为“热”数据中心或当前活动数据中心，即将一个数据中心的所有事务处理同步镜像到另一个数据中心。这种解决方案共包含两种操作模式。在第一种操作模式中，两个数据中心共同承担应用的事务处理负载，完全同步，利用全局负载均衡将用户流量分布至两个站点。镜像数据中心和主数据中心能够保证，任何一个数据中心的故障恢复都对用户透明。另外，这种模式还能更好地利用昂贵投资，提高投资回报率。在第二种模式中，每个数据中心将作为部分应用的主数据中心，同时对另一数据中心的应用提供镜像。如果某个数据中心发生故障，另一个数据中心将接管其全部应用。无论采用哪种模式，数据中心镜像都能提供最高级业务连续性。
连续用户访问和连接——业务连续性必须包含RAO战略，以便在情况发生变化时保持用户与应用的正常连接。根据灾难的严重程度，有的访问方法对用户透明，有的则需要人工重配置。对用户透明的技术包括镜像数据中心之间的全局负载均衡，遇到故障链路时自动转换路径，以及自动恢复到备用组件或设备等。需要重配置的技术包含用户连接修改。例如，如果LAN因公司大楼火灾而遭到破坏，用户可以利用VPN连接进行远程通信和访问应用。
思科企业数据中心架构
思科®企业数据中心架构是一种和谐的网络架构，不但能满足数据中心对融合、业务连续性和安全性的当前要求，还能满足数据中心对刀片服务器、虚拟化、Web服务和GRID等服务导向技术和应用计算技术的未来需求。通过这种架构，数据中心网络领域的全球领先厂商思科系统公司能够为IT和网络经理提供适当的基础设施，实现完整、广泛的业务连续性战略。思科企业数据中心以智能网络为基础，不但能帮助企业消除当前面临的应用中断风险，还能帮助企业制定相应的计划，为分散在各地的数据中心实现更先进的业务连续性功能。思科能够帮助IT经理采用这种架构，利用经过测试和验证的架构、切实可行的设计最佳实践，以及既通用又考虑到每个合作伙伴的特点的配置模板，降低风险，缩短备份和恢复时间，并降低投资要求。利用其灵活性，企业能够部署既有助于实现企业目标，又有助于有效实施新服务和应用的计算、存储和软件技术。实施这种自适应数据中心网络架构之后，IT机构能够更好地实现保护、优化和发展业务的企业目标。它不但能保护关键应用和保密数据，还能提高数据中心的运作效率，快速建立安全的新应用环境，有效支持新的业务流程。利用高度灵活、有效的自适应数据中心网络，企业可以缓解竞争压力，扩大市场规模，并加快新服务上市过程，因而能够重新协调各种资源，促进企业发展。
思科企业数据中心架构包含三个层次(图2)：
基本基础设施包括智能IP网络基础设施、智能存储网络和数据中心互联;
网络系统智能包括安全性、供应优化、可管理性和可用性;
嵌入式应用和存储服务包括存储虚拟化、数据复制和分布以及高级应用服务。
图2 业务连续性网络：企业数据中心架构的组成
思科业务连续性网络解决方案
业务连续性网络是任何业务连续性战略的关键基础。它不但能提供应用与存储/备份源之间的连接、主数据中心与备用数据中心之间的连接，还能在故障发生之前、之中和之后优化用户对应用的访问。思科能够提供最先进、最全面的业务连续性网络解决方案套件，并能够与业界领先合作伙伴开发的业务连续性技术相集成。
思科为企业提供的灵活的大容量网络解决方案能够支持从备份到数据中心镜像的全套业务连续性IT解决方案。思科业务连续性网络解决方案具有以下特性：
永续性极高的数据中心IP网络;
可以扩展的智能存储网络;
大容量、低延迟的SAN扩展和数据中心互联;
永续、灵活的用户访问。
下面，我们将详细介绍这些特性。
思科业务连续性网络的优点
这些解决方案具有以下优点：
灵活性——最丰富的业务连续性网络解决方案，能够满足各种企业应用对RTO和RPO的不同要求;
网络可用性——采用了切实可行的设计，实施了分层硬件和链路冗余性，具有较高的软件永续性;
能够与领先存储和系统厂商的产品互操作——风险低，集成和部署的速度快、成本低;
总拥有成本低——使企业能够将业务连续性通信集成到一个能够可靠支持多种应用的灵活网络基础设施中，以降低电信成本;
采用了业界领先的技术——包括存储网络内的高级数据复制智能和多协议支持，以及光网内的高密度流量和协议灵活性。
永续性极高的数据中心IP网络基础设施
为保证对应用和服务器的连续访问，以及数据中心内服务器之间的互联，必须设计和部署数据中心IP网络基础设施。网络可用性取决于设计的多个方面：交换机和路由器内的冗余模块化组件，交换机、路由器和服务器之间的冗余链路，以及用于快速、透明地切换到备用组件、设备和链路的高可用性智能。恢复还应该能够提供高层服务，例如服务器和应用的负载均衡和安全性。数据中心员工应遵循运作最佳实践、工具和支持，以便快速响应技术问题，防止人为故障。
便于扩展的强大存储网络
存储网络是业务连续性战略的关键组件。它能够将存储与服务器分开，创建可由多台服务器访问的存储“池”，从而改善数据可用性。这种方法的永续性高于直接连接存储，因为即使服务器发生故障，数据仍然可用。
存储网络有助于提高应用和数据可用性，因为它能够实现业务连续性解决方案的标准化和集中管理，例如磁带备份、数据复制和多个系统之间的数据镜像。利用存储网络，能够通过光纤通道或互联网小型计算机系统接口(iSCSI)协议实现磁带备份服务的整合。与传统的SCSI备份解决方案相比，它能够缩短备份和恢复时间，因为备份发生在与主数据中心LAN分开的网络上。思科采用了称为虚拟存储局域网(VSAN)的独特存储技术，这种技术能够将相互分离的存储“孤岛”集成为可以扩展、可以集中管理的统一物理网络，而且不会影响逻辑独立SAN的可用性或安全性。例如，VSAN可以为磁带备份建立一个逻辑上独立的网络。磁带备份的专用带宽不会影响使用SAN的其它时间关键型应用的性能或可用性(图3)。思科存储网络解决方案的其它优点还包括，它能够将高级存储智能集成到网段中。这种智能包括思科合作伙伴提供的虚拟化和数据复制软件。利用这种智能，存储管理员能够集中控制存储的增加，实现一致、透明的数据复制和镜像。
图3 多层智能存储网络
思科提供以Cisco MDS 9000系列多层交换机为基础，提供这种强大的智能化存储网络基础设施。
高容量、低延迟的数据中心互联
目前，很多机构都将多种应用、服务器和存储集成到少数设施上，因此，保证这些整合数据中心不会成为单故障点已成为当务之急。根据预定风险，备用数据中心可以位于另一个办公区、另一个城市、另一个国家或者地球的任何一个地方。为支持企业选定的业务连续性解决方案，企业需要制定相应的互联战略，通用的部署方案有两种：办公区/城域数据中心互联和远程长途连接(图4)。
图4 数据复制和SAN扩展方式
办公区/城域数据中心互联
在同一办公区或城市范围内部署备用数据中心的方案最多。由于距离短，因而能够最大程度地缩短网络延迟，并支持任何业务连续性解决方案，包括同步磁盘和数据中心镜像。很多高容量技术，包括密集波分多路复用(DWDM)、SONET、SDH和千兆/万兆城域以太网都具有很高的灵活性，能够实现成本、管理和技术目标之间的均衡。不仅如此，企业还可以建立自己的城域光网，从电信运营商那里租用容量，或者采用托管式服务。
DWDM——作为第一层技术，DWDM能够经济有效地增加光纤的可用带宽。它能够支持任何存储协议，包括IBM光纤连接、企业系统连接(ESCON)、IBM Sysplex和耦合链路、光纤通道以及iSCSI。DWDM支持所有主LAN协议，支持数据、语音和视频传输。思科能够为城域DWDM系统提供超高网络容量(32通道，总吞吐量高达320Gbps)、高密度服务汇聚、通过灵活的收发方式在多种客户机接口实现的服务透明性、综合服务保护方式以及需要的放大功能。
SONET/SDH——SONET和SDH是大家熟知并已广为部署的技术，能够同时通过电子接口和光接口传输数据和时分多路复用(TDM)流量。最近的增强使以太网和DWDM技术能够与SONET/SDH集成在一起，从而充分展示了它能够满足不断变化的网络要求的灵活性。SONET/SDH可以用于多项服务，例如SAN扩展。思科是下一代SONET/SDH解决方案的行业领先厂商，能够在一个平台——目前可通过SONET/SDH同时支持光纤通道和ESCON的Cisco ONS 15454——上提供多种服务、带宽和接口。
城域以太网——作为城域网络(MAN)环境中提供千兆和万兆以太网的行业领先的解决方案厂商，思科能够将通过以太网MAN将基于IP和以太网的业务连续性解决方案连接在一起，实现平滑的高容量传输，因而能够为企业提供易操作性和管理性。由于思科支持IP光纤通道(FCIP)等标准协议，因而可实施经济有效的业务连续性部署(图5)。
图5 选择适当的城域以太网技术
远程连接
为了将超过城域距离(大于200km)的数据中心互联在一起，思科提供多种传输方式。由于多数应用会因长途传输而产生过量延迟，思科并不建议企业为距离超过200km的多数应用采用同步镜像解决方案，而是建议企业采用异步复制技术。业务连续性应用的最佳服务选择是SONET/SDH和IP。Cisco ONS 15454多服务供应平台通过SONET/SDH传输复制流量，并可选用多种协议，包括FCIP、IP和光纤通道。IP WAN服务可以利用IPSec和/或多协议标签交换(MPLS)技术通过安全VPN服务传输FCIP和IP复制流量。
思科利用智能网络解决方案实现远程异步复制，以便提供协议转换、高可用性、服务质量和安全性，使企业能够可靠、经济、有效地部署远程业务连续性解决方案。
永续、灵活的用户访问
具有永续性的数据中心网络，网络间的高容量、低延迟互联，以及强大的存储网络是业务连续性网络解决方案的三大部分。第四部分也非常重要，其目的是利用具有永续性的灵活技术保证用户对应用的访问，以实现RAO目标。创建能够满足RAO要求的网络基础设施时，网络经理应当制定关于本地和远程员工、应用和通信的意外计划和后勤计划。这些计划应解决以下问题：
用户或远程站点是否需要访问数据中心应用和通信服务?
用户是否能以适当的方式及时重新建立与备用站点的连接?
如果主访问方法失败，将采用哪种回退访问方法?这些方法能否实现RAO目标?
网络是否能在发生网络故障时自动重新路由?
远程位置是否需要多条不同ISP提供的链路与数据中心/备用数据中心相连?
如果主工作园区不可用，用户是否需要特定的接入功能，例如从旅馆或家里接入?
这些问题可以用两种方式解决：透明重定向和人工重连接。
透明重定向——这种技术对用户不可见，它采用了负载均衡、服务器和“路径状态敏感”路由、互联网多路传输和高级路由技术。负载均衡可以在数据中心内部或之间执行。智能站点选择能够发现用户的物理位置，并将用户信息发送至距离最近或响应能力最高的数据中心。这种技术能够检测到某地点是否联网，并确定路径和服务器的“状况”。如果检测到问题，负载均衡技术通常会在用户不知情的情况下把连接流量转移至另一个数据中心。
人工重连接——当主地点出现网络故障或者应用不可用时，需要用户建立与应用的新连接。思科是访问联网的行业领先厂商，能够为企业提供多种解决方案。对于人工重连接，思科在其路由器、交换机、防火墙和VPN集中器中提供可以扩展的灵活VPN终端选项。Cisco IOS® 软件采用了强有力的故障切换和重路由技术，不但能从任何网络故障快速恢复，而且通常对用户透明。为满足快速创建移动办公室的需要，思科以IEEE 802.11标准为基础开发了安全无线网络解决方案(图6)。
图6 使用户能够对应用和数据执行连续、均衡的访问
迁移到思科业务连续性网络
思科建议，企业应按照以下步骤开发并实施相应的业务连续性网络解决方案：
对所有企业应用执行业务影响评估，评价应用中断的风险和成本;
与业务、IT和网络决策者一起制定业务连续性计划，满足应用影响评估要求;
与思科及其合作伙伴一起部署相应的业务连续性解决方案;
持续修改和测试计划和解决方案，满足不断变化的需求。
利用思科提供的指导，企业可以将业务连续性网络部署为企业数据中心网络架构的主要组件之一。客户可以提供高级服务，以便设计和审核相应的数据中心基础设施和业务连续性解决方案，从而保持连续正常运行。
业务连续性合作伙伴关系
思科智能网络和存储技术为业务连续性产品奠定了基础，能够帮助数据中心厂商出现故障时的业务永续性。思科能够以多种方式与业界领先厂商合作，以便实现数据中心和业务连续解决方案的集成式顺利供应，使企业不但能满足当前要求，还能在发展和变化之后不断调整。这些合作伙伴关系为数据中心经理提供了设计、部署和维护灵活数据中心，有效实现其企业目标所需的各种资源。
思科：业务连续性网络领域的领先厂商
业务连续性是开展业务的关键。目前，很多企业都在进行数据中心资源的整合，并追求效率的提高，因此，必须将业务连续性战略融入到IT的各个层次，而且应该从支持所有数据中心通信的基础网络开始。此网络不但能保证对关键业务应用的持续访问，还能通过复制和镜像保证应用和数据的适当恢复。无论发生任何故障和灾难，思科为数据中心经理提供的有效的设计、模板、最佳实践和网络解决方案都能帮助数据中心保持业务的正常运行。
以上内容来源互联网，希望对大家有所帮助

4. VSAN为什么声明磁盘选项，我的没有可用磁盘

VSAN配置磁盘组要求是裸盘，也就是磁盘里没有数据或未被使用（ESXI系统所在的磁盘除外）。不然就得去把磁盘格式化或者把分区删除了，让其恢复没有数据的状态然后才能声明磁盘为缓存盘和容量层，让vSAN使用。

选中磁盘所在的ESXi主机→配置→存储设备→选中磁盘→清除分区

5. 2020-03-03 VMwarevSAN双活（延伸集群）站点间带宽设计(转载)

原文地址：
https://www.tinymind.net.cn/articles/98e64d56d38a52

笔者之前也分享过vSAN延伸集群的一些资料。在双活的设计中，站点之间带宽预估、脑列处理等问题，都是需要重点考虑的。本次向大家分享一下vSAN带宽带宽的设计原则。建议读者参照此前我分享过的《VMware的灾备与双活----我在vForum 2015分会场的分享（2）》一起进行阅读，这篇文章中已经包含的内容，本文将不再进行赘述。

一．总体架构

vSAN延伸集群整体架构如下：一个有三个故障域，两个数据站点分别是一个故障域，仲裁站点是一个故障域。需要注意的是，vSAN延伸的三个故障域都属于是一个vSAN集群，而不是三个。

二．常规建议

两个数据站点之间的带宽很大程度上取决于vSAN承担的负载、总体数据量、可能的故障场景。

通常的建议参考如下：

（1）vSAN的数据站点之间，或者数据站点和仲裁站点之间的网络，二层和三层网络都可以支持，这降低了对大二层的要求。但是，我们推荐在数据站点之间使用二层网络。

（2）数据站点站点之间小于5ms之间的延迟（RTT）。数据站点与仲裁站点之间200的延迟不能超过200ms。

（3）数据站点和仲裁站点之间的带宽最不小于50-100Mbps.

（4）网络划分

管理网络：连接三个站点。二层或者三层网络

vSAN网络：连接三个站点。数据中心之间建议二层网络，与仲裁站点之间使用三层网络。

VM network：连接数据中心。建议二层网络，这样当虚拟机从一个数据站点vMotion或HA到另外一个数据站点时，IP地址不变。

vMotion网络：连接数据中心。二层，三层网络都可以。

三．数据站点之间的带宽需求

1.计算公式

在真实的业务场景中，全读或者全写的情况很少。更多的时候，用读写比率来衡量业务I/O特性是比较格式。以VDI场景的负载举例子。在负载峰值的情况下，读写比率通常是3：7。

例如：业务需要求IOPS的总量是10万，读写比率为3：7。由于vsan延伸集群本地读的特性，读操作不需要跨站点，因此考虑数据站点之间带宽只考虑跨站点写即可。

数据站点带宽计算公式是：

B=Wb md mr

B：Bandwidth。数据站点之间的带宽。

WB：Write Bandwidth数据站点之间的写带宽。

MD: Data Multiplier：数据乘数

MR：Resynchronization multiplier 再同步乘数

其中，数据乘数由vSAN元数据跨站点写开销等相关的操作组成的（除了数据意外，元数据也需要跨站点写）。VMware建议将这个数值设置为1.4。

再同步乘数指的是数据站点之间同步事件（例如vSAN组件的状态信息）的所需要的总开销。这是数值VMware建议设置为1.25。再同步乘数和数据乘数其实都是跨站点写数据的额外开销。这两个数值使用vSAN推荐值即可。

2．案例分析

案例1.

vSAN运行一个IOPS为1万的全写负载业务。写的block为4KB。这需要消耗40MB/s的数据站点间的带宽（4KB*10000），也就是320Mbps。

按照上一小节的计算公式：

B=320Mbps 1.4 1.25=560Mbps

因此，在这个负载情况下，vSAN数据站点之间需要的带宽至少应为560Mbps。

案例2.

vSAN运行负载为3万全写IOPS，4KB block size，这需要120MB/s（960Mbps）跨站点写数据吞吐量。

按照公式：

B=960Mbps 1.4 1.25=1680Mbps约等于1.7Gbps.

因此，在这个案例中，数据站点之间的带宽至少应为1.7Gbps.

四．数据站点与仲裁站点之间的带宽需求

1.计算公式

数据站点并不存放虚拟机的数据，只是用于投票使用，因此数据站点与仲裁站点之间的带宽计算公式与上面的不一样。

我在之前的文章提到过，vSAN是基于策略驱动的分布式存储。数据是以对象的方式存储在vSAN中的，一个VM在vSAN存储中的数据由一个或者多个组件组成，组件有如下类型：

VM Folder
VMware swap file
VMDK
快照
在vSAN中，当一个对象的大小大于255GB的时候，就会被自动划分成多个组件。仲裁站点与数据站点之间的计算公式如下：

1138B*NumComp/5seconds

其中，1138B这个数字是：当主站点down，备站点接管所有组件所需要的时间。我们想象一下，当主站点down，备站点将成为master。仲裁站点将会向新的master发送确认信息，确认master的角色已经发生了变更。从本质上讲，1138B是当主站点down以后，仲裁站点需要从元数据信息中获取主站点上所有组件已经failed并且随后由备站点take ownership的状态信息更新开销。当主站点down以后，仲裁站点与数据站点之间的带宽应足以让集群中所有部件的master ownership变更在5秒内发变更完成。

2．案例分析

案例1：

虚拟机由如下内容组成：

三个对象：

VM namespace
VMKD（小于255GB）
VM Swap file
FTT=1
Stripe width=1
以上配置的虚拟机数量是166个，那么仲裁站点就需要获取到996个组件信息。996=3 2 1*166.

我们用1000进行计算：B=1138B 8 1000/5s=1820800bps=1.82Mbps

VMware推荐预留10%的额外带宽用于信息双向传输：1.82*1.1=2Mbps。因此，在这个场景下，数据站点与仲裁站点的带宽应为2Mbps。
案例2：
虚拟机由如下内容组成：
三个对象：
VM namespace
VMDK（小于255GB）
VM Swapfile
此外：
FTT=1
Stripe width=2

如果具有以上配置的虚拟机数量为1500，那么仲裁站点将会维持18000个组件的状态信息。3 2 2 1 1500=18000
按照案例1中的算法：
B=1138B 8 18000/5s=32.78Mbps
B*1.2=36.05Mbps

因此，在这个场景下，数据站点与仲裁站点之间的带宽需要36.06Bbps。

根据上面的算法，可以提炼一个简单的公式用于在日常的评估，那就是2Mbps带宽可以维系1000个组件的状态信息。因此，在这个场景下，维系18000个组件，所需要的带宽是：18000/1000*2Mbps=36Mbps。

七．2-Node vSAN配置仲裁站点的带宽
在vSAN6.1中，支持2节点的vSAN集群。也就是我在< VMware的灾备与双活----我在vForum 2015分会场的分享（2）>中提到的vSAN延伸集群最小1+1+1，最大15+15+1的配置。

案例1：
2-Node配置中的虚拟机特性如下：虚拟机数量：25；VMDK/VM：1TB；FTT=1；Stripe width=1
上面我们提到过，vSAN中，一个vmdk组件最大为255G，因此每个VMDK由4个组件组成，此外由于FTT=1，在包含副本的情况下，每个vmdk由8个组件组成。加上VM namespace和swap文件（有副本），那么一个虚拟机的组件总数为12=4 2+2 2。25个虚拟机组件总量为300=25 12。
使用通用公式：300/1000 2Mbps=600Kbps。因此，在这种场景下，数据站点与仲裁站点之间的带宽应为600Kbps。
案例2：
在2-Node配置中，每个主机上有100个虚拟机，每个虚拟机有1TB的VMDK，FTT和stripe width均为1。那么，组件的总量为：(1000/255+1+1) 2 100(VMs) 2(Hosts)=2400
按照通用公式，2400个组件，需要的带宽为2400/1000 2Mbps=4.8Mbps。因此在这个场景中，仲裁站点到数据站点之间的带宽需要4.8Mbps。
需要注意的是，如果一套vSAN延伸集群承担多个类型的业务负载，那么需要把这些业务负载先单独计算其需要的带宽，然后将其累加在一起。

6. vsan 虚拟机存储策略不合规怎么处理

vsan 虚拟机存储策略不合规的处理方法

到vm storage policy修改已经创建好的存储策略
选中一条，我们修改它
我们新增一条，添加
我们选择了一个增加磁盘条带功能，选择3条，点击ok
这里看到，这条存储策略已经在使用了，问你是否要现在更新，还是晚点手动更新，我们这里手动晚点更新
然后我们回到应用了刚改修改了vm 存储策略的虚拟机的位置，进入存储策略，看到之前的策略已经过期了，我们要手动更新它
选中下图圈中的按钮，Reapply the VM Storage Policy to all out of date entities
它会提示是否更新，我们选择是

7. 分布式存储最佳缓存比

作者：深入细节的 SmartX 一线技术团队

近日，VMware 发布了 vSAN 8，对存储架构进行了重大更新。其中最主要的变化，即引入了新的 Express Storage Architecture（ESA）架构：用“存储池”替代了原存储架构（OSA）中的“磁盘组”，并不再需要专用 SSD 承担缓存加速功能，一定程度上避免了 8.0 之前版本中的专用缓存盘利用率低、易发生缓存击穿等问题。
而值得一提的是，在 vSAN 大版本更新之前，SmartX 即通过统一缓存空间和智能冷热数据管理优化了分布式存储缓存机制，有效规避了上述问题。本文将通过重点解读 vSAN（以 vSAN 7 为例）和 SmartX 分布式块存储组件 ZBS* 缓存机制的原理，并测试对比两种缓存机制下虚拟机性能表现，让读者更好地了解两种技术实现机制的区别对业务可能带来的实际影响。

* ZBS 内置于 SmartX 超融合软件 SMTX OS，可与 SmartX 原生虚拟化 ELF 搭配提供服务。

本文重点
vSAN 7 采用划分读写缓存空间的机制，将缓存磁盘按照容量占比划分为写缓冲区（30%）和读缓存区（70%）。这种方式可能出现缓存利用率低、在访问数据量过大时导致缓存击穿，进而引起性能下降等问题。
ZBS 采用统一缓存空间的机制，并通过 2 级 LRU 算法对冷热数据进行管理，在充分利用缓存容量的同时避免了因访问量激增导致虚拟机性能下降的情况。
本文基于相同的硬件配置和 I/O 读写场景，分别测试 VMware 超融合（vSphere 虚拟化 + vSAN 分布式存储）写入 300 GB 数据、SMTX OS（ELF + ZBS）写入 500 GB 数据时虚拟机的性能表现。结果显示，vSAN 7 难以充分利用缓存介质，发生缓存击穿，导致存储性能下降；而 SMTX OS 即便在写入更多数据的情况下也未发生缓存击穿，虚拟机性能保持稳定。
场景问题
混闪配置是超融合或分布式存储现阶段的主流落地模式。混闪配置是指机器中的磁盘使用 SSD + HDD 混合组成，其中 SSD 磁盘作为数据缓存层，而 HDD 磁盘作为数据容量层。以该模式构建的分布式存储池通过软件算法进行冷热数据自动判断，在提供高性能的同时，还可获得较大的存储容量，进而提升资源利用率，获得相对全闪存储更高的性价比。

在将 SSD 磁盘用作数据缓存层时，部分超融合产品会将缓存容量（Cache）划分为读和写各自独立的两部分。例如，vSAN 7 及更早版本会将每个磁盘组（Disk Group）中的缓存磁盘，按照容量占比划分为写缓冲区（30%）和读缓存区（70%），当读取数据未命中缓存或者写缓存已满，将会直接从容量层进行读写。

8. VSAN 如何处理磁盘或主机故障

原则上，一个VSAN cluster至少需要三个node（容错为1，冗余为1），每个node上至少有一个disk group。这些disk group可构成一个VSAN的datastore，对外提供存储池服务。存放在这个VSAN datastore上的每个object，会在根据容错和冗余要求在多个disk group上创建副本。所以当一个磁盘或者node故障了，VSAN还有其他node和disk group上的副本数据可以用。

vsan存储有冗余

与vsan存储有冗余相关的内容