Ⅰ minio分布式存储真香,还不赶快了解下
在开发中经常会用到的就是文件存储了,以前经常都是在服务器目录上映射一个目录用来存储文件,这个当然也没有问题,如果存储量不大的话。当然还有的会选择使用第三方存储比如七牛云、阿里云的oss云储存方案,自己搭建常用的可能会使用fastdfs或其他的,我接触minio后发现这个还是很不错,使用简单,支持多种语言SDK开发起来特别方便,多的就不说了,赶快上车了解下。
文档地址: minio相关文档
docker快速安装单机版:(默认你已经安装了docker环境,不清楚先了解docker安装使用再来吧!)
GNU/Linux 和 macOS
Windows
特别提醒:(-v 映射路径一定要是绝对路径,不然启动会报错)
启动成功后访问浏览器: http://localhost :{port} 进行访问,不指定key和secret默认都是minioadmin,访问后进入登陆页面,输入key和secret即可登陆,登陆成功页面如下:
接下来点击红色按钮创建一个存储桶,即可上传文件,比如创建一个test
Ⅱ 《大规模分布式存储系统原理解析与架构实战》epub下载在线阅读,求百度网盘云资源
《大规模分布式存储系统》(杨传辉)电子书网盘下载免费在线阅读
链接:https://pan..com/s/1CG8nBAVixYg53OHREZc_3g
书名:大规模分布式存储系统
作者:杨传辉
豆瓣评分:7.8
出版社:机械工业出版社
出版年份:2013-9-1
页数:293
内容简介:
《大规模分布式存储系统:原理解析与架构实战》是分布式系统领域的经典着作,由阿里巴巴高级技术专家“阿里日照”(OceanBase核心开发人员)撰写,阳振坤、章文嵩、杨卫华、汪源、余锋(褚霸)、赖春波等来自阿里、新浪、网易和网络的资深技术专家联袂推荐。理论方面,不仅讲解了大规模分布式存储系统的核心技术和基本原理,而且对谷歌、亚马逊、微软和阿里巴巴等国际型大互联网公司的大规模分布式存储系统进行了分析;实战方面,首先通过对阿里巴巴的分布式数据库OceanBase的实现细节的深入剖析完整地展示了大规模分布式存储系统的架构与设计过程,然后讲解了大规模分布式存储技术在云计算和大数据领域的实践与应用。
《大规模分布式存储系统:原理解析与架构实战》内容分为四个部分:基础篇——分布式存储系统的基础知识,包含单机存储系统的知识,如数据模型、事务与并发控制、故障恢复、存储引擎、压缩/解压缩等;分布式系统的数据分布、复制、一致性、容错、可扩展性等。范型篇——介绍谷歌、亚马逊、微软、阿里巴巴等着名互联网公司的大规模分布式存储系统架构,涉及分布式文件系统、分布式键值系统、分布式表格系统以及分布式数据库技术等。实践篇——以阿里巴巴的分布式数据库OceanBase为例,详细介绍分布式数据库内部实现,以及实践过程中的经验。专题篇——介绍分布式系统的主要应用:云存储和大数据,这些是近年来的热门领域,本书介绍了云存储平台、技术与安全,以及大数据的概念、流式计算、实时分析等。
作者简介:
杨传辉,阿里巴巴高级技术专家,花名日照,OceanBase核心开发人员,对分布式系统的理论和工程实践有深刻理解。曾在网络作为核心成员参与类MapRece系统、类Bigtable系统和网络分布式消息队列等底层基础设施架构工作。热衷于分布式存储和计算系统设计,乐于分享,有技术博客NosqlNotes。
Ⅲ 各大巨头纷纷布局IPFS分布式存储
近年来,大部分投资者都曾有过一个疑问:“为什么华为、阿里、亚马逊不使用IPFS&Filecoin,IPFS&Filecoin发展前景如何,到底能否取代传统的数据中心”,其实,传统的云存储和分布式存储之间并不是非此即彼的选择题,双方是可以求同存异、共生互补的,同时,由于IPFS&Filecoin分布式存储顺应时代需求,具有足够的创新性和广阔的应用场景,因此,阿里、华为、亚马逊等巨头早已纷纷布局IPFS&Filecoin,接下来,我们就来看看他们是如何将IPFS&Filecoin与自身业务相结合的。
京东智联云无线宝引入IPFS
京东智联云事业部无线宝业务总经理张晓东在杭州IPFS生态与分布式存储产业峰会上,发表了以《基于京东云无线宝智能终端及其价值共享理念,构建IPFS基础设施》为主题的演讲,其中张晓东谈到,京东也好,阿里也好,拼多多也好,其实我们都有很大的电商生态,当其所产生的价值和消费生态结合在一起,就将是未来整个币圈和消费生态结合在一起的很重要的方向。
京东云会成为京东的底层基础设施,把京东的技术体系的积累以云为出口输出给行业或者企业的客户。而路由器将会成为一个家庭的入口,但是路由器加上存储有可能会成为家庭的网络连接和数据管理的终端平台,因此,京东的路由器无线宝就是京东在云存储领域王炸品牌,而无线宝需要使用到IPFS。
路由器市场每年有1亿台,京东则会做出更漂亮、更有特色、能赚钱的无线宝路由器,使路由器不再被放置在家里的角落,而像摆件一样放置在明显的桌上,会赚钱其实是指赚金豆,一个金豆等于一分钱,每一个金豆都可以在京东平台做消费,也就是说,京东通过路由器随着植入,把资源做一个变现。
无线宝有一个技术变现体系,是基于P2P的变现,这就需要结合到IPFS。
无线宝将会通过用户闲散的带宽资源做一些变现,因为这个产品部署在用户的家里面,千家万户完全分散就意味着是分散的、分布式的,未来区块链也好,IPFS也好,完全可以植入到这样一个产品里面。
无线宝有闲置的存储和带宽资源,用户可以把一些有价值的文件、数据分布式缓存在无线宝上面,做一些有价值的产品变现,结合到IPFS技术,总的存储成本是非常低的,但是数据的价值是非常的高,无线宝上结合IPFS,或许还能创造一些新的场景的应用,并实现节点与节点之间的价值的转移。
沧州华为云计算大数据中心引入IPFS
2020年6月13日,沧州云智大数据产业园签约仪式启动,此次仪式就沧州华为云在数据中心IDC业务、云计算及分布式存储等方面达成框架合作协议,共同建设服务器集群基础设施。
沧州华为云计算大数据中心由市政府与华为技术有限公司合作建立,位于沧州市高新技术开发区,总投资超4亿元,数据机房规划3000个可用IT机柜模块,是沧州市打造的大数据产业发展基地。
据沧州政府官网以及相关媒体报道,此次沧州华为云服务器集群将引入IPFS分布式存储技术共同搭建,通过IPFS技术,文件在上传时会瞬间打碎成N个加密碎片,分散存储于不同的服务器中,在下载时再自动合成为完整的源文件,具有高安全性和隐私性更高效、更便宜、数据永久性等四大优势,IPFS分布式存储技术将成为沧州市大数据产业发展基地的新亮点。
亚马逊云布局IPFS存储市场
7月3日,亚马逊云解决方案架构师华东区经理吴鹏程在2020 IPFS生态与分布式存储产业峰会上发表主题演讲《快速构建全球化IPFS及区块链平台》。
首先,吴鹏程对IPFS分布式存储技术给予了认同,由于IPFS具有7X24极高稳定性、全球布局能力、海量存储能力、无限公网宽带和IP、高性能的CPU/GPU,因此IPFS天然地和公有云契合,以打造更快的“高速公路”。
亚马逊云充分看到了IPFS所蕴含的庞大存储市场,因此从硬件、软件、金融层面多方面布局IPFS产业生态链,正如吴鹏程所说:“亚马逊作为服务商,我们可以和造铁路的有很好的合作,比如说挖矿、交易所上面我们都可以有非常紧密的一些合作,挖矿可以提供各种GPU、CPU,还有各种类型的存储,实现低成本,快速使用的场景,交易所场景下5大需求快速因上落地,有很好的架构实现。”
此外,根据IPFS第144期周报,在AWS S3已经可以将文件转移到IPFS上。
阿里云布局IPFS存储市场
8月3日,在“星际漫游指南·逐鹿中原·IPFS技术与应用研讨论坛”上,阿里云高级解决方案架构师西城进行了以《云端分布式存储的发展》为题的演讲。
西城认为,从云的业务角度看来,阿里已经在很多层面做了相当多的技术积累,特别是在计算节点调度和存储节点方面。企业们如果希望云产品能具有特点,就不要把所有精力投入在云端分布式存储和整个管理部署架构上,而应该更多的提高其算力,并做一些可以提升存力的技术开发并进行相应的业务拓展。
BaaS,是阿里云旗下的云平台之上的区块链平台服务,提供区块链系统的部署、运维、治理能力,提供区块链应用运行和管理的能力,它是云上的区块链应用;BaaS也是云计算与区块链是一个完美的结合,能够助力用户在IPFS领域实现落地应用。
功能丰富,涉及到存证、智能合约和BaaS,这几块都是区块链的典型商用模式,全球接入、成本弹性、性能可控、安全防护是区块链云上部署未来所需要关注和努力的方向。
IPFS不仅是分布式存储,更蕴含了庞大的分布式存储的生态,阿里云积极研究和布局IPFS,积极为IPFS生态应用的构建提供一个良好的孵化平台,让区块链和IPFS从业者能够更好的致力于创新和更高效地成长。
巨头加持,分布式存储势不可挡
IPFS是一项被诸多媒体纷纷报道的对标HTTP的新一代互联网技术,而无论是阿里、华为还是亚马逊,巨头之所以成为巨头,就是因为他们有更敏锐的市场嗅觉、更广泛的商业布局、更开放的商业心态。当我们在纠结IPFS到底是否有发展前景的时候,这些巨头们已经在你看不见的地方展开了宏大的布局,或数据存储、或生态应用、或技术研发,同样,这些巨头们也用实际行动告诉我们,分布式存储的未来,势不可。
学着用开放的、积极的心态去拥抱新事物,或许,真的能遇到一个属于你的风口。
Ⅳ 什么是分布式存储
分布式存储系统,是将数据分散存储在多台独立的设备上。传统的网络存储系统采用集中的存储服务器存放所有数据,存储服务器成为系统性能的瓶颈,也是可靠性和安全性的焦点,不能满足大规模存储应用的需要。分布式网络存储系统采用可扩展的系统结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,它不但提高了系统的可靠性、可用性和存取效率,还易于扩展。
(4)分布式存储高级开发扩展阅读:
分布式存储,集中管理,在这个方案中,共有三级:
1、上级监控中心:上级监控中心通常只有一个,主要由数字矩阵、认证服务器和VSTARClerk软件等。
2、本地监控中心:本地监控中心可以有多个,可依据地理位置设置,或者依据行政隶属关系设立,主要由数字矩阵、流媒体网关、iSCSI存储设备、VSTARRecorder软件等组成;音视频的数据均主要保存在本地监控中心,这就是分布式存储的概念。
3、监控前端:主要由摄像头、网络视频服务器组成,其中VE4000系列的网络视频服务器可以带硬盘,该硬盘主要是用于网络不畅时,暂时对音视频数据进行保存,或者需要在前端保存一些重要数据的情况。
Ⅳ 分布式开发主要用到什么
在谈分布式系统架构前,我们先来看看,什么是分布式系统?
假设原来我们有一个系统,代码量30多万行。现在拆分成20个小系统,每个小系统1万多行代码。
原本代码之间都是直接基于Spring框架走JVM内存调用,现在拆开来,将20个小系统部署在不同的机器上,然后基于分布式服务框架(比如bbo)搞一个rpc调用,接口与接口之间通过网络通信来进行请求和响应。
所以分布式系统很重要的特点就是服务间要跨网络进行调用。
此外,分布式系统可以大概可以分成两类。
(一)、底层的分布式系统
比如hadoop hdfs(分布式存储系统)、spark(分布式计算系统)、storm(分布式流式计算系统)、elasticsearch(分布式搜索系统)、kafka(分布式发布订阅消息系统)等。
(二)、分布式业务系统
分布式业务系统,把原来用java开发的一个大块系统,给拆分成多个子系统,多个子系统之间互相调用,形成一个大系统的整体。
举个例子,假设原来你做了一个OA系统,里面包含了权限模块、员工模块、请假模块、财务模块,一个工程,里面包含了一堆模块,模块与模块之间会互相去调用,1台机器部署。
现在如果你把他这个系统给拆开,权限系统,员工系统,请假系统,财务系统,4个系统,4个工程,分别在4台机器上部署。
然后一个请求过来,完成这个请求,员工系统去调用权限系统,调用请假系统,调用财务系统,4个系统分别完成了一部分的事情。
最后4个系统都干完了以后,才认为是这个请求已经完成了。这就是所谓的分布式业务系统。
Ⅵ 分布式存储系统的应用方案
在一个视频监控系统中,选择什么样的存储解决方案直接决定了整个系统的系统架构以及系统的性能和稳定程度。
一种是在摄像监控前端采用有一定存储容量(如1.2T)的DVR设备,所有需要的数据均保存在前端DVR的存储设备中,比较好的方案中,后台软件可以管理和维护多台的DVR设备,包括这些DVR设备的存储数据,如录像的转存、删除和回放等功能。这种方案中所有数据主要保存在DVR中,后台主要负责维护和必要的存储。
另一种是在摄像监控前端采用DVR或者网络视频服务器,而存储主要在远端通过后台的PC或者服务器软件来将数据保存在后台的存储设备上。
上述两种存储方案均有很多弊端,尤其当监控点很多,需要的存储量又很大的情况下,这些可能的弊端包括:由于存储分散导致难以维护;由于存储的专业程度不高导致存储的可靠性不高,进而导致整个系统的可靠性不高;存储的利用率不高;存储的扩展性不好。
为了克服这些弊端,并推荐使用基于分布式存储、集中管理思路的、以及基于iSCSI技术的IPSAN来作为视频监控的存储解决方案,这个方案的主要特点包括:
1、分布式存储,集中管理;
2、基于iSCSI技术的IPSAN(STorageAreaNetwork);
3、流媒体网关可以作为存储解决方案的核心设备。 在这个方案中,共有三级:
1、上级监控中心:上级监控中心通常只有一个,主要由数字矩阵、认证服务器和VSTARClerk软件等。
2、本地监控中心:本地监控中心可以有多个,可依据地理位置设置,或者依据行政隶属关系设立,主要由数字矩阵、流媒体网关、iSCSI存储设备、VSTARRecorder软件等组成;音视频的数据均主要保存在本地监控中心,这就是分布式存储的概念。
3、监控前端:主要由摄像头、网络视频服务器组成,其中VE4000系列的网络视频服务器可以带硬盘,该硬盘主要是用于网络不畅时,暂时对音视频数据进行保存,或者需要在前端保存一些重要数据的情况。
本地监控中心的存储设备也可以用一台服务器,带SCSI磁盘阵列的形式,但由于服务器的网络收发性能有限,从而影响整个存储系统的性能,因此有建议选用专业的iSCSI存储设备。 1) iSCSI原理简介
iSCSI 是由IETF 开发的一种基于存储网络的新的Internet 协议,iSCSI 的原理是将SCSI 命令通过IP 网络传输,这样就可以使在网络上传送数据更加便利,而且可以实现远程存储管理。
iSCSI 使标准的SCSI 命令能够在TCP/IP 网络上的主机系统(启动器,Initiator)和存储设备(目标器,target)之间传送。而且iSCSI 协议支持在系统之间传送标准的SCSI 命令。在系统之间的连接是通过标准的IP 网络基础设施实现的,iSCSI 的协议模型如图1 所示。
图2 iSCSI 的协议模型
iSCSI 的工作原理是:当终端用户或应用程序(启动器)发送一个请求后,操作系统将生成一个适当的SCSI 命令和数据请求,SCSI 命令通过封装,在需要加密的时候要执行加密处理。这些命令加上TCP/IP 协议的包头,就可以在以太网上传输。接收端(目标器)在收到这个数据包后按照相反的方向进行解包,解析出SCSI 命令和数据请求,SCSI命令再发送给SCSI 存储设备驱动程序,因为iSCSI 是双向的协议,所以它可以将数据返回给原来的请求。
2) 基于IP SAN的网络存储方案
图3 基于IP SAN 的网络存储方案
在这个解决方案中,网络视频服务器需要支持iSCSI 协议,是启动器,而位于监控中心的iSCSI 存储设备则是目标器。本地监控中心的iSCSI 存储设备可以充当多个网络视频服务器的存储设备,而且iSCSI 存储设备还可以再外挂磁带设备,进一步扩大存储容量。 在网络存储方案中,每台网络视频服务器均占有一个IP,如果希望通过Internet 来进行远程监控,则网络视频服务器的IP 地址必须是公网IP,在通常情况,公网IP 地址都是稀有资源;另外远程监控受到网络容量的限制以及网络拥塞的影响,带宽通常不能保证,给远程监控带来了不便,而卓扬科技的流媒体网关可以解决这两个问题。
卓扬科技的流媒体网关是一个嵌入式的硬件设备,所有的报文转发均是基于硬件转发(如果是软件转发,性能达不到要求),报文的转发能力可以达到1Gbps 以上,卓扬科技的流媒体网关的主要功能包括:
支持NAT 转换功能
支持视频分发功能,当多个远程监控的用户访问同一台网络视频服务器的时候,均需要向流媒体网关发请求,然后流媒体网关再向网络视频服务器发出请求,当流媒体网关收到网络视频服务器的数据后(注意视频服务器与流媒体网关之间的数据流只有一份)再负责分发给远端的多个监控用户支持视频点播服务,远端用户可以通过流媒体网关完成视频点播的功能支持iSCSI 的Initiator
卓扬科技的流媒体网关可以对上述的功能进行分别进行配置。
下图是一个流媒体网关与IP SAN 结合的网络视频监控的解决方案,在方案中,流媒体网关没有使能iSCSI 的Initiator,iSCSI 的Initiator 是由网络视频服务器完成,其中iSCSI 的存储流是把监控流封装了iSCSI 而成的。
图4 与流媒体网关相配合的网络存储方案1
下图的网络存储方案中,流媒体网关使能了iSCSI Initiator 功能,而网络视频服务器与流媒体网关传送的均是原始的视频数据流(与iSCSI 存储流相比)。
图5 中,需要对数据进行存储的时候,流媒体网关首先从网络视频服务器活动数据(①),然后再通过iSCSI 存储流将视频数据保存到iSCSI 的存储设备上(②)。当A 用户需要进行远程监控的时候,首先A 用户向流媒体网关发出请求(③),流媒体网关再向视频服务器获取数据(①),然后流媒体网关把监控视频数据发送给用户A(③)。当B 用户需要进行视频点播的时候,B 用户首先向流媒体网关发出请求(④),流媒体网关再向iSCSI 存储设备获取数据(②),然后然后流媒体网关把监控视频数据发送给用户B(④)。
图5 与流媒体网关相配合的网络存储方案2
另外,在图4 和图5 中,是否进行NAT 转换视组网需求而定,可以灵活配置。
五、 后记
基于iSCSI 的IP SAN 存储方案无疑是解决存储问题的一个良方,尤其当iSCSI 的存储设备的性能不断提高、价格不断降低的时候,采用这种方式就更是必然的选择,我们深信,基于iSCSI 技术的存储解决方案会逐渐成为大型网络视频监控中存储技术的主流。
Ⅶ 现在使用较广泛的分布式存储产品有哪些
分布式存储应用十分广泛,在云计算领域十分常见。因为业务特点和自身实力和资源等综合原因,很多大型的云计算厂商都会选择自主开发或二次开发分布式存储系统,这些厂商本身的产品性能也会比较稳定,在此我列举一下这些厂商。
1. 公有云方面:阿里云的盘古和腾讯的PaxosStore,这两个存储系统分别支撑了大多数阿里云和腾讯系产品的存储和计算。
2. 私有云方面:国外的有VMware的vSAN,谷歌的Google Megastore等;国内的有新华三的ONEStor、华为的FusionStorage、云宏的WinStore等。
在这里特别提一下云宏的WinStore存储,他们的产品在金融领域应用非常广泛,除了自主研发的虚拟化平台,他们也特别提到这个存储技术,WinStore是他们自主研发的分布式存储系统,使得他们的产品在数据存储安全性和容灾性能上有优势。
Ⅷ 国内做分布式存储研发的公司有哪些
做过一些集成项目,国内集群NAS(分布式文件系统)这块了解一些,随便说说,仅限于通用集群NAS。宣传自研集群NAS的公司不少,OEM居多,做研发的不多,完全自研就更少了。列一些接触过,完全自研,产品化程度相对高一些的吧。大一点的,华为 (oceanstor 9000),曙光(parastor)。市场上见的比较多了。小一点的,龙存,这个算是老牌子了。聚存,这个知道的人不多。基于ceph的公司这几年不少,用过其中一家的东西,块这块还行,文件这块还需要时间。分布式存储其实是一个比较大的领域。有分布式数据库、分布式文件系统、分布式块(ServerSAN)、分布式对象存储之类。做的公司挺多,不过真正都自己的代码的挺少,很多都是开源改的。分布式数据来说一般互联网公司用的多,像阿里,腾讯、网络都有自己分布式数据库。国内做分布式文件系统来说,数中科院的一帮人做的最早。从中科院出来人基本的分为三家,曙光,龙存,达沃。这三家基本都属于自研并且应用时间都在国内来说时间最久了。也有像华为、淘宝、网络、腾讯的文件系统。
Ⅸ Ipfs分布式存储如何工作它的网络发展又有几个阶段呢
Ipfs是一个分布式存储网络,它最重要的应用是存储。只是为了把某个文件永久地保存下来还不够,并且当有需要的时候,还能把这些内容再重新找出来。存储和检索这两个的集合才构成了IPFS应用的最终场景。
Ipfs从根本上改变了用户的搜索方式,通过ipfs用户能够直接搜索到想要的内容。以往,用户通过浏览器搜索文件首先要找到服务器的位置,然后使用路径名称在服务器上查找文件。这样一来,只有文件所有者可以判断这是否是用户要找的文件,并且必须保证托管者不会移除文件或关闭服务器对文件做任何更改。
当文件被添加到IPFS节点上后将生成一个新名字,这个名字实际上是根据文件内容计算出的一个加密哈希。加密能够保证该哈希始终指标是这一文件的内容,哪怕只在文件中修改一个比特的数据,哈希都会完全不同。
Filecoin分布式存储网络发展分为三个阶段
第一阶段,垃圾数据存储阶段
这是获取filecoin数量最多的阶段,由最原始积累到最大红利,它的任务主要是扩展网络空间,发现修补漏洞,并进行网络升级。收益比例是100%区块奖励。时间是2020年10月到2022年10月。
第二阶段,公共数据存储阶段。
这是商户转型阶段,由区块奖励到开发各类存储应用以及新一代互联网传输协议的推进。它的任务是扩张网络空间,提升网络安全,并开启存储应用。收益比例是70%区块奖励以及30%存储奖励。预计时间是2022年10月到2025年10月。
第三阶段是真实数据存储阶段,并且全面开启商用。
它的任务是真实存储企业、政府、个人数据以及扩大网络空间。收益比例是70%存储奖励和30%区块奖励。预计时间是2025年10月到未来。
另外为了实现分布式存储,filecoin白皮书中提到了几种证明机制。其中,最具特色的是复制证明和时空证明,这两种证明机制就是分布式存储项目filecoin目前需要做到的实现方式。复制证明是证实矿工保存了相应的有效数据,时空证明是证实矿工的存储设备中有有效数据的时刻。
总得来说,ipfs越来越成为 社会 发展的趋势,不知大家是否跟上了时代的脚步了吗?
Ⅹ 华为突破分布式数据库和存储技术,打通数字化转型“雄关漫道”
2019年,我们将进入数字化转型的攻关期。所谓“攻关期”即数字化转型2.0阶段,需要攻坚企业关键业务上云和数字化转型改造的课题。在一份市场调查公司IDC的报告中指出:IDC自2014年提出数字化转型以来,看到企业在数字化转型层面已经投入了大量人力物力,但是效果并不理想,有一些企业已经成功屹立在潮头,有一些企业在向上游进发,还有一些企业只能在浪潮的挟裹中被动前行。
对于企业来说,数字化转型是“雄关漫道”。IDC认为,目前阶段来看,企业亟待解决的是数字化能力提升,包括:与业务的深入结合能力;数据处理和挖掘能力;以及IT技术运营和管理能力。特别是数据处理和挖掘能力,因为数字化转型推进企业从以流程为核心向以数据为核心转型,对海量、异构、多类型的数据处理和挖掘能力是释放数据价值的前提,对数据全生命周期的管控治理是释放数据价值的保障。而随着数字化转型引入大量新技术而导致IT复杂度变高,企业IT技术运营和管理能力是提升企业“IT生产力”的关键。
攻关数字化转型的“雄关漫道”,需要一个具备融合、智能、可传承三大特性的数字平台。这是2019年3月华为与IDC联合推出的《拥抱变化,智胜未来—数字平台破局企业数字化转型》白皮书所提出的观点。融合主要指把传统技术和创新技术相结合;智能主要指平台智能化和智能化能力输出;可传承主要指解耦、功能复用、可配置等理念打造的架构。而承载这三大观点的,就是新一代分布式企业级技术。
2019年5月15日,华为发布了业界首款支持ARM架构的新一代智能分布式数据库GaussDB以及分布式存储FusionStorage 8.0,作为新一代数据基础设施,诠释了具备融合、智能、可传承三大特性的数字平台。华为常务董事、ICT战略与Marketing总裁汪涛在发布会上表示,千行百业正在加速智能化进程,越来越多的企业已经意识到数据基础设施是智能化成功的关键。华为围绕计算、存储和数据处理三个领域重定义数据基础设施,加速迈向智能时代。
今天所讨论云和工业互联网等概念的背后是一个新时代的到来,这就是体系架构大迁徙。传统企业级技术是在单体应用和单机环境中,保证数据存储、调用等操作的高可靠、高可用、高稳定,特别是满足金融级事物处理的ACID(原子性、一致性、隔离性和耐久性)要求,为企业关键业务提供数据管理支撑。随着企业技术向云架构迁移,数据库技术也面临转型。
2018年,基于云计算技术的分布式数据库成为了业界的热点。简单理解,云计算技术就是把“单机”环境替换为由X86服务器机群所组成的分布式计算环境。原先由几台小型机完成的计算任务,要分散到上百甚至上千台X86服务器上,而且还可能跨数据中心操作,挑战可想而之。特别是在线支付等金融级业务,不能在断网或网络连接有问题时出错,也不能因响应速度慢而影响用户体验。
2018年8月,中国支付清算协会与中国信息通信研究院联合举办了“金融分布式事务数据库研讨会”,与业界厂商和用户共商核心数据库分布式转型之路,同时发布了《金融分布式事务数据库》白皮书。金融分布式事务数据库的工作推进,为分布式数据库进入企业关键业务系统,提供了产业化支撑。而华为作为企业ICT解决方案供应商,早在2012年就开始研发面向大数据分析的数据仓库,在基于传统关系型数据库SQL引擎和事务强一致性等基础上,进行了分布式、并行计算的改造,历时6年打造了面向PB级海量数据分析的分布式数据库。
在OLAP数据仓库之外,华为与行业用户合作了面向OLTP的分布式事务型数据库研发。2017年,华为与招商银行合作成立了分布式数据库联合创新实验室,研发具有高性能企业级内核、完整支持分布式事物、满足金融行业对数据强一致要求、单机事物处理能力要达到每分钟百万级别等的OLTP分布式数据库。
本次发布的GaussDB数据库新品包括:联机事务处理OLTP数据库、联机分析处理OLAP数据库、事务和分析混合处理HTAP数据库。而华为GaussDB数据库将AI技术融入数据库设计、开发、验证、调优、运维等环节,可实现基于AI的自调优、自诊断自愈、自运维,让数据库更高效、更智能,引领数据库架构的发展。
更进一步,本次发布的GaussDB系列数据库是业界首款支持ARM芯片的分布式数据库。华为推动计算架构从以X86+GPU为主的单一计算架构到以X86+GPU+ARM64+NPU为主的异构计算架构快速发展。基于X86架构,华为引入AI管理和智能加速能力,率先推出了智能服务器FusionServer Pro;基于ARM64打造了业界性能最强的TaiShan服务器;基于Ascend芯片的Atlas智能计算,实现了业界首个端边云协同的人工智能平台。而GaussDB可充分利用并融合ARM、X86、GPU、NPU等多种异构算力组合,大幅提升数据库性能。
汪涛强调,作为全球首款AI-Native数据库,GaussDB有两大革命性突破:第一,首次将人工智能技术引入数据库的全生命周期流程,实现自运维、自管理、自调优和故障自诊断。在交易、分析和混合负载场景下,基于最优化理论,首创深度强化学习自调优算法,把业界平均性能提升60%。第二,支持异构计算,充分发挥X86/ARM/GPU/NPU多样性算力优势,最大化数据库性能,在权威标准测试集TPC-DS上,华为GaussDB排名第一。GaussDB还支持本地部署、私有云、公有云等多种场景。
在以云计算为代表的分布式计算环境中,数据管理解决方案除了需要分布式数据库外,为了更好的扩缩容以及满足多样化数据存储需求,计算与存储分离已经成为分布式数据库设计的主要架构。分布式云化架构,就是要支持计算、存储分离和多租户等架构设计要求。
GaussDB已经从数据库层面实现了高可用、高可靠、高稳定的分布式数据库,本次发布的FusionStorage 8.0则是分布式存储架构,创新地实现一套系统同时支持块、文件、对象、HDFS协议,1套存储支持4类存储能力,适用于全业务场景混合负载,最终让“一个数据中心一套存储”成为可能。
IDC发布的《中国软件定义存储(SDS)及超融合存储(HCI)系统市场季度跟踪报告,2018年第四季度》显示,2018年,软件定义存储市场达到了54.9%的同比增长。软件定义存储在中国整体存储市场的占有率稳步上升,分别达到了22.1%的市场占有率。华为凭借文件解决方案在政府、广电和电信等行业得到认可,在2018年中国软件定义存储市场排名第一。
FusionStorage 8.0采用华为ARM-based处理器鲲鹏920加速,使IOPS提升 20%,结合华为AI Fabric无损网络,时延进一步降低15%。基于华为在计算、网络和存储领域多年的芯片和算法积累,FusionStorage 8.0在SPC-1的性能测试中,单节点性能达到了16.8万IOPS以及1ms以内时延,成为承载企业关键应用的新选择。
此外,通过华为云的云上训练及本地AI芯片,FusionStorage 8.0将智能管理贯穿业务使用的全生命周期,如业务上线前对存储资源的规划,使用过程中的风险预判及故障定位,大幅提升存储效率,帮助行业客户应对智能时代的数据新挑战。
汪涛在发布会上强调,新一代智能分布式存储FusionStorage 8.0通过重定义存储架构,从“Storage for AI”和“AI in Storage”两个维度实现效率大幅提升,引领存储智能化。首先,“Storage for AI”通过融合共享,让AI分析更高效。其次,“AI in Storage”率先将AI融入存储全生命周期管理,从资源规划、业务发放、系统调优、风险预测、故障定位等方面实现智能运维。
辽宁移动就采用了华为FusionStorage。作为辽宁省内最大的移动通信运营商,辽宁移动一直在 探索 先进的存储方案在自身IT系统的应用。由于5G的快速发展,辽宁移动关键数据库的应用也向云化方向发展,分布式存储也要满足其可靠性和高性能要求。华为在深入分析辽宁移动需求后,首先在边缘开发测试业务小规模试点分布式存储,进行了大量的实验和测试后性能和可靠性都达到了预期,最终决定将全部业务迁移至FusionStorage。该方案通过采用双活、可写快照、端到端DIF等特性,顺利完成Billing、经营分析、B2B等系统从老旧存储至FusionStorage的搬迁工作,助力辽宁移动的存储架构迈入新的 历史 阶段。
值得一提的是,华为分布式数据库与华为分布式存储深度结合,把数据库的操作下沉到存储节点,极大提升了分布式数据库的性能。利用新的网络技术和人工智能技术,华为帮助用户提升数据中心的吞吐量,提升网络应用的可伸缩性,并且能自动调优。
除了推出新一代突破性的分布式数据库和存储技术外,华为也积极与客户、伙伴在数据库与存储领域,从行业应用、平台工具、标准组织和社区等多个层面共建开放、合作、共赢的产业生态。在行业应用层面,华为与软通智慧、神州信息、东华软件、易华录、用友政务、亚信国际等独立软件开发商长期合作;在平台和工具层面,华为与Tableau、帆软、ARM、Veritas等合作伙伴联合创新;在标准组织和社区层面,华为深度参与OpenSDS、中国人工智能产业联盟、OCP、OpenStack、CNCF基金会等组织和社区的建设。
总结来说,华为全线分布式数据库和分布式存储产品的发布,是华为具备融合、智能、可传承三大特性数字平台的最新成果。华为分布式数据库与分布式存储结合,能消除企业各业务系统数据孤岛,构建面向行业场景的数据建模、分析和价值挖掘能力,对多源异构的数据进行汇聚、整合和分析,形成统一的全量数据和数据底座,实现数据价值挖掘和共享。而基于AI的智能化,可对基础设施进行高效的管理,为行业应用开发和迭代赋能,全面帮助企业突破关键应用上云的“雄关漫道”。(文/宁川)