1. 国内做分布式存储研发的公司有哪些_国内知名分布式存储厂商
做过一些集成项目,国内集群NAS(分布式文件系统)这块了解一些,随便说说,仅限于通用集群NAS
宣传自研集群NAS的公庆乎司不少,OEM居多,做研发的不多,完全自研就更少了
列一些接触过,完全自研,产品化程度相对高一些的吧
大一点的,华为(oceanstor9000),曙光(parastor)
市场上见的比较多了
小一点的,龙存,这个算是老牌子了
聚存,这个知道的人不多
基于ceph的公司这几年不少,用过其中一家的东西,块这块还行,文件这块还需要时间
分布式存储其实是一个比较大的领域
有分布式数据库、分布式文件系统、分布式块(ServerSAN)、分布式对象存储之类
做的公司挺多,不过真正都自己的代码的挺少,很多都是开源改的
分布式数据来说一般互联网公司用的多,像阿里,腾讯、网络都有自己没差卜分布式数据库
国内做分布式文件系统来说,数中科院的一帮人做的最早
从中科院出来人基本的分为三家,曙光,龙存,达沃
这三家基本都属于自研并且应用时间都在国内来说时间最久了
也有像华为、淘枯穗宝、网络、腾讯的文件系统
2. 分布式存储是什么东西
关于分布式存储实际上并没有一个明确的定义,甚至名称上也没有一个统一的说法,大多数情况下称作 Distributed Data Store 或者 Distributed Storage System。
其中维基网络中给 Distributed data store 的定义是:分布式存储是一种计算机网络,它通常以数据复制的方式将信息存储在多个节点中。
在网络中给出的定义是:分布式存储系统,是将数据分散存储在多台独立的设备上。分布式网络存储系统采用可扩展的系统结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,它不但提高了系统的可靠性、可用性和存取效率,还易于扩展。
尽管各方对分布式存储的定义并不完全相同,但有一点是统一的,就是分布式存储将数据分散放置在多个节点中,节点通过网络互连提供存储服务。这一点与传统集中式存储将数据集中放置的方式有着明显的区分。
3. 四大开源数据库是哪些
如果打算为项目选择一款免费、开源的数据库,那么你可能会在MySQL与PostgreSQL之间犹豫不定。MySQL与PostgreSQL都是免
费、开源、强大、且功能丰富的数据库。你主要的问题可能是:哪一个才是最好的开源数据库,MySQL还是PostgreSQL呢?该选择哪一个开源数据库
呢?
在选择数据库时,你所做的是个长期的决策,因为后面如果再改变决定将是非常困难且代价高昂的。你希望一开始就选择正确。两个流行
的开源数据库MySQL与PostgreSQL常常成为最后要选择的产品。对这两个开源数据库的高层次概览将会有助于你选择最适合自己需要的。
MySQL
MySQL相对来说比较年轻,首度出现在1994年。它声称自己是最流行的开源数据库。MySQL就是LAMP(用于Web开发的软件包,包括
Linux、Apache及Perl/PHP/Python)中的M。构建在LAMP栈之上的大多数应用都会使用MySQL,包括那些知名的应用,如
WordPress、Drupal、Zend及phpBB等。
一开始,MySQL的设计目标是成为一个快速的Web服务器后端,使用
快速的索引序列访问方法(ISAM),不支持ACID。经过早期快速的发展之后,MySQL开始支持更多的存储引擎,并通过InnoDB引擎实现了
ACID。MySQL还支持其他存储引擎,提供了临时表的功能(使用MEMORY存储引擎),通过MyISAM引擎实现了高速读的数据库,此外还有其他的
核心存储引擎与第三方引擎。
MySQL的文档非常丰富,有很多质量不错的免费参考手册、图书与在线文档,还有来自于Oracle和第三方厂商的培训与支持。
MySQL近几年经历了所有权的变更和一些颇具戏剧性的事件。它最初是由MySQL
AB开发的,然后在2008年以10亿美金的价格卖给了Sun公司,Sun公司又在2010年被Oracle收购。Oracle支持MySQL的多个版
本:Standard、Enterprise、Classic、Cluster、Embedded与Community。其中有一些是免费下载的,另外一
些则是收费的。其核心代码基于GPL许可,对于那些不想使用GPL许可的开发者与厂商来说还有商业许可可供使用。
现在,基于最初的
MySQL代码还有更多的数据库可供选择,因为几个核心的MySQL开发者已经发布了MySQL分支。最初的MySQL创建者之一Michael
"Monty"
Widenius貌似后悔将MySQL卖给了Sun公司,于是又开发了他自己的MySQL分支MariaDB,它是免费的,基于GPL许可。知名的
MySQL开发者Brian Aker所创建的分支Drizzle对其进行了大量的改写,特别针对多CPU、云、网络应用与高并发进行了优化。
PostgreSQL
PostgreSQL标榜自己是世界上最先进的开源数据库。PostgreSQL的一些粉丝说它能与Oracle相媲美,而且没有那么昂贵的价格和傲慢的客服。它拥有很长的历史,最初是1985年在加利福尼亚大学伯克利分校开发的,作为Ingres数据库的后继。
PostgreSQL是完全由社区驱动的开源项目,由全世界超过1000名贡献者所维护。它提供了单个完整功能的版本,而不像MySQL那样提供了多个
不同的社区版、商业版与企业版。PostgreSQL基于自由的BSD/MIT许可,组织可以使用、复制、修改和重新分发代码,只需要提供一个版权声明即
可。
可靠性是PostgreSQL的最高优先级。它以坚如磐石的品质和良好的工程化而闻名,支持高事务、任务关键型应用。
PostgreSQL的文档非常精良,提供了大量免费的在线手册,还针对旧版本提供了归档的参考手册。PostgreSQL的社区支持是非常棒的,还有来
自于独立厂商的商业支持。
数据一致性与完整性也是PostgreSQL的高优先级特性。PostgreSQL是完全支持ACID特性
的,它对于数据库访问提供了强大的安全性保证,充分利用了企业安全工具,如Kerberos与OpenSSL等。你可以定义自己的检查,根据自己的业务规
则确保数据质量。在众多的管理特性中,point-in-time
recovery(PITR)是非常棒的特性,这是个灵活的高可用特性,提供了诸如针对失败恢复创建热备份以及快照与恢复的能力。但这并不是
PostgreSQL的全部,项目还提供了几个方法来管理PostgreSQL以实现高可用、负载均衡与复制等,这样你就可以使用适合自己特定需求的功能
了。
4. Ceph为什么越来越火国内使用ceph较为成功的存储厂商有哪些
Ceph是当前非常流行的开源分布式存储系统,具有高扩展性、高性能、高可靠性等优点,同时提供块存储服务(rbd)、对象存储服务(rgw)以及文件系统存储服务(cephfs)。目前也是OpenStack的主流后端存储,随着OpenStack在云计算领域的广泛使用,ceph也变得更加炙手可热。国内目前使用ceph搭建分布式存储系统较为成功的企业有x-sky,深圳元核云,上海UCloud等三家企业。
5. 国内有哪些知名的分布式存储厂商
杉岩数据,专注软件定义存储,已经在政府、金融、医疗、能源、电力等多个行业近百家用户中成功部署,成功经验丰富!
6. 现在使用较广泛的分布式存储产品有哪些
分布式存储应用十分广泛,在云计算领域十分常见。因为业务特点和自身实力和资源等综合原因,很多大型的云计算厂商都会选择自主开发或二次开发分布式存储系统,这些厂商本身的产品性能也会比较稳定,在此我列举一下这些厂商。
1. 公有云方面:阿里云的盘古和腾讯的PaxosStore,这两个存储系统分别支撑了大多数阿里云和腾讯系产品的存储和计算。
2. 私有云方面:国外的有VMware的vSAN,谷歌的Google Megastore等;国内的有新华三的ONEStor、华为的FusionStorage、云宏的WinStore等。
在这里特别提一下云宏的WinStore存储,他们的产品在金融领域应用非常广泛,除了自主研发的虚拟化平台,他们也特别提到这个存储技术,WinStore是他们自主研发的分布式存储系统,使得他们的产品在数据存储安全性和容灾性能上有优势。
7. 云计算平台有哪些_云计算平台排名
云计算平台可以划分为3类:以数据存储为主的存储型云平台,以数据处裤肢理为主的计算型云平台以及计算和数据存储处理兼顾的综合云计算平台
云计算平台是云计算时代兵家争夺激烈的地方。
1.开源云计算平台
(1)AbiCloud(Abiquo公司)
AbiCloud是一款用于公司的开源的云计算平台,使公司能够以快速、简单和可扩展的耐耐方式创建和管理大型、复杂的IT基础设施(包括虚拟服务器、网络、应用、存储设备等)
(2)Hadoop(Apache基金会)
该计划是完全模仿Google体系架构做的一个开源项目,主要包括Map/Rece和HDFS文件系统
(3)Eucalyptus项目(加利福尼亚大学)
创建了一个使企业能够使用它们内部IT资源(包括服务器、存储系统、网络设备)的开源界面,来建立能够和AmazonEC2兼容的云
(4)MongoDB(10gen)
MongoDB是一个高性能、开源、无模式的文档型数据库,它在许多场景下可用于替代传统的关系型数据库或键/值存储方式
(5)Enomalism弹性计算平台
它提供了一个功能类似于EC2的云计算框架。Enomalism基于Linux,同时支持Xen和KernelVirtualMachine(KVM)。与其他纯IaaS解决方案不同的是,Enomalism提供了一个基于TurboGearsWeb应用程序框架和Python的软件栈
(6)Nimbus(网格中间件Globus)
Nimbus面向科学计算需求,通过一组开源工具来实现基础设施即服务(IaaS)的云计算解决方案
2.云计算平台厂商
(1)微软
技术特性:整合其所用软件及数据服务
核心技术:大型应用软件开发技术
企业服务:Azure平台
开发语言:.NET
(2)Google
技术特性:储存及运算水平扩充能力
核心技术:平行分散技术MapRece,BigTable,GFS
企业服务:GoogleAppEngine,应用代管服务
开发语言:Python,Java
(3)IBM
技术特性:整合其所有软件及硬件服务
核心技术:网格技术,分布式存储,动态负载
企业服务:虚拟资源池提供,企业云计算整合方案
(4)Oracle
技术特性:软硬件弹性虚拟平台
核心技术:Orackle的数据存储技术,Sun开源技术
企业服务:EC2上的Oracle数据库,OracleVM,SunxVM
(5)Amazon
技术特性:弹性虚拟平台
核心技术:虚拟化技术Xen
企业服务:EC2、S3,SimpleDB、SQS
开发语言:
(6)Saleforce
技术特性:弹性可定制商务软件
核心技术:应用平台整合技术
企业服昌纯春务:Force
开发语言:Java,APEX
(7)EMC
技术特性:信息存储系统及虚拟化技术
核心技术:Vmware的虚拟化技术,一流存储技术
企业服务:Atoms云存储系统,私有云解决方案
(8)阿里巴巴
技术特性:弹性可定制商务软件
核心技术:应用平台整合技术
企业服务:软件互联平台,云电子商务平台
(9)中国移动
技术特性:坚实的网络技术丰富的带宽资源
核心技术:底层集群部署技术,资源池虚拟技术,网络相关技术
了解更多开源相关,去LUPA社区看看吧。
8. 在大数量级的数据存储上,比较靠谱的分布式文件存储有哪些
一、 Ceph
Ceph最早起源于Sage就读博士期间的工作、成果于2004年发表,并随后贡献给开源社区。经过多年的发展之后,已得到众多云计算和存储厂商的支持,成为应用最广泛的开源分布式存储平台。
二、 GFS
GFS是google的分布式文件存储系统,是专为存储海量搜索数据而设计的,2003年提出,是闭源的分布式文件系统。适用于大量的顺序读取和顺序追加,如大文件的读写。注重大文件的持续稳定带宽,而不是单次读写的延迟。
三、 HDFS
HDFS(Hadoop Distributed File System),是一个适合运行在通用硬件(commodity hardware)上的分布式文件系统,是Hadoop的核心子项目,是基于流数据模式访问和处理超大文件的需求而开发的。该系统仿效了谷歌文件系统(GFS),是GFS的一个简化和开源版本。