数据存储方案_大数据量存储的方案

1. 数据存储解决方案可以实现什么作用

数据存储解决方案可以实现的作用有以下8点：

1 信息资产的统一管控

企业运行过程中，可能产生一些违规数据，可将违规数据定位，并且统一删除，对所有用户的查询和使用集中控制。

2 分公司管理员角色设置

云企网盘可针对大中型企业，灵活的配置用户权限，可设置多级的管理员权限。

3 标准API接口，系统间无缝对接

云企网盘系统提供了全套的API接口，可完成所有功能的数据对接，其他系统调用即可将数据传输至云企网盘集中管理，安全存储。

云企网盘系统从底层上就设计为可对接的数据管理系统，各终端都通过API对系统进行访问。

4 按钮级权限设置

考虑到企业的数据管控，文件系统的防扩散。云企网盘的授权体系可细分到按钮，可以控制每个用户，能否操作每一个具体的功能。

5 集团级组织架构设置

云企网盘是针对企业管理设计的系统，可针对复杂的企业组织架构进行设置，可适用与集团级的大型企业。可对组织的级别、性质、顺序进行定义，可以添加、删除、移动组织单元。

6 信息资产的查询

云企网盘可根据数据的授权，统一对数据进行查询，可根据条件进行高级检索。

7 文档版本管理

文件上传更新以后，所有历史版本都会继续保存，这样即使工作中发生了失误，也可以通过网盘补救。查看原始文档找回丢失文件修复崩溃文档
找回错误覆盖的文件

8 信息资产的迁移

企业员工根据工作内容的变化，可能发生工作的交接情况，云企网盘可将员工的文件管理权限进行一键交接。快速的工作交接同时，也避免数据丢失，避免企业资产受损。

2. 数据存储形式有哪几种

【块存储】

典型设备：磁盘阵列，硬盘

块存储主要是将裸磁盘空间整个映射给主机使用的，就是说例如磁盘阵列里面有5块硬盘（为方便说明，假设每个硬盘1G），然后可以通过划逻辑盘、做Raid、或者LVM（逻辑卷）等种种方式逻辑划分出N个逻辑的硬盘。（假设划分完的逻辑盘也是5个，每个也是1G，但是这5个1G的逻辑盘已经于原来的5个物理硬盘意义完全不同了。例如第一个逻辑硬盘A里面，可能第一个200M是来自物理硬盘1，第二个200M是来自物理硬盘2，所以逻辑硬盘A是由多个物理硬盘逻辑虚构出来的硬盘。）

接着块存储会采用映射的方式将这几个逻辑盘映射给主机，主机上面的操作系统会识别到有5块硬盘，但是操作系统是区分不出到底是逻辑还是物理的，它一概就认为只是5块裸的物理硬盘而已，跟直接拿一块物理硬盘挂载到操作系统没有区别的，至少操作系统感知上没有区别。

此种方式下，操作系统还需要对挂载的裸硬盘进行分区、格式化后，才能使用，与平常主机内置硬盘的方式完全无异。

优点：

1、这种方式的好处当然是因为通过了Raid与LVM等手段，对数据提供了保护。

2、另外也可以将多块廉价的硬盘组合起来，成为一个大容量的逻辑盘对外提供服务，提高了容量。

3、写入数据的时候，由于是多块磁盘组合出来的逻辑盘，所以几块磁盘可以并行写入的，提升了读写效率。

4、很多时候块存储采用SAN架构组网，传输速率以及封装协议的原因，使得传输速度与读写速率得到提升。

缺点：

1、采用SAN架构组网时，需要额外为主机购买光纤通道卡，还要买光纤交换机，造价成本高。

2、主机之间的数据无法共享，在服务器不做集群的情况下，块存储裸盘映射给主机，再格式化使用后，对于主机来说相当于本地盘，那么主机A的本地盘根本不能给主机B去使用，无法共享数据。

3、不利于不同操作系统主机间的数据共享：另外一个原因是因为操作系统使用不同的文件系统，格式化完之后，不同文件系统间的数据是共享不了的。例如一台装了WIN7/XP，文件系统是FAT32/NTFS，而Linux是EXT4，EXT4是无法识别NTFS的文件系统的。就像一只NTFS格式的U盘，插进Linux的笔记本，根本无法识别出来。所以不利于文件共享。

【文件存储】

典型设备：FTP、NFS服务器

为了克服上述文件无法共享的问题，所以有了文件存储。

文件存储也有软硬一体化的设备，但是其实普通拿一台服务器/笔记本，只要装上合适的操作系统与软件，就可以架设FTP与NFS服务了，架上该类服务之后的服务器，就是文件存储的一种了。

主机A可以直接对文件存储进行文件的上传下载，与块存储不同，主机A是不需要再对文件存储进行格式化的，因为文件管理功能已经由文件存储自己搞定了。

优点：

1、造价交低：随便一台机器就可以了，另外普通以太网就可以，根本不需要专用的SAN网络，所以造价低。

2、方便文件共享：例如主机A（WIN7，NTFS文件系统），主机B（Linux，EXT4文件系统），想互拷一部电影，本来不行。加了个主机C（NFS服务器），然后可以先A拷到C，再C拷到B就OK了。（例子比较肤浅，请见谅……）

缺点：

读写速率低，传输速率慢：以太网，上传下载速度较慢，另外所有读写都要1台服务器里面的硬盘来承担，相比起磁盘阵列动不动就几十上百块硬盘同时读写，速率慢了许多。

【对象存储】

典型设备：内置大容量硬盘的分布式服务器

对象存储最常用的方案，就是多台服务器内置大容量硬盘，再装上对象存储软件，然后再额外搞几台服务作为管理节点，安装上对象存储管理软件。管理节点可以管理其他服务器对外提供读写访问功能。

之所以出现了对象存储这种东西，是为了克服块存储与文件存储各自的缺点，发扬它俩各自的优点。简单来说块存储读写快，不利于共享，文件存储读写慢，利于共享。能否弄一个读写快，利于共享的出来呢。于是就有了对象存储。

首先，一个文件包含了了属性（术语叫metadata，元数据，例如该文件的大小、修改时间、存储路径等）以及内容（以下简称数据）。

以往像FAT32这种文件系统，是直接将一份文件的数据与metadata一起存储的，存储过程先将文件按照文件系统的最小块大小来打散（如4M的文件，假设文件系统要求一个块4K，那么就将文件打散成为1000个小块），再写进硬盘里面，过程中没有区分数据/metadata的。而每个块最后会告知你下一个要读取的块的地址，然后一直这样顺序地按图索骥，最后完成整份文件的所有块的读取。

这种情况下读写速率很慢，因为就算你有100个机械手臂在读写，但是由于你只有读取到第一个块，才能知道下一个块在哪里，其实相当于只能有1个机械手臂在实际工作。

而对象存储则将元数据独立了出来，控制节点叫元数据服务器（服务器+对象存储管理软件），里面主要负责存储对象的属性（主要是对象的数据被打散存放到了那几台分布式服务器中的信息），而其他负责存储数据的分布式服务器叫做OSD，主要负责存储文件的数据部分。当用户访问对象，会先访问元数据服务器，元数据服务器只负责反馈对象存储在哪些OSD，假设反馈文件A存储在B、C、D三台OSD，那么用户就会再次直接访问3台OSD服务器去读取数据。

这时候由于是3台OSD同时对外传输数据，所以传输的速度就加快了。当OSD服务器数量越多，这种读写速度的提升就越大，通过此种方式，实现了读写快的目的。

另一方面，对象存储软件是有专门的文件系统的，所以OSD对外又相当于文件服务器，那么就不存在文件共享方面的困难了，也解决了文件共享方面的问题。

所以对象存储的出现，很好地结合了块存储与文件存储的优点。

最后为什么对象存储兼具块存储与文件存储的好处，还要使用块存储或文件存储呢？

1、有一类应用是需要存储直接裸盘映射的，例如数据库。因为数据库需要存储裸盘映射给自己后，再根据自己的数据库文件系统来对裸盘进行格式化的，所以是不能够采用其他已经被格式化为某种文件系统的存储的。此类应用更适合使用块存储。

2、对象存储的成本比起普通的文件存储还是较高，需要购买专门的对象存储软件以及大容量硬盘。如果对数据量要求不是海量，只是为了做文件共享的时候，直接用文件存储的形式好了，性价比高。

3. 家庭4TB左右的数据量安全储存解决方案

安全性来说,适合用Raid5.不过长时间存放,有初期投入阵列卡的问题以及未来数据提取问题,10年后可能你的机器没有pci/pci-e的卡槽了,呵呵.
直接4x2TB硬盘,4TB数据x2组备份(不用Raid1).这样无论何时拿出来单个盘都是最强兼容.安全性上,这个是用双备份来减少损失可能性.在使用过程中,需要注意,10年不算少,磁盘受外界影响以及自身的磁性减弱都可能导致数据丢失.建议1-2年复写一次,也就是读出重写,建议重写前慢速格式化一次校正磁道增加可靠性.

另外可考虑用Winrar压缩,开启[保护压缩文件],设置恢复记录,这样可以以较小的体积达到接近于1:1备份的效果(约为原文件体积的105%),轻微损坏的数据都能恢复.
Quickpar也可以.
这种方法产生的校验文件信息大概是原文件的1/20,比例可调.
rar压缩时如果选择[不压缩]的打包方式,原文件直接回复的可能性更高,因为几乎是100%明文原文.
如果需要备份的文件中单文件体积过大,就等于风险高,容易出问题,修复的可能性也更小.

要多方面考虑细节.一般来说,你用个三五年后,购买新的大硬盘了,就不会在乎1T的小家伙了,直接当个文件夹复制过去就没事了.磁盘即使不用也会老化的.另外,网上能下到的东西,基本就是不需要备份的东西,刻盘存电影就让不少人后悔,未来,片源少了,但是画质一般都是最好的源.

4. 现在saas大都使用的什么数据存储方案

“畅捷通与阿里云进行了广泛的合作，我们的多款软件都将陆续部署在云平台上，包括SaaS类软件、基于B/S架构的ERP为中小企业提供托管服务等。以在线客户管理软里为例，部署在云平台后，成功解决了困扰我们的用户访问连接速度问题，另外，按需租用的模式也比IDC托管服务器大大降低了前期成本投入，更有利于产品轻装上阵，快速开发部署。

5. 数据存储方案选择，请说明理由

说实话，如果用于收藏的话，两者没有可比性
原因：
原版DVD光盘的音效、画质是经压缩后保存在硬盘上所无法比拟的
收藏的人会选择用DVD来保存，
不过嘛，在我看来，如果有条件最好双管齐下，买一个硬盘是必须的，而且DVD的普及率，估计家家都有吧

6. 怎么选择储存方案

- -

做RAID!!!!!!!!!!!!~~~~~~~~~~~~~~~

比你说那几种都好得多!~

主板不支持RAID的话就买个RAID卡

．Raid定义

RAID(Rendant Array of Independent Disk 独立冗余磁盘阵列)技术是加州大学伯克利分校1987年提出，最初是为了组合小的廉价磁盘来代替大的昂贵磁盘，同时希望磁盘失效时不会使对数据的访问受损失而开发出一定水平的数据保护技术。RAID就是一种由多块廉价磁盘构成的冗余阵列，在操作系统下是作为一个独立的大型存储设备出现。RAID可以充分发挥出多块硬盘的优势，可以提升硬盘速度，增大容量,提供容错功能够确保数据安全性，易于管理的优点，在任何一块硬盘出现问题的情况下都可以继续工作，不会受到损坏硬盘的影响。

二、RAID的几种工作模式

1、RAID0

即Data Stripping数据分条技术。RAID 0可以把多块硬盘连成一个容量更大的硬盘群，可以提高磁盘的性能和吞吐量。RAID 0没有冗余或错误修复能力，成本低，要求至少两个磁盘，一般只是在那些对数据安全性要求不高的情况下才被使用。

（1）、RAID 0最简单方式

就是把x块同样的硬盘用硬件的形式通过智能磁盘控制器或用操作系统中的磁盘驱动程序以软件的方式串联在一起，形成一个独立的逻辑驱动器，容量是单独硬盘的x倍,在电脑数据写时被依次写入到各磁盘中，当一块磁盘的空间用尽时，数据就会被自动写入到下一块磁盘中，它的好处是可以增加磁盘的容量。速度与其中任何一块磁盘的速度相同，如果其中的任何一块磁盘出现故障，整个系统将会受到破坏，可靠性是单独使用一块硬盘的1/n。

（2）、RAID 0的另一方式

是用n块硬盘选择合理的带区大小创建带区集，最好是为每一块硬盘都配备一个专门的磁盘控制器,在电脑数据读写时同时向n块磁盘读写数据,速度提升n倍。提高系统的性能。

2、RAID 1

RAID 1称为磁盘镜像：把一个磁盘的数据镜像到另一个磁盘上，在不影响性能情况下最大限度的保证系统的可靠性和可修复性上，具有很高的数据冗余能力，但磁盘利用率为50%，故成本最高，多用在保存关键性的重要数据的场合。RAID 1有以下特点：

（1）、RAID 1的每一个磁盘都具有一个对应的镜像盘，任何时候数据都同步镜像，系统可以从一组镜像盘中的任何一个磁盘读取数据。

（2）、磁盘所能使用的空间只有磁盘容量总和的一半，系统成本高。

（3）、只要系统中任何一对镜像盘中至少有一块磁盘可以使用，甚至可以在一半数量的硬盘出现问题时系统都可以正常运行。

（4）、出现硬盘故障的RAID系统不再可靠，应当及时的更换损坏的硬盘，否则剩余的镜像盘也出现问题，那么整个系统就会崩溃。

（5）、更换新盘后原有数据会需要很长时间同步镜像，外界对数据的访问不会受到影响，只是这时整个系统的性能有所下降。

（6）、RAID 1磁盘控制器的负载相当大，用多个磁盘控制器可以提高数据的安全性和可用性。
3、RAID0+1

把RAID0和RAID1技术结合起来，数据除分布在多个盘上外，每个盘都有其物理镜像盘，提供全冗余能力，允许一个以下磁盘故障，而不影响数据可用性，并具有快速读/写能力。RAID0+1要在磁盘镜像中建立带区集至少4个硬盘。

4、RAID2

电脑在写入数据时在一个磁盘上保存数据的各个位，同时把一个数据不同的位运算得到的海明校验码保存另一组磁盘上，由于海明码可以在数据发生错误的情况下将错误校正，以保证输出的正确。但海明码使用数据冗余技术，使得输出数据的速率取决于驱动器组中速度最慢的磁盘。RAID2控制器的设计简单。

5、RAID3：带奇偶校验码的并行传送

RAID 3使用一个专门的磁盘存放所有的校验数据，而在剩余的磁盘中创建带区集分散数据的读写操作。当一个完好的RAID 3系统中读取数据，只需要在数据存储盘中找到相应的数据块进行读取操作即可。但当向RAID 3写入数据时，必须计算与该数据块同处一个带区的所有数据块的校验值，并将新值重新写入到校验块中，这样无形虽增加系统开销。当一块磁盘失效时，该磁盘上的所有数据块必须使用校验信息重新建立，如果所要读取的数据块正好位于已经损坏的磁盘，则必须同时读取同一带区中的所有其它数据块，并根据校验值重建丢失的数据，这使系统减慢。当更换了损坏的磁盘后，系统必须一个数据块一个数据块的重建坏盘中的数据，整个系统的性能会受到严重的影响。RAID 3最大不足是校验盘很容易成为整个系统的瓶颈，对于经常大量写入操作的应用会导致整个RAID系统性能的下降。RAID 3适合用于数据库和WEB服务器等。

6、 RAID4

RAID4即带奇偶校验码的独立磁盘结构，RAID4和RAID3很象，它对数据的访问是按数据块进行的，也就是按磁盘进行的，每次是一个盘，RAID4的特点和RAID3也挺象，不过在失败恢复时，它的难度可要比RAID3大得多了，控制器的设计难度也要大许多，而且访问数据的效率不怎么好。
7、 RAID5

RAID 5把校验块分散到所有的数据盘中。RAID 5使用了一种特殊的算法，可以计算出任何一个带区校验块的存放位置。这样就可以确保任何对校验块进行的读写操作都会在所有的RAID磁盘中进行均衡，从而消除了产生瓶颈的可能。RAID5的读出效率很高，写入效率一般，块式的集体访问效率不错。RAID 5提高了系统可靠性，但对数据传输的并行性解决不好，而且控制器的设计也相当困难。

8、RAID6

RAID6即带有两种分布存储的奇偶校验码的独立磁盘结构，它是对RAID5的扩展，主要是用于要求数据绝对不能出错的场合，使用了二种奇偶校验值，所以需要N+2个磁盘，同时对控制器的设计变得十分复杂，写入速度也不好，用于计算奇偶校验值和验证数据正确性所花费的时间比较多，造成了不必须的负载，很少人用。

9、 RAID7

RAID7即优化的高速数据传送磁盘结构，它所有的I/O传送均是同步进行的，可以分别控制，这样提高了系统的并行性和系统访问数据的速度；每个磁盘都带有高速缓冲存储器，实时操作系统可以使用任何实时操作芯片，达到不同实时系统的需要。允许使用SNMP协议进行管理和监视，可以对校验区指定独立的传送信道以提高效率。可以连接多台主机，当多用户访问系统时，访问时间几乎接近于0。但如果系统断电，在高速缓冲存储器内的数据就会全部丢失，因此需要和UPS一起工作，RAID7系统成本很高。

10、 RAID10

RAID10即高可靠性与高效磁盘结构它是一个带区结构加一个镜象结构，可以达到既高效又高速的目的。这种新结构的价格高，可扩充性不好。

11、 RAID53

RAID7即高效数据传送磁盘结构，是RAID3和带区结构的统一，因此它速度比较快，也有容错功能。但价格十分高，不易于实现。

个人使用磁盘RAID主要是用RAID0、 RAID1或RAID0＋1工作模式。
参考资料：http://www.yesky.com/Hardware/72624946416713728/20030607/1705974.shtml

7. 大数据量存储的方案

hadoop

什么是大数据存储？

首先，我们需要清楚大数据与其他类型数据的区别以及与之相关的技术(主要是分析应用程序)。大数据本
身意味着非常多需要使用标准存储技术来处理的数据。大数据可能由TB级(或者甚至PB级)信息组成，既包括结构化数据(数据库、日志、SQL等)以及非结
构化数据(社交媒体帖子、传感器、多媒体数据)。此外，大部分这些数据缺乏索引或者其他组织结构，可能由很多不同文件类型组成。
由于这些数据缺乏一致性，使标准处理和存储技术无计可施，而且运营开销以及庞大的数据量使我们难以使用传统的服务器和SAN方法来有效地进行处理。换句话说，大数据需要不同的处理方法：自己的平台，这也是Hadoop可以派上用场的地方。
Hadoop
是一个开源分布式计算平台，它提供了一种建立平台的方法，这个平台由标准化硬件(服务器和内部服务器存储)组成，并形成集群能够并行处理大数据请求。在存
储方面来看，这个开源项目的关键组成部分是Hadoop分布式文件系统(HDFS)，该系统具有跨集群中多个成员存储非常大文件的能力。HDFS通过创建
多个数据块副本，然后将其分布在整个集群内的计算机节点，这提供了方便可靠极其快速的计算能力。
从目前来看，为大数据建立足够大的存储平台最简单的方法就是购买一套服务器，并为每台服务器配备数TB级的驱动器，然后让Hadoop来完成余下的工作。对于一些规模较小的企业而言，可能只要这么简单。然而，一旦考虑处理性能、算法复杂性和数据挖掘，这种方法可能不一定能够保证成功。

8. 有冷数据存储海量数据存储解决方案吗

目前市场上主流的海量数据存储解决方案当然是云存储解决方案啦！我知道一家公司瑞驰信息技术很专业，你可以咨询下看有没有适合你的方案

9. 数据存储，海量数据存储解决方案

目前市场上主流的海量数据存储解决方案当然是云存储解决方案啦！南京云创存储科技有限公司的cStor云存储系统可以帮你解决海量存储的问题！你可以到云创存储的官网上了解一下产品的详细信息！希望我的回答会对你有所帮助咯！

10. 什么是最佳的存储方案

企业管理者们在编制年预算的过程中都在考虑什么是最佳存储方案?下面说一下我认为的最佳存储建议不是基于任何的“新技术”,而是充分考虑了其实用性和价值,提供借鉴和参考。最佳存储解决方案1:自动精简配置(Thin Provisioning)技术自3Par公司被惠普收购之前,自动精简配置技术在配置存储容量方面一直发挥着极其重要的作用。我记得在存储区域网络(SAN)的初期,就有这种假设:随着数据增长,有的企业的实际使用的存储能力要超过预期的存储能力配置。利用自动精简配置,可以提供给企业所需要的,同时增加容量需求,而不用担心超出的新的LUN(逻辑单元号)。我从3Par内部了解到,该公司的技术来源于公司内部的技术专家为了响应挑战和区分,这在当时并未意识到其将成就如此强大的3Par.最佳存储解决方案2:面向对象的存储和REST(Representational State Transfer表述性状态转移)最初,从云计算的角度来说,这一技术将带来巨大的影响力。越来越多的企业习惯于将他们的数据存储在公共云服务。HTTP协议将有可能作为一种传输手段,利用REST作为数据移动和存储数据,同时提供丰富的元数据。最初,我看到的主要用例是通过广域,但在长期运行状况下看到其掌握可数据中心也并不感到惊讶了。最佳存储解决方案3:广域网优化可以通过广域网优化产品,如Riverbed技术获得效率,这比较是极端的方法。通过删除重复数据和压缩其余的流量,减少跨广域网发送量,可以显着节省存储空间,减少延迟和降低广域网带宽的相关费用。随着企业可以自己查看和创建世界各地的数据,广域网优化已然成为了使用户能保持局域网类型访问,同时控制存储,网络和存储费用的关键。最佳存储解决方案4:分级存储随着企业寻求成本和性能的平衡,通过最好的介质存储数据的想法,以匹配数据的价值和性能预期变得越发有意义。不经常访问的数据,不一定要存储在 SSD或更高性能的磁盘驱动器上。厂商推出的存储产品,功能基于访问模式的自动数据布局。Flash可以构成一个存储层,通常标示为0层,或作为缓存。这有两个好处。企业应该了解数据是如何放在介质上的以及模型数据的增长,以便决定购买之前更好地了解扩展容量和性能的成本。最佳存储解决方案5:向外扩展的NAS(网络附加存储)我们知道,传统的NAS会变成一个中小型NAS市场。它将被向外扩展的NAS取代,向外扩展的NAS可以让企业逐步添加容量和性能,构建一个全局命名空间。存储配置可以大大简化,并找到一个单一的存储管理员管理数据的情况并不少见。可以大大降低总成本。最佳存储解决方案6:表现层设备设备管理较少关注基于NAS的容量管理。这些存储数据更关心以最高的效率移动数据。即,一个设备不仅缓存数据,还要加速其其安置。NAS的优化,使IOPS回到NAS,所有繁重的计算交给NAS.其结果是提高了性能并显着减少资本和运营开支。最佳存储解决方案7:FCoE(以太网光纤通道)FCoE可以帮助企业通过在以太网基础设施扩展光纤通道。节省花费在基础设施上的资金,包括电缆和电源管理,这真是一笔不小的开支。具有讽刺意味的?是,我们不对于FCoE相关的东西了解的太少。我们也没有听到或读到过有关iSCSI和光纤通道之间的竞争。但是,这并不意味着它不重要。以太网获胜。许多企业公开承认有充足的数据块和文件流量并承认正在寻找的产品来处理它们。虽然基于文件的存储的增长速度超过块级存储,不要指望对于光纤通道或FCoE会很快消失。以上就是简单介绍的七大最佳存储解决方案,希望通过本文的介绍能对大家有些许的帮助。

数据存储方案

与数据存储方案相关的内容