⑴ 数据库集群的性质
一.与分布式数据库系统的区别 数据库集群有的具有单份数据集,有的具有两份或多份相似的数据集,有的具有两份或多份实时一致的数据集;而分布式数据库系统往往具有完全不同的数据集。 数据库集群往往是同构的系统,要求集群各节点都具有相同的操作系统和数据库系统版本,甚至补丁包的版本也要求保持一致;而分布式数据库系统可以是异构系统,包含不同的操作系统和不同的数据库系统。 数据库集群往往建立在高速局域网内;而分布式数据库系统既可以是高速局域网,也可以是跨部门、跨单位的异地远程网络。 二.数据库集群的技术指标
由于数据库系统是任何一个信息系统的核心,因此除了业务逻辑之外,用户还关心下面三点:
1. 系统性能
性能问题涉及硬件、软件、网络、应用设计架构、代码质量等多方面。但是数据库集群如果能提供负载均衡能力和自动优化能力,则是对整个系统性能具有莫大的好处。
2. 数据可靠性
在系统发生任意故障(包括操作系统、数据库引擎、硬盘或磁盘阵列或存储网络等故障)条件下数据丢失的可能性。有的系统从设计原理上注定了必然会存在理论上的数据丢失可能性,而有的系统因为冗余设计原理,可以保证理论上的数据零丢失。用容灾领域的术语来讲,这类似于RPO(Recovery Point Objective),但是不完全等同于RPO。
3. 服务可用性
在系统发生任意故障(包括操作系统、数据库引擎、硬盘或磁盘阵列或存储网络等故障)条件下整个系统停止对外提供数据服务的可能性。与上面的数据库可靠性紧密关联,如果一个系统从理论上存在数据丢失的可能性,那么这样的系统必然会导致整个系统的服务停止。同样地,用容灾领域的术语来讲,这类似于RTO(Recovery Time Objective),但是也同样不能完全等同于RTO。
三.数据库集群的分类
在市场上,数据库集群是一个笼统的名词,没有一个权威的定义,各市场参与者往往是各取所需,推出各种特色的数据库集群解决方案。一般地具有下列四种集群方案:
1.基于串行数据复制技术
串行复制技术,本来是用于数据传送和数据备份的,离人们熟悉的“数据库集群”的概念有一定的距离。但是由于计算机软硬件技术和网络通讯技术的快速发展,使得利用这种概念和技术构成的“数据库集群”有了一定的可行性。此类集群,又可以分两类:
a.串行异步复制
此种方式是数据的异步串行复制。主要采用数据库事务日志传送或者硬盘数据块传送技术来实现,sql Server自带的复制、镜像和SQL2012新出的AlwaysON(备机可读)以及第三的一些镜像Mirror技术都是属于此类产品,此类技术和产品本质上就是数据备份技术和产品。下列以事务日志传送(Log Shipping)为例来说明。主数据库完成事务处理后,生成事务处理日志,日志记录通过FIFO队列,进入备份数据库处理,从而得到备份数据。此种方式的缺陷在于:
a) 主数据库并行处理事务而日志拷贝是串行的,而备份数据库处理日志记录也是串行的。因此,FIFO队列的溢出随时可能发生。一旦发生,队列必须重建,从而需要重新建立备份数据库。此种方法对于一般客户来讲是不可行的。
b) 由于日志拷贝是异步的,主备数据库不是实时一致,两者之间存在“时间差”,因此如果用备份数据库作负荷均衡,这样的应用存在逻辑上的漏洞,可能会发生数据错乱。
c) 由于主备数据存在时间差, 主数据库一旦发生事故,理论上一定会丢失数据。在这种情况下,要么需要手工恢复数据库,这会消耗大量的人工成本,或者数据根本就不能恢复。
d) 对主机的性能影响,根据测试一般在15%到25%之间。
b.串行同步复制
此类集群往往是由昂贵的专用软硬件构成的,原理图如下:
此类系统采用专用的高速网络和软件技术,将每个数据库的请求,通过同步复制的方式,同步在主备两台数据库服务器上执行正确后,才将结果返回给数据库客户。此系统的特点是:
a) 主数据库被强迫与备份数据库同步串行处理,因此性能受到限制。
b) 主备数据库中任意一个出现问题,都会迫使事务处理交易回滚,因此整个系统的可靠性比单机系统降低了一半。
c) 由于以上问题,这种备份方式只适用于近距离光纤网络(5英里)。
d) 专用系统造价昂贵,又加上述明显缺陷,因此市场上很少被采用。
2.基于共享存储的双机容错技术
从技术适应性的角度讲,双机容错比较适合于无状态应用,或者状态信息较少的应用切换,以此达到应用级的高可用性目的,其实并不适合于数据库级的应用切换。
此种结构往往是两个服务器共享一个磁盘阵列,这里两个服务器共享一个虚拟的IP供数据库客户使用,形成一个单一的逻辑数据库映象。此种所谓的数据库集群的目的是,一旦主机系统出现问题,备份系统通过心跳机制的检测,完成从主机系统到备份系统的切换。这种方案在市场上被称为“双机集群”或者“双机热备”,简称参见“双机”,但微软称之为“故障转移集群”。它有下列特点:
a. 此种高可用性解决方案只是无状态系统(典型的如Web服务器)的普通容错切换思想在数据库领域的应用。
b. 此系统本身只有一个单一的数据映象,数据储存在共享的磁盘阵例上,因此共享的磁盘阵列成为了整个系统的单点错误源。
c. 由于是单一数据映象,因此必须采用通常的复制或备份方法获取第二份数据,以保证数据的安全性。因此所有复制或备份方法的缺点,此类系统全部存在。
d. 主机系统和备份系统之间是没有任何负载均衡关系的,在正常情况下,备份系统是闲置在那里,因此对用户来说是一种投资浪费。
e. 在错误切换的时候,往往存在切换时间长,而且更严重的是可能会存在丢失用户交易数据丢失的现象,结果导致系统被迫停止服务,或者需要人工修复数据,或者数据永远找不回来。
3.以Oracle RAC为代表的系统
RAC的英文全称是:Real Application Cluster(真正的应用级集群)。我们需要关注的是“应用级”。为了缓解数据库系统日益增长的性能压力,Oracle公司推出了RAC系统。它基本结构如下:
此类系统,专门是针对数据库性能问题而提出的。采用共享磁盘阵列的方式,因此在结构上和上述双机容错相似,不同的地方在于此系统中的数据库节点之间采用的不是简单的心跳检测,而是Oracle公司自己定义的一套复杂的信息交换协议,以此来动态分配来自数据库客户端的请求。它的特点是:
a. 是个应用级的集群,也就是针对Oracle的数据库管理系统(因为数据库管理系统对于操作系统来讲,就是一个“应用程序”,因此被称为“应用级集群”),专门为提高数据库性能而设计。
b. 此系统本身只有一个单一的数据映象,数据储存在共享的磁盘阵例上,因此享的磁盘阵例成为了整个系统的单点错误源。
c. 管理配置复杂。
d. 由于是单一数据映象,因此必须采用通常的复制或备份方法获取第二份数据,以保证数据的安全性。因此所有复制或备份方法的缺点,此类系统全部存在。
e. 由于数据库系统本身具有高I/O的特性,因此,RAC系统里,磁盘I/O是提高性能的关键地方。
f. 依据不同的数据库应用,有的性能有所提升,有的性能可能会反而下降。
⑵ 什么是数据库集群
现在比较大型点的系统基本上是AP+DB的架构: AP指应用程序,DB指数据库端
AP放在一个服务器上,DB放在另一个服务器上
当一个系统比较大,访问的用户数量比较多的时候,比如QQ,上亿用户.
这时一个服务器就吃不消了,这样就想到多个服务器跑同一个AP应用.
DB端也一样.
linux集群 指的就是多个服务器跑同一个AP应用,系统管理员的工作
数据库集群 指的就是多个服务器跑同一个DB数据库.数据库管理员的工作
linux集群基础就要熟悉linux系统.
数据库集群基础就要熟悉具体的数据库如oracle,db2,sysbase.mysql.等
0基础可以学,只是要花时间.0基础想搞到集群估计得花3个月时间.这还是要有环境的,有人指导才行.
⑶ 数据库集群的应用
一.基于实时数据同步技术
基于此技术构造的数据库集群是市场上的新兴力量,它又具有两类,分别是:
a.具有独立网关
下面以DBTwin为例来说明其技术特点。
DBTwin采用了冗余设计原理,对于来自客户端的请求,请求被分成两类:查询请求和数据更新请求。对于数据更新请求,集群内部各节点之间保持数据的实时同步一致;对于数据的查询请求,则可以在集群各节点之间负载均衡执行。它的特点是:
a) 负载均衡的单元是客户端的每个独立请求,这点除了Oracle RAC集群,是市场上独有的。
b) 实时冗余一致的多份数据,从理论上讲实现了数据的零丢失。
c) 由于可以做到数据零丢失,因此在系统发生任意故障条件下,可以做到系统的对外服务不停止。
d) 此系统使用了专用高速数据同步技术,根据测试,数据同步速度能SQL Server的镜像相等。
e) 此系统的缺点是数据同步需要花费代价,节点数量受到限制,一般2到4个节点为宜。
f) 此系统从宏观上提升了整个系统的性能。
b.将调度节点集成于数据库引擎
下面以Moebius来说明其技术特点。
任何在数据库和应用程序之间引入的中间件都同时引入了单点故障点,如果中间件(网关)出现了故障,则数据库集群就会形同虚设。因此Moebius在集群中的每个节点上都存在于嵌入于数据库引擎的分发代理,当前负责调度的分发代理出现故障时,分发代理会故障转移到集群中的其他节点,从而避免了使用网关架构所引入的单点故障点,除此之外,该类产品的特点是:
a) 负载均衡是基于每个客户端的独立请求,默认规则是将查询优先分发到集群中负载低的服务器,也可以自定义规则,将某些特定业务分发到集群中的某一台,比如将报表相关的查询分发给集群中的特定服务器。
b) 采用Share-Nothing架构,对数据进行冗余,从而保证了数据的安全性
c) 数据库同步机制采用日志Redo的方式,在日志同步之前对日志进行压缩,保证了同步效率
d) 在集群中任意节点出现故障时,会被自动剥离出节点,由剩余运行正常的节点继续提供服务,从而保证了最小停机时间
e) 负载均衡集群从宏观上提高了吞吐量和性能
f) 该类集群不需要特殊的存储设备,可以使用廉价的本地存储,但由于数据冗余,因此相较于Share-Disk架构而言,需要更多的存储空间
c.没有独立网关
当前市场上也存在下列一种基于数据实时同步的集群,其拓扑结构如下图所示:
此系统由于没有独立的集群网关,因此本质上简化成了数据库的实时备份系统,与实际的备份系统不同的是,它是工作在数据库应用层。此系统的特点:
a) 没有独立的集群网关,通过主节点的转发来实行查询的负载均衡。在系统压力大的情况下,集群主机会形成性能瓶颈,无论是CPU、内存还是网络带宽,也可能是OS等系统内核资源,都容易因到达临界状态而形成瓶颈。
b) 各节点数据实时一致,对于数据容错有利。
c) 对客户端没有二进制透明。
d) 负载均衡单元是数据库连接。也就是说,在客户端登陆数据库的时候,静态地指定连接到某个集群节点,此后此连接上的全部请求一律发送到该数据库上,因此在特殊情况下,可能会出现这样的场景:所有客户端的连接集中在集群主机上,这时候,集群主机不但承担了客户端的所有查询,还需要实时同步数据到所有的集群从机,即集群主机的CPU为100%,而集群别的节点CPU可能为0%,这样整个系统的性能会受到严重影响。
e) 由于使用的是分布式事务机制(MSDTC)确保数据的实时一致性,因此数据同步的性能比较慢,根据测试,会比SQL Server镜像慢好几倍。
f) 同样地,此集群的节点数量也受到限制,也是以2到4个节点为宜。
⑷ 数据库集群解决什么问题
解决
1.1 高并发处理(随着业务增长连接数和并发数),需要数据库集群来处理。
1.2 高可用,满足业务连续性的要求。
1.3 备注:可以这样简单理解下。。
⑸ 集群的好处
一、服务器集群是什么?
服务器集群(Cluster)是由两台或多台节点机(服务器)构成的一种松散耦合的计算节点集合,为用户提供网络服务或应用程序(包括数据库、Web服务和文件服务等)的单一客户视图,同时提供接近容错机的故障恢复能力。集群系统一般通过两台或多台节点服务器系统通过相应的硬件及软件互连,每个群集节点都是运行其自己进程的独立服务器。这些进程可以彼此通信,对网络客户机来说就像是形成了一个单一系统,协同起来向用户提供应用程序、系统资源和数据。除了作为单一系统提供服务,集群系统还具有恢复服务器级故障的能力。集群系统还可通过在集群中继续增加服务器的方式,从内部增加服务器的处理能力,并通过系统级的冗余提供固有的可靠性和可用性。
服务器集群是什么?优缺点描述!
二、服务器集群优缺点描述
我们知道,集群服务器相对单台服务器或者热备份服务器系统来说,都具有非常明显的优势。同时,它与其他服务器扩展技术相比,也具有较强优势。如与广泛采用的SMP技术相比,集群技术更易于实现,开发周期短,而且造价低,可扩展性远远超过了SMP,在一个集群中可以很轻松地支持256个以上的CPU。
综合起来看,使用服务器集群技术的好处主要有以下几个方面:
1、服务器集群之强扩展能力:
其他扩展技术,通常仅能支几十个CPU的扩展,扩展能力有限,而采用集群技术的集群系统则可以扩展到包括成百上千个CPU的多台服务穗,扩展能力具有明显优势。集群服务还可不断进行调整,以满足不断增长的应用需求。当集群的整体负荷超过集群的实际能力时,还可以添加额外的节点。
2、服务器集群之实现方式容易:
服务器集群技术相对其他扩展技术来说更加容易实现,主要是通过软件进行的。在硬件上可以把多台性能较低、价格便宜的服务器,通过集群服务集中连接在一起即可实现整个服务器系统成倍,甚至几十几百倍地增长。无论是从软硬件构成成本上来看,还是从技术实现成本上来看,都较其他扩展方式更低。
3、服务器集群之高可用性:
使用集群服务拥有整个集群系统资源的所有权,如磁盘驱动器和IP地址将自动地从有故障的服务器上转移到可用的服务器上。当集群中的系统或应用程序出现故障时,集群软件将在可用的服务器上重启失效的应用程序,或将失效节点上的工作分配到剩余的节点上。在切换过程中,用户只是觉得服务暂时停顿了一下。
4、服务器集群之易管理性:
可使用集群管理器来管理集群系统的所有服务器资源和应用程序,就像它们都运行在同一个服务器上一样。可以通过拖放集群对象,在集群里的不同服务器间移动应用程序,也可以通过同样的方式移动数据,还可以通过这种方式来手工地平衡服务器负荷、卸载服务器,从而方便地进行维护。同时,还可以从网络的任意地方的节点和资源处,监视集群的状态。当失效的服务器连回来时,将自动返回工作状态,集群技术将自动在集群中平衡负荷,而不需要人工干预。
服务器集群系统的不足之处在于:
我们知道服务器集群中的应用只在一台服务器上运行,如果这个应用出现故障,其它的某台服务器会重新启动这个应用,接管位于共享磁盘柜上的数据区,进而使应用重新正常运转。不过,整个应用的接管过程大体需要三个步骤:侦测并确认故障、后备服务器重新启动该应用、接管共享的数据区,因此在切换的过程中需要花费一定的时间,原则上根据应用的大小不同切换的时间也会不同,越大的应用切换的时间越长。
⑹ 为什么要配置数据库集群 博客园
把一个数据库放在多个服务器上,而且这些数据库服务器具有同步数据的功能, 这样任何一台数据服务器出问题都不影响用户
⑺ 对于实现mysql数据库集群负载均衡和高可使用 哪些措施具有实际意义
本文我们主要介绍了MySQL数据库集群实现负载均衡的安装配置工作,接下来我们就让我们一起来了解一下这部分内容。
MySQL数据库集群关系如下图:
ndbd:数据库节点,物理数据实际存放位置。
mysqld:MySQL服务器节点。
ndbd_mgmd:管理节点。管理/查看各库节点和服务器节点的状态。程序直接访问的是这台机器的IP。默认端口仍是3306。
1.在ndb_mgmd、mysqld、Node A、Node B上安装MySQL5.0
安装目录:/usr/local/mysql
2.配置 Node A、Node B、mysqld:
# cp /usr/local/mysql/support-files/my-medium.cnf /etc/my.cnf # vi /etc/my.cnf 在文件尾加入 # my.cnf # example additions to my.cnf for MySQL Cluster # (valid in MySQL 5.0) # enable ndbcluster storage engine, and provide connectstring for # management Server host (default port is 1186) [mysqld] ndbcluster ndb-connectstring=192.168.56.30 # provide connectstring for management Server host (default port: 1186) [ndbd] connect-string=192.168.56.30 # provide connectstring for management Server host (default port: 1186) [ndb_mgm] connect-string=192.168.56.30 # provide location of cluster configuration file [ndb_mgmd] config-file=/var/lib/mysql-cluster
在Node A、Node B上创建日志文件夹
⑻ 请问什么是数据库群集数据库群集有哪些利弊
数据库集群,顾名思义,就是利用至少两台或者多台数据库服务器,构成一个虚拟单一数据库逻辑映像,像单数据库系统那样,向客户端提供透明的数据服务坏处:集
群
向
来
是Unix
的
技
术,
只
有
在Unix
的
系
统
下
才
能
实
现,
硬
件
配
置
也
比
较
高,
一
般
都
采
用
小
型
机
作
为
服
务
器。
中
小
企
业
因
种
种
原
因,
绝
大
部
分
采
用
微
机
服
务
器,
为
保
证
数
据
的
安
全,
通
常
用
磁
盘
镜
像
或
磁
盘
阵
列;
为
提
高
系
统
的
安
全,
往
往
建
立
双
机
容
错
系
统,
但
是
无
法
实
现
集
群。
有
了Windows
NT
Server
4.0(
企
业
版),
对
于
微
机
服
务
器
来
说,
集
群
也
是
可
以
考
虑
并
付
诸
实
施
的
一
种
方
案。
尽
管Windows
NT
只
提
供
了
两
个
结
点
的
集
群,
但
是
对
于
中
小
企
业
来
说,
这
已
经
足
够。
今
年5
月
份
我
们
实
现
了Windows
NT
和SQL
Server
集
群
好处:集
群
的
好
处
是
不
言
而
喻
的,
能
够
提
高
系
统
效
率,
系
统
资
源
也
能
得
到
充
分
的
利
用。
物
理
上
有
两
个
服
务
器,
但
对
前
端
来
说,
只
有
一
个
虚
拟
服
务
器
和
一
个IP
地
址,
出
现
故
障
时
所
需
的
切
换
时
间
较
短,
前
端
只
会
觉
得
某
笔
业
务
的
处
理
时
间
变
长,
但
不
会
出
现
中
断。
集
群
系
统
对
于
大
型
关
键
业
务
系
统,
无
疑
是
最
好
的
选
择
之
一。----秦傲工程师
⑼ 数据库集群的疑问
没搞过,但是那个答案应该是有问题的,看看网络里的介绍:
数据库集群,顾名思义,就是利用至少两台或者多台数据库服务器,构成一个 “虚拟单一”(这几个字) 数据库逻辑映像,像单数据库系统那样,向客户端提供透明的数据服务。
http://ke..com/view/1294492.htm?fr=aladdin