㈠ 数据库索引为什么使用B+树
B tree: 二叉树(Binary tree),每个节点只能存储一个数。
B-tree: B树(B-Tree,并不是B“减”树,横杠为连接符,容易被误导)
B树属于多叉树又名平衡多路查找树。每个节点可以多个数(由磁盘大小决定)。
B+tree 和 B*tree 都是 B-tree的变种
一般来说,索引本身也很大,不可能全部存储在内存中,因此索引往往以索引文件的形式存储的磁盘上。这样的话,索引查找过程中就要产生磁盘I/O消耗,相对于内存存取,I/O存取的消耗要高几个数量级,所以评价一个数据结构作为索引的优劣最重要的指标就是在查找过程中磁盘I/O操作次数的渐进复杂度。换句话说,索引的结构组织要尽量减少查找过程中磁盘I/O的存取次数。而B-/+/*Tree,经过改进可以有效的利用系统对磁盘的块读取特性,在读取相同磁盘块的同时,尽可能多的加载索引数据,来提高索引命中效率,从而达到减少磁盘IO的读取次数。
不了解磁盘相关知识的可以查看 硬盘基本知识(磁头、磁道、扇区、柱面)
下面通过示意图来看一下,B-tree、B+tree、B*tree
从图中可以看出,B-tree 利用了磁盘块的特性进行构建的树。每个磁盘块一个节点,每个节点包含了很关键字。把树的节点关键字增多后树的层级比原来的二叉树少了,减少数据查找的次数和复杂度。
B-tree巧妙利用了磁盘预读原理,将一个节点的大小设为等于一个页(每页为4K),这样每个节点只需要一次I/O就可以完全载入。
B-tree 的数据可以存在任何节点中。
B+tree 是 B-tree 的变种,数据只能存储在叶子节点。
B+tree 是 B-tree 的变种,B+tree 数据只存储在叶子节点中。这样在B树的基础上每个节点存储的关键字数更多,树的层级更少所以查询数据更快,所有指关键字指针都存在叶子节点,所以每次查找的次数都相同所以查询速度更稳定;
B*tree 每个磁盘块中又添加了对下一个磁盘块的引用。这样可以在当前磁盘块满时,不用扩容直接存储到下一个临近磁盘块中。当两个邻近的磁盘块都满时,这两个磁盘块各分出1/3的数据重新分配一个磁盘块,这样这三个磁盘块的数据都为2/3。
在B+树的基础上因其初始化的容量变大,使得节点空间使用率更高,而又存有兄弟节点的指针,可以向兄弟节点转移关键字的特性使得B*树额分解次数变得更少;
㈡ 数据库类型
数据库大致可以这么分类:
1关系数据库
1.1大型商业数据库:支持数据存储量大,访问效率高,适合大型企业应用,收费较高,具体包括:
Oracle
DB2(IBM)
SYbase(这个是比较早的,公司现在不做数据库了)
SQL SERVER,版本包括2000,2005,2008, 2012等
1.2 中小型应用数据库:
SQL SERVER 2000
Acess
Visual foxpro
1.3 中小型开源数据库:
MYSQL(这个开源数据库在一些大型应用中会以集群的方式使用)
PostgreSQL
SQLite
1.4嵌入式数据库:
SQLite也可以算在这里
1.5 列存储模式数据库:主要用于研究和数据仓库应用
MonetDB
2 面向对象数据库
Berkeley DB(现在已经被Oracle买下了)
Oracle也提供了面向对象的功能
3 XML数据库,这类数据库一般是附属于关系数据库功能的,只有研究型的是处理纯XML文档的
DB2 ,附加XML处理版本
Oracle,里面包含XML查询功能
SQLSERVER,包含XML数据查询功能
4 NOSQL数据库,目前大型互联网公司和微博等网站广泛使用的数据存储系统,典型的有:
HBase
Cassandar
MongoDB
还有很多,这里不逐一列列举了
㈢ 数据库类型有哪几种
数据库类型可分为层次型、网状型和关系型。
层次型数据库是把数据根据层次构造(树结构)的方法呈现;网状型数据库是采用网状原理和方法,以网状数据模型为基础建立的数据库;关系型数据库是指采用了关系模型来组织数据的数据库。
数据库的作用
1、实现数据共享:数据共享包含所有用户可同时存取数据库中的数据,也包括用户可以用各种方式通过接口使用数据库,并提供数据共享。
2、减少数据的冗余度:同文件系统相比,由于数据库实现了数据共享,从而避免了用户各自建立应用文件。减少了大量重复数据,减少了数据冗余,维护了数据的一致性。
3、保持数据的独立性:数据的独立性包括逻辑独立性(数据库中数据库的逻辑结构和应用程序相互独立)和物理独立性(数据物理结构的变化不影响数据的逻辑结构)。
4、数据实现集中控制:文件管理方式中,数据处于一种分散的状态,不同的用户或同一用户在不同处理中其文件之间毫无关系。利用数据库可对数据进行集中控制和管理,并通过数据模型表示各种数据的组织以及数据间的联系。
㈣ 请问数据库有哪些种类呢
数据库通常分为:
层次式数据库、网络式数据库和关系式数据库三种。
而不同的数据库是按不同的数据结构来联系和组织的。
数据库有类型之分,是根据数据模型划分的。目前成熟地应用在数据库系统中的数据模型有:层次模型、网壮模型和关系模型。
一、层次模型:
层次模型是用树结构表示记录类型及其联系的。
树结构的基本特点是:
1、有且仅有一个结点无父结点;
2、其它结点有且有一个父结点。
在层次模型中,树的结点是记录型。上一层记录型和下一层记录型的联系是1:n的。
层次模型就象下面我们给出的一棵倒立的树。
注意:在层次式数据库中查找记录,必须指定存取路径。这种关系模型不支持m:n联系。
二、网状模型:
网状模型中结点间的联系不受层次限制,可以任意发生联系,所以她的结构是结点的连通图。
网状模型结构的特点是:
1、有一个以上结点无父结点;
2、至少有一个结点有多于一个父结点。
注意:虽然网状模型能反映各种复杂的关系,但网状模型在具体实现上,只支持1:n联系,对
于m:n联系可将其转化为1:n联系。
三、关系模型:
关系模型的本质就是用若干个二维表来表示实体及其联系。
关系是通过关系名和属性名定义的。一个关系可形式化表示为:
R(A1,A2,A3,…,Ai,…)
其中:R为关系名,Ai为关系的属性名。
目前常用的数据库管理系统有:
ACCESS、SQL Server、 Oracle、MySQL、FoxPro和Sybase等。
ACCESS 是美国Microsoft公司于1994年推出的微机数据库管理系统.它具有界面友好、易学易用、开发简单、接口灵活等特点,是典型的新一代桌面数据库管理系统。
Oracle公司是全球最大的信息管理软件及服务供应商,成立于1977年,总部位于美国加州 Redwood shore。Oracle提供的完整的电子商务产品和服务包括: 用于建立和交付基于Web的Internet平台; 综合、全面的具有Internet能力的商业应用; 强大的专业服务,帮助用户实施电子商务战略,以及设计、定制和实施各种电子商务解决方案...
SQL是英文Structured Query Language的缩写,意思为结构化查询语言。SQL语言的主要功能就是同各种数据库建立联系,进行沟通。按照ANSI(美国国家标准协会)的规定,SQL被作为关系型数据库管理系统的标准语言。SQL语句可以用来执行各种各样的操作,例如更新数据库中的数据,从数据库中提取数据等。目前,绝大多数流行的是关系型数据库管理系统。
内容来源网络,仅供参考!