Web1.0的时代,数据访问量很有限,用一夫当关的高性能的单点服务器可以解决大部分问题。
随着Web2.0的时代的到来,用户访问量大幅度提升,同时产生了大量的用户数据。加上后来的智能移动设备的普及,所有的互联网平台都面临了巨大的性能挑战。
NoSQL(NoSQL = Not Only SQL ),意即“不仅仅是SQL”,泛指非关系型的数据库。
NoSQL 不依赖业务逻辑方式存储,而以简单的key-value模式存储。因此大大的增加了数据库的扩展能力。
HBase是Hadoop项目中的数据库。它用于需要对大量的数据进行随机、实时的读写操作的场景中。
HBase的目标就是处理数据量非常庞大的表,可以用普通的计算机处理超过10亿行数据,还可处理有数百万列元素的数据表。
Apache Cassandra是一款免费的开源NoSQL数据库,其设计目的在于管理由大量商用服务器构建起来的庞大集群上的海量数据集(数据量通常达到PB级别)。在众多显着特性当中,Cassandra最为卓越的长处是对写入及读取操作进行规模调整,而且其不强调主集群的设计思路能够以相对直观的方式简化各集群的创建与扩展流程。
主要应用:社会关系,公共交通网络,地图及网络拓谱(n*(n-1)/2)
http://db-engines.com/en/ranking
⑵ 简述关系型数据库和NOSQL数据库分别适用场景
关系型数据库(Relational Database Management System,RDBMS)猛轮是一种使用关系模型来组织数据的数据库管理系统。它是传统的、最常用的数据库类型,广泛应用于各种领域,如企业应用、政府机构、教育机构等。
关系型数据库适用于存储烂迅结构化数据和执行复杂的查询操作的场景。它们提供了强大的查询功能,能够快速检索、汇总和分析数据。此外,关系型数据库还支持事务处理、约束、索引等功能,能够保证数据的完整性和一致性。
NOSQL(Not Only SQL)数据库是一种非关系型数据库,它旨在为大规模数据存储和处理提供更高的性能和更灵活的数据模型。NOSQL数据库主要分为四类:键值存储数据库、文档型数据库、列存储数据库和图型数据库。
NOSQL数据库适用于存储非结构化或半结构化数据的场景。它们支持快速写入和自动扩展,适用于海量数据的存储和处理。此外,NOSQL数据库还提供了灵活的数据模拟和查询功能,能够适应各种不同的饥知此数据类型和查询需求。但是,NOSQL数据库往往不支持事务处理和约束,因此在数据一致性和完整性方面可能不如关系型数据库。
总的来说,关系型数据库更适合存储结构化数据,执行复杂的查询和事务处理,保证数据一致性和完整性的场景。而NOSQL数据库更适合存储非结构化或半结构化数据,执行大规模数据存储和处理的场景。
⑶ nosql数据库的四种类型
一般将NoSQL数据库分为四大类:键值(Key-Value)存储数据库、列存储数据库、文档型数据库和图形(Graph)数据库。它们的数据模型、优缺点、典型应用场景。
键值(Key-Value)存储数据库Key指向Value的键值对,通常用hash表来实现查找速度快数据无结构化(通常只被当作字符串或者二进制数据)内容缓存,主要用于处理大量数据的高访问负载,也用于一些日志系统等。
列存储数据库,以列簇式存储,将同一列数据存在一起查找速度快,可扩展性强,更容易进行分布式扩展功能相对局限分布式的文件系统。
文档型数据库,Key-Value对应的键值对,Value为结构化数据,数据结构要求不严格,表结构可变(不需要像关系型数据库一样需预先定义表结构),查询性能不高,而且缺乏统一的查询语法,Web应用。
图形(Graph)数据库,图结构,利用图结构相关算法(如最短路径寻址,N度关系查找等),很多时候需要对整个图做计算才能得出需要的信息,而且这种结构不太好做分布式的集群方案,社交网络,推荐系统等。