NoSQL,泛指非關系型的資料庫。隨著互聯網web2.0網站的興起,傳統的關系資料庫在處理web2.0網站,特別是超大規模和高並發的SNS類型的web2.0純動態網站槐虧源已經顯得力不從心,出現了很多難以克服的問題,而非關系型的資料庫則由於其本身的特點得到了非常迅速的發展。
常見的Nosql資料庫有:
一、Redis資料庫
Redis(RemoteDictionaryServer),即遠程字典服務,是一個開源的使用ANSIC語言編寫、支持網路、可基於內存亦可持久化的日誌型、Key-Value資料庫,並提供多種語言的API。從2010年3月15日起,Redis的開發工作由VMware主持。從2013年5月開始,Redis的開發由Pivotal贊助。
二、MongoDB資料庫
MongoDB是一個介於關系資料庫和非關系資料庫之間的產品,是非關系資料庫當中功能最豐富,最像關系資料庫的。它支持的數據結構非常鬆散,是類似json的bson格式,因此可以存儲比較復雜的數據類型。
Mongo最大的特點是它支持的查詢語言非常強大,其語法有點類似於面向對象的查詢語言,幾乎可以實現類似關系資料庫單表查詢的絕大部分功能,而且還支持對數據建立索引。
(1)常見nosql資料庫擴展閱讀:
對於NoSQL並沒有一個明確的范圍和定義,但是他們空雹都普遍存在下面一些共同特徵:
一、易擴展
NoSQL數鉛態據庫種類繁多,但是一個共同的特點都是去掉關系資料庫的關系型特性。數據之間無關系,這樣就非常容易擴展。無形之間,在架構的層面上帶來了可擴展的能力。
二、大數據量,高性能
NoSQL資料庫都具有非常高的讀寫性能,尤其在大數據量下,同樣表現優秀。這得益於它的無關系性,資料庫的結構簡單。一般MySQL使用Query Cache。NoSQL的Cache是記錄級的,是一種細粒度的Cache,所以NoSQL在這個層面上來說性能就要高很多。
三、靈活的數據模型
NoSQL無須事先為要存儲的數據建立欄位,隨時可以存儲自定義的數據格式。而在關系資料庫里,增刪欄位是一件非常麻煩的事情。如果是非常大數據量的表,增加欄位簡直就是——個噩夢。這點在大數據量的Web2.0時代尤其明顯。
四、高可用
NoSQL在不太影響性能的情況,就可以方便地實現高可用的架構。比如Cassandra、HBase模型,通過復制模型也能實現高可用。
Ⅱ nosql資料庫的四種類型
一般將NoSQL資料庫分為四大類:鍵值(Key-Value)存儲資料庫、列存儲資料庫、文檔型資料庫和圖形(Graph)資料庫。它們的數據模型、優缺點、典型應用場景。
鍵值(Key-Value)存儲資料庫Key指向Value的鍵值對,通常用hash表來實現查找速度快數據無結構化(通常只被當作字元串或者二進制數據)內容緩存,主要用於處理大量數據的高訪問負載,也用於一些日誌系統等。
列存儲資料庫,以列簇式存儲,將同一列數據存在一起查找速度快,可擴展性強,更容易進行分布式擴展功能相對局限分布式的文件系統。
文檔型資料庫,Key-Value對應的鍵值對,Value為結構化數據,數據結構要求不嚴格,表結構可變(不需要像關系型資料庫一樣需預先定義表結構),查詢性能不高,而且缺乏統一的查詢語法,Web應用。
圖形(Graph)資料庫,圖結構,利用圖結構相關演算法(如最短路徑定址,N度關系查找等),很多時候需要對整個圖做計算才能得出需要的信息,而且這種結構不太好做分布式的集群方案,社交網路,推薦系統等。
Ⅲ nosql資料庫的四種類型
nosql資料庫的四種類型如下:
1.key-value鍵值存儲資料庫:
相關產品: Redis、Riak、SimpleDB、Chordless、Scalaris、Memcached.
主要應用: 內容緩存,處理大量數據的高負載訪問,也用於系統日誌。
優點:查找速度快,大量操作時性能高。
2.列存儲資料庫:
相關產品: BigTable、HBase、Cassandra、HadoopDB、GreenPlum、PNUTS.
主要應用: 分布式數據的儲存與管理。
優點:查找速度快,可擴展性強,容易進行分布式擴展。
缺點:功能相對局限。
3.文檔型資料庫
相關產品:MongoDB、CouchDB、ThruDB、CloudKit、Perservere、Jackrabbit.
主要應用: web應用,管理面向文檔的數據或者類似的半結構化數據。
優點:數據結構靈活,表結構可變,復雜性低。
缺點:查詢效率低,且缺乏統一的查詢語言。
4.Graph圖形資料庫
相關產品: Neo4J、OrientDB、InfoGrid、GraphDB.
主要應用: 復雜,互連接,低結構化的圖結構場合, 專注構建關系圖譜。
優點: 利用圖結構相關演算法, 可用於構建復雜的關系圖譜。
缺點: 復雜度高。
Ⅳ nosql資料庫有哪些
1. CouchDB
所用語言: Erlang
特點:DB一致性,易於使用
使用許可: Apache
協議: HTTP/REST
雙向數據復制,
持續進行或臨時處理,
處理時帶沖突檢查,
因此,採用的是master-master復制(見編注2)
MVCC – 寫操作不阻塞讀操作
可保存文件之前的版本
Crash-only(可靠的)設計
需要不時地進行數據壓縮
視圖:嵌入式 映射/減少
格式化視圖:列表顯示
支持進行伺服器端文檔驗證
支持認證
根據變化實時更新
支持附件處理
因此, CouchApps(獨立的 js應用程序)
需要 jQuery程序庫
最佳應用場景:適用於數據變化較少,執行預定義查詢,進行數據統計的應用程序。適用於需要提供數據版本支持的應用程序。
例如: CRM、CMS系統。 master-master復制對於多站點部署是非常有用的。
(編注2:master-master復制:是一種資料庫同步方法,允許數據在一組計算機之間共享數據,並且可以通過小組中任意成員在組內進行數據更新。)
2. Redis
所用語言:C/C++
特點:運行異常快
使用許可: BSD
協議:類 Telnet
有硬碟存儲支持的內存資料庫,
但自2.0版本以後可以將數據交換到硬碟(注意, 2.4以後版本不支持該特性!)
Master-slave復制(見編注3)
雖然採用簡單數據或以鍵值索引的哈希表,但也支持復雜操作,例如 ZREVRANGEBYSCORE。
INCR & co (適合計算極限值或統計數據)
支持 sets(同時也支持 union/diff/inter)
支持列表(同時也支持隊列;阻塞式 pop操作)
支持哈希表(帶有多個域的對象)
支持排序 sets(高得分表,適用於范圍查詢)
Redis支持事務
支持將數據設置成過期數據(類似快速緩沖區設計)
Pub/Sub允許用戶實現消息機制
最佳應用場景:適用於數據變化快且資料庫大小可遇見(適合內存容量)的應用程序。
例如:股票價格、數據分析、實時數據搜集、實時通訊。
(編注3:Master-slave復制:如果同一時刻只有一台伺服器處理所有的復制請求,這被稱為
Master-slave復制,通常應用在需要提供高可用性的伺服器集群。)
3. MongoDB
所用語言:C++
特點:保留了SQL一些友好的特性(查詢,索引)。
使用許可: AGPL(發起者: Apache)
協議: Custom, binary( BSON)
Master/slave復制(支持自動錯誤恢復,使用 sets 復制)
內建分片機制
支持 javascript表達式查詢
可在伺服器端執行任意的 javascript函數
update-in-place支持比CouchDB更好
在數據存儲時採用內存到文件映射
對性能的關注超過對功能的要求
建議最好打開日誌功能(參數 –journal)
在32位操作系統上,資料庫大小限制在約2.5Gb
空資料庫大約占 192Mb
採用 GridFS存儲大數據或元數據(不是真正的文件系統)
最佳應用場景:適用於需要動態查詢支持;需要使用索引而不是 map/rece功能;需要對大資料庫有性能要求;需要使用
CouchDB但因為數據改變太頻繁而占滿內存的應用程序。
例如:你本打算採用 MySQL或 PostgreSQL,但因為它們本身自帶的預定義欄讓你望而卻步。
4. Riak
所用語言:Erlang和C,以及一些Javascript
特點:具備容錯能力
使用許可: Apache
協議: HTTP/REST或者 custom binary
可調節的分發及復制(N, R, W)
用 JavaScript or Erlang在操作前或操作後進行驗證和安全支持。
使用JavaScript或Erlang進行 Map/rece
連接及連接遍歷:可作為圖形資料庫使用
索引:輸入元數據進行搜索(1.0版本即將支持)
大數據對象支持( Luwak)
提供「開源」和「企業」兩個版本
全文本搜索,索引,通過 Riak搜索伺服器查詢( beta版)
支持Masterless多站點復制及商業許可的 SNMP監控
最佳應用場景:適用於想使用類似 Cassandra(類似Dynamo)資料庫但無法處理
bloat及復雜性的情況。適用於你打算做多站點復制,但又需要對單個站點的擴展性,可用性及出錯處理有要求的情況。
例如:銷售數據搜集,工廠控制系統;對宕機時間有嚴格要求;可以作為易於更新的 web伺服器使用。
5. Membase
所用語言: Erlang和C
特點:兼容 Memcache,但同時兼具持久化和支持集群
使用許可: Apache 2.0
協議:分布式緩存及擴展
非常快速(200k+/秒),通過鍵值索引數據
可持久化存儲到硬碟
所有節點都是唯一的( master-master復制)
在內存中同樣支持類似分布式緩存的緩存單元
寫數據時通過去除重復數據來減少 IO
提供非常好的集群管理 web界面
更新軟體時軟無需停止資料庫服務
支持連接池和多路復用的連接代理
最佳應用場景:適用於需要低延遲數據訪問,高並發支持以及高可用性的應用程序
例如:低延遲數據訪問比如以廣告為目標的應用,高並發的 web 應用比如網路游戲(例如 Zynga)
6. Neo4j
所用語言: Java
特點:基於關系的圖形資料庫
使用許可: GPL,其中一些特性使用 AGPL/商業許可
協議: HTTP/REST(或嵌入在 Java中)
可獨立使用或嵌入到 Java應用程序
圖形的節點和邊都可以帶有元數據
很好的自帶web管理功能
使用多種演算法支持路徑搜索
使用鍵值和關系進行索引
為讀操作進行優化
支持事務(用 Java api)
使用 Gremlin圖形遍歷語言
支持 Groovy腳本
支持在線備份,高級監控及高可靠性支持使用 AGPL/商業許可
最佳應用場景:適用於圖形一類數據。這是 Neo4j與其他nosql資料庫的最顯著區別
例如:社會關系,公共交通網路,地圖及網路拓譜
7. Cassandra
所用語言: Java
特點:對大型表格和 Dynamo支持得最好
使用許可: Apache
協議: Custom, binary (節約型)
可調節的分發及復制(N, R, W)
支持以某個范圍的鍵值通過列查詢
類似大表格的功能:列,某個特性的列集合
寫操作比讀操作更快
基於 Apache分布式平台盡可能地 Map/rece
我承認對 Cassandra有偏見,一部分是因為它本身的臃腫和復雜性,也因為 Java的問題(配置,出現異常,等等)
最佳應用場景:當使用寫操作多過讀操作(記錄日誌)如果每個系統組建都必須用 Java編寫(沒有人因為選用
Apache的軟體被解僱)
例如:銀行業,金融業(雖然對於金融交易不是必須的,但這些產業對資料庫的要求會比它們更大)寫比讀更快,所以一個自然的特性就是實時數據分析
8. HBase
(配合 ghshephard使用)
所用語言: Java
特點:支持數十億行X上百萬列
使用許可: Apache
協議:HTTP/REST (支持 Thrift,見編注4)
在 BigTable之後建模
採用分布式架構 Map/rece
對實時查詢進行優化
高性能 Thrift網關
通過在server端掃描及過濾實現對查詢操作預判
支持 XML, Protobuf, 和binary的HTTP
Cascading, hive, and pig source and sink moles
基於 Jruby( JIRB)的shell
對配置改變和較小的升級都會重新回滾
不會出現單點故障
堪比MySQL的隨機訪問性能
最佳應用場景:適用於偏好BigTable:)並且需要對大數據進行隨機、實時訪問的場合。
例如: Facebook消息資料庫(更多通用的用例即將出現)
編注4:Thrift
是一種介面定義語言,為多種其他語言提供定義和創建服務,由Facebook開發並開源。
當然,所有的系統都不只具有上面列出的這些特性。這里我僅僅根據自己的觀點列出一些我認為的重要特性。與此同時,技術進步是飛速的,所以上述的內容肯定需要不斷更新。我會盡我所能地更新這個列表。