hadoop跟關系資料庫_SQL-on-Hadoop技術與資料庫技術的差異在哪裡

㈠試比較hadoop中的資料庫hbase和傳統關系資料庫的不同

1.hadoop是分布式平台,就把計算和存儲都由hadoop自動調節分布到接入的計算機單元中
2.hbase是hadoop上實現的kv資料庫
3.hbase+hadoop無需再與mysql搭配了,
而且kv資料庫與傳統關系資料庫區別很大
4.hadoop+hbase是分布式計算與分布式資料庫存儲的組合
5.增刪查改都是真的hbase的,

㈡ SQL-on-Hadoop技術與資料庫技術的差異在哪裡

主要是方向的差異。

關系資料庫技術建立在關系數據模型之上，是主要用來存儲結構化數據並支持數據的插入、查詢、更新、刪除等操作的資料庫。Hadoop技術為面向大數據分析和處理的並行計算模型。兩者反向不一樣。

簡介：

資料庫是「按照數據結構來組織、存儲和管理數據的倉庫」。是一個長期存儲在計算機內的、有組織的、可共享的、統一管理的大量數據的集合。

資料庫是存放數據的倉庫。它的存儲空間很大，可以存放百萬條、千萬條、上億條數據。但是資料庫並不是隨意地將數據進行存放，是有一定的規則的，否則查詢的效率會很低。當今世界是一個充滿著數據的互聯網世界，充斥著大量的數據。

即這個互聯網世界就是數據世界。數據的來源有很多，比如出行記錄、消費記錄、瀏覽的網頁、發送的消息等等。除了文本類型的數據，圖像、音樂、聲音都是數據。

㈢試比較hadoop中的資料庫hbase和傳統關系資料庫的不同

答：主要體現在以下幾個方面：1.數據類型。關系資料庫採用關系模型，具有豐富的數據類型和儲存方式。HBase則採用了更加簡單的數據模型，它把數據儲存為未經解釋的字元串，用戶可以把不同格式的結構化數據和非結構化數據都序列化成字元串保存到HBase中，用戶需要自己編寫程序把字元串解析成不同的數據類型。
2.數據操作。關系資料庫中包含了豐富的操作，如插入、刪除、更新、查詢等，其中會涉及復雜的多表連接，通常是藉助多個表之間的主外鍵關聯來實現的。HBase操作則不存在復雜的表與表之間的關系，只有簡單的插入、查詢、刪除、清空等，因為HBase在設計上就避免了復雜的表與表之間的關系，通常只採用單表的主鍵查詢，所以它無法實現像關系資料庫中那樣的表與表之間的連接操作。
3.存儲模式。關系資料庫是基於行模式存儲的，元祖或行會被連續地存儲在磁碟頁中。在讀取數據時，需要順序掃描每個元組，然後從中篩選出查詢所需要的屬性。如果每個元組只有少量屬性的值對於查詢是有用的，那麼基於行模式存儲就會浪費許多磁碟空間和內存帶寬。HBase是基於列存儲的，每個列族都由幾個文件保存，不同列族的文件是分離的，它的優點是：可以降低I/O開銷，支持大量並發用戶查詢，因為僅需要處理可以回答這些查詢的列，而不是處理與查詢無關的大量數據行；同一個列族中的數據會被一起進行壓縮，由於同一列族內的數據相似度較高，因此可以獲得較高的數據壓縮比。
4.數據索引。關系資料庫通常可以針對不同列構建復雜的多個索引，以提高數據訪問性能。與關系資料庫不同的是，HBase只有一個索引——行鍵，通過巧妙的設計，HBase中所有訪問方法，或者通過行鍵訪問，或者通過行鍵掃描，從而使整個系統不會慢下來。由於HBase位於Hadoop框架之上，因此可以使用Hadoop MapRece來快速、高效地生成索引表。
6.數據維護。在關系資料庫中，更新操作會用最新的當前值去替換記錄中原來的舊值，舊值被覆蓋後就不會存在。而在HBase中執行更新操作時，並不會刪除數據舊的版本，而是生成一個新的版本，舊有的版本仍舊保留。
7.可伸縮性。關系資料庫很難實現橫向擴展，縱向擴展的空間也比較有限。相反，HBase和BigTable這些分布式資料庫就是為了實現靈活的水平擴展而開發的，因此能夠輕易地通過在集群中增加或者減少硬體數量來實現性能的伸縮。
但是，相對於關系資料庫來說，HBase也有自身的局限性，如HBase不支持事務，因此無法實現跨行的原子性。
註：本來也想來問這個問題，然後復制一下的。結果找不到，只好自己手打了，麻煩復制拿去用的同學點下贊唄。
2019.3.27-16:40

hadoop跟關系資料庫

與hadoop跟關系資料庫相關的內容