㈠ hana資料庫與數據倉庫區別
hana資料庫與數據倉庫區別分別是:
資料庫(Database)是:
1、相對復雜的表格結構,存儲結構相對緊致,少冗餘數據。
2、讀和寫都有優化。
3、相對簡單的read/write query,單次作用於相對的少量數據。
數據倉庫(Datawarehouse)是:
1、相對簡單的(Denormalized)表格結構,存儲結構相對鬆散,多冗餘數據。
2、一般只是讀優化。
3、相對復雜的read query,單次作用於相對大量的數據(歷史數據)。
並且資料庫 Database (Oracle, Mysql, PostgreSQL)主要用於事務處理,數據倉庫 Datawarehouse (Amazon Redshift, Hive)主要用於數據分析。
數據倉庫的弱勢之處是:
並不是所有的讀操作,數據倉庫一直都有優勢。比如在如下兩種情況時,數據倉庫的讀表現並不如資料庫:
1、在對小量數據進行讀取操作的時候,由於數據倉庫要進行找Node的location之類的預運算,整體效率上反倒不如資料庫。
2、如果讀取操作的目標不是主鍵(PrimaryKey)或者分配鍵(PartitionKey),那麼數據倉庫的查詢也需要進行全局掃描,效率上就不好說是否勝過資料庫了。