㈠ hana数据库与数据仓库区别
hana数据库与数据仓库区别分别是:
数据库(Database)是:
1、相对复杂的表格结构,存储结构相对紧致,少冗余数据。
2、读和写都有优化。
3、相对简单的read/write query,单次作用于相对的少量数据。
数据仓库(Datawarehouse)是:
1、相对简单的(Denormalized)表格结构,存储结构相对松散,多冗余数据。
2、一般只是读优化。
3、相对复杂的read query,单次作用于相对大量的数据(历史数据)。
并且数据库 Database (Oracle, Mysql, PostgreSQL)主要用于事务处理,数据仓库 Datawarehouse (Amazon Redshift, Hive)主要用于数据分析。
数据仓库的弱势之处是:
并不是所有的读操作,数据仓库一直都有优势。比如在如下两种情况时,数据仓库的读表现并不如数据库:
1、在对小量数据进行读取操作的时候,由于数据仓库要进行找Node的location之类的预运算,整体效率上反倒不如数据库。
2、如果读取操作的目标不是主键(PrimaryKey)或者分配键(PartitionKey),那么数据仓库的查询也需要进行全局扫描,效率上就不好说是否胜过数据库了。