數據都是放在磁碟陣列上的而不是伺服器硬碟上。
硬碟陣列不是技術,是一個實實在在的東西,可以理解成一大堆硬碟組成的陣列設備。
雲存儲是現在流行的概念,靠虛擬化和集群技術整合以前的存儲,從而使可利用磁碟容量變得很大
⑵ 14.數據倉庫常見的存儲優化方法有哪些
存儲優化管理的方式包括數據壓縮、數據重分布、存儲治理項優化、生命周期管理等方法。
數據壓縮
在分布式文件系統中,會將數據存儲3份,這意味著存儲1TB的邏輯數據,實際上會佔用3TB的物理空間。使用盤古RAIDfile格式的文件,將存儲比從1:3提高至1:1.5。這樣做的缺點是數據塊損壞時的修復時間比原來更長,讀的性能也有損失。數據重分布
由於每個表的數據分布不同,插入順序不同,導致壓縮效果有很大的差異,通過修改表的數據重分布(distributeby,sortby欄位)進行數據重分布,能夠對表進行優化處理。存儲治理項優化:
存儲治理項優化是指在元數據的基礎上,診斷、加工成多個存儲治理優化項。目前已有的存儲治理優化項有未管理表、空表、最近62天未訪問表、數據無更新無任務表等。生命周期管理策略
根本目的:用最少的存儲成本滿足最大的業務需求,使數據價值最大化。
a)周期性刪除策略:針對無效的歷史數據進行定期清理。
b)徹底刪除策略:無用表數據或者ETL過程產生的臨時數據,以及不需要保留的數據,可以進行及時刪除,包括刪除元數據。
c)永久保留策略:重要且不可恢復的底層數據和應用數據需要永久保留。
d)極限存儲策略:超高壓縮重復鏡像數據。
e)冷數據管理策略:永久保留策略的擴展。永久保留的數據需要遷移到冷數據中心進行永久保存。一般將重要且不可恢復的、佔用存儲空間大於100TB,且訪問頻次較低的數據進行冷備,例如3年以上的日誌數據。
⑶ 雲存儲是什麼
雲存儲是指通過集群應用、網格技術或分布式文件系統等功能,將網路中大量各種不同類型的存儲設備通過應用軟體集合起來協同工作,共同對外提供數據存儲和業務訪問功能的一個系統。
在雲計算的基礎上發展出了雲存儲,雲存儲實際上是雲計算中有關數據存儲、歸檔、備份的一個部分,是一種創新服務。
在雲存儲服務構建方面,它是通過分布式、虛擬化、智能配置等技術,實現海量、可彈性擴展、低成本、低能耗的共享存儲資源。
雲存儲的特點
1、超大規模,支持海量數據存儲;
2、高可擴展性,能夠隨時在線升級雲存儲空間容量;
3、高可用性和可靠性,當出現數據丟失時,能夠通過副本快速恢復;
4、安全,雲存儲通過用戶鑒權、訪問許可權控制等方式保障數據安全;
5、透明服務,擁有統一的介面,當節點發生變化時,用戶能夠隨時了解情況;
6、自動容錯,能夠自動處理節點故障,保障長時間正常運作;
7、低成本,使用雲存儲能夠減少電源消耗,從而有效降低能源成本。
⑷ 阿里雲等雲伺服器怎樣保證數據安全
雲伺服器不能保證100%的數據安全,最重要的是企業自身要提高安全防護意識。
將數據存儲在雲中要採用完善的加密措施,並制定相應方案,分析哪一類數據可以放在雲中,哪些不能放在雲中,以免引起不必要的麻煩;
在搭建站點和應用環境時,要安裝必要的監控軟體和殺毒軟體、防火牆設施,來保障雲中數據的安全;
為應對突然宕機、系統中毒或人為失誤導致的數據丟失,建議採用更為保險的雲快照服務,掛載搭檔回滾,靈活恢復所需,全方位保護您的數據安全;
正規的雲計算服務商會提供許多安全防禦方案,針對惡意軟體和流量攻擊,也有多種數據備份與恢復措施。