分布式緩存服務特徵_分布式存儲的優點有哪些

A. EhCache 分布式緩存/緩存集群

一緩存系統簡介 EhCache 是一個純 Java 的進程內緩存框架具有快速精乾等特點是 Hibernate 中默認的 CacheProvider EhCache 應用架構圖下圖是 EhCache 在應用程序中的位置

EhCache 的主要特性有快速精幹簡單多種緩存策略緩存數據有兩級內存和磁碟因此無需擔心容量問題緩存數據會在虛擬機重啟的過程中寫入磁碟可以通過 RMI 可插入 API 等方式進行分布式緩存具有緩存和緩存管理器的偵聽介面支持多緩存管理器實例以及一個實例的多個緩存區域提供 Hibernate 的緩存實現由於 EhCache 是進程中的緩存系統一旦將應用部署在集群環境中每一個節點維護各自的緩存數據當某個節點對緩存數據進行更新這些更新的數據無法在其它節點 *** 享這不僅會降低節點運行的效率而且會導致數據不同步的情況發生例如某個網站採用 A B 兩個節點作為集群部署當 A 節點的緩存更新後而 B 節點緩存尚未更新就可能出現用戶在瀏覽頁面的時候一會是更新後的數據一會是尚未更新的數據盡管我們也可以通過 Session Sticky 技術來將用戶鎖定在某個節點上但對於一些交互性比較強或者是非 Web 方式的系統來說 Session Sticky 顯然不太適合所以就需要用到 EhCache 的集群解決方案從版本開始 Ehcache可以使用分布式的緩存了 EhCache 從版本開始支持五種集群方案分別是 ? Terracotta ? RMI ? JMS ? JGroups ? EhCache Server 其中的三種最為常用集群方式分別是 RMI JGroups 以及 EhCache Server 本文主要介紹RMI的方式分布式這個特性是以plugin的方式實現的 Ehcache自帶了一些默認的分布式緩存插件實現這些插件可以滿足大部分應用的需要如果需要使用其他的插件那就需要自己開發了開發者可以通過查看distribution包里的源代碼及JavaDoc來實現它盡管不是必須的在使用分布式緩存時理解一些ehcahce的設計思想也是有幫助的這可以參看分布式緩存設計的頁面以下的部分將展示如何讓分布式插件同ehcache一起工作下面列出的是一些分布式緩存中比較重要的方面 ? 你如何知道集群環境中的其他緩存？ ? 分布式傳送的消息是什麼形式？ ? 什麼情況需要進行復制？增加（Puts）更新（Updates）或是失效（Expiries）？ ? 採用什麼方式進行復制？同步還是非同步方式？為了安裝分布式緩存你需要配置一個PeerProvider 一個CacheManagerPeerListener 它們對於一個CacheManager來說是全局的每個進行分布式操作的cache都要添加一個cacheEventListener來傳送消息

二集群緩存概念及其配置 正確的元素類型只有可序列化的元素可以進行復制一些操作比如移除只需要元素的鍵值而不用整個元素在這樣的操作中即使元素不是可序列化的但鍵值是可序列化的也可以被復制成員發現（Peer Discovery） Ehcache進行集群的時候有一個cache組的概念每個cache都是其他cache的一個peer 沒有主cache的存在剛才我們問了一個問題你如何知道集群環境中的其他緩存？這個問題可以命名為成員發現（Peer Discovery） Ehcache提供了兩種機制用來進行成員發現就像一輛汽車手動檔和自動檔要使用一個內置的成員發現機制要在ehcache的配置文件中指定元素的class屬性為 net sf ehcache distribution 自動的成員發現自動的發現方式用TCP廣播機制來確定和維持一個廣播組它只需要一個簡單的配置可以自動的在組中添加和移除成員在集群中也不需要什麼優化伺服器的知識這是默認推薦的成員每秒向群組發送一個心跳如果一個成員秒種都沒有發出信號它將被群組移除如果一個新的成員發送了一個心跳它將被添加進群組任何一個用這個配置安裝了復制功能的cache都將被其他的成員發現並標識為可用狀態要設置自動的成員發現需要指定ehcache配置文件中元素的properties屬性就像下面這樣 peerDiscovery=automatic multicastGroupAddress=multicast address | multicast host name multicastGroupPort=port timeToLive= （timeToLive屬性詳見常見問題部分的描述）示例假設你在集群中有兩台伺服器你希望同步sampleCache 和sampleCache 每台獨立的伺服器都要有這樣的配置配置server 和server <class= net sf ehcache distribution properties= peerDiscovery=automatic multicastGroupAddress= />multicastGroupPort= timeToLive= 手動進行成員發現進行手動成員配置要知道每個監聽器的IP地址和埠成員不能在運行時動態地添加和移除在技術上很難使用廣播的情況下就可以手動成員發現例如在集群的伺服器之間有一個不能傳送廣播報文的路由器你也可以用手動成員發現進行單向的數據復制只讓server 知道server 而server 不知道server 配置手動成員發現需要指定ehcache配置文件中的properties屬性像下面這樣 peerDiscovery=manual rmiUrls=//server:port/cacheName //server:port/cacheName … rmiUrls配置的是伺服器cache peers的列表注意不要重復配置示例假設你在集群中有兩台伺服器你要同步sampleCache 和sampleCache 下面是每個伺服器需要的配置配置server <class= net sf ehcache distribution properties= peerDiscovery=manual />rmiUrls=//server : /sampleCache |//server : /sampleCache 配置server <class= net sf ehcache distribution properties= peerDiscovery=manual />rmiUrls=//server : /sampleCache |//server : /sampleCache 配置CacheManagerPeerListener 每個CacheManagerPeerListener監聽從成員們發向當前CacheManager的消息配置CacheManagerPeerListener需要指定一個它以插件的機制實現用來創建CacheManagerPeerListener 的屬性有 class – 一個完整的工廠類名 properties – 只對這個工廠有意義的屬性使用逗號分隔 Ehcache有一個內置的基於RMI的分布系統它的監聽器是RMICacheManagerPeerListener 這個監聽器可以用 RMI來配置 <class= net sf ehcache distribution RMI properties= hostName=localhost port= />socketTimeoutMillis= 有效的屬性是 hostname （可選） – 運行監聽器的伺服器名稱標明了做為集群群組的成員的地址同時也是你想要控制的從集群中接收消息的介面

在CacheManager初始化的時候會檢查hostname是否可用如果hostName不可用 CacheManager將拒絕啟動並拋出一個連接被拒絕的異常如果指定 hostname將使用InetAddress getLocalHost（） getHostAddress（）來得到警告不要將localhost配置為本地地址因為它在網路中不可見將會導致不能從遠程伺服器接收信息從而不能復制在同一台機器上有多個CacheManager的時候你應該只用localhost來配置 port – 監聽器監聽的埠 socketTimeoutMillis （可選） – Socket超時的時間默認是 ms 當你socket同步緩存請求地址比較遠不是本地區域網你可能需要把這個時間配置大些不然很可能延時導致同步緩存失敗配置CacheReplicators 每個要進行同步的cache都需要設置一個用來向CacheManagerr的成員復制消息的緩存事件監聽器這個工作要通過為每個cache的配置增加一個cacheEventListenerFactory元素來完成 <! Sample cache named sampleCache ><cache name= sampleCache maxElementsInMemory= eternal= false timeToIdleSeconds= timeToLiveSeconds= overflowToDisk= false ><cacheEventListenerFactory class= net sf ehcache distribution RMICacheReplicatorFactory properties= replicateAsynchronously=true replicatePuts=true replicateUpdates=true replicateUpdatesViaCopy=false replicateRemovals=true /></cache>class – 使用net sf ehcache distribution RMICacheReplicatorFactory 這個工廠支持以下屬性 replicatePuts=true | false – 當一個新元素增加到緩存中的時候是否要復制到其他的peers 默認是true replicateUpdates=true | false – 當一個已經在緩存中存在的元素被覆蓋時是否要進行復制默認是true replicateRemovals= true | false – 當元素移除的時候是否進行復制默認是true replicateAsynchronously=true | false – 復制方式是非同步的（指定為true時）還是同步的（指定為false時）默認是true replicatePutsViaCopy=true | false – 當一個新增元素被拷貝到其他的cache中時是否進行復制指定為true時為復制默認是true replicateUpdatesViaCopy=true | false – 當一個元素被拷貝到其他的cache中時是否進行復制（指定為true時為復制）默認是true 你可以使用ehcache的默認行為從而減少配置的工作量默認的行為是以非同步的方式復制每件事你可以像下面的例子一樣減少RMICacheReplicatorFactory的屬性配置 <! Sample cache named sampleCache All missing RMICacheReplicatorFactory properties default to true ><cache name= sampleCache maxElementsInMemory= eternal= true overflowToDisk= false memoryStoreEvictionPolicy= LFU ><cacheEventListenerFactory class= net sf ehcache distribution RMICacheReplicatorFactory /></cache> 常見的問題 Windows上的Tomcat 有一個Tomcat或者是JDK的bug 在tomcat啟動時如果tomcat的安裝路徑中有空格的話在啟動時RMI監聽器會失敗參見 bin/wa?A =ind &L=rmi users&P= 和 doc/faq howto bugs/l 由於在Windows上安裝Tomcat默認是裝在 Program Files 文件夾里的所以這個問題經常發生廣播阻斷自動的peer discovery與廣播息息相關廣播可能被路由阻攔像Xen和VMWare這種虛擬化的技術也可以阻攔廣播如果這些都打開了你可能還在要將你的網卡的相關配置打開一個簡單的辦法可以告訴廣播是否有效那就是使用ehcache remote debugger來看心跳是否可用廣播傳播的不夠遠或是傳得太遠你可以通過設置badly misnamed time to live來控制廣播傳播的距離用廣播IP協議時 timeToLive的值指的是數據包可以傳遞的域或是范圍約定如下是限制在同一個伺服器是限制在同一個子網是限制在同一個網站是限制在同一個region 是限制在同一個大洲是不限制譯者按上面這些資料翻譯的不夠准確請讀者自行尋找原文理解吧在Java實現中默認值是也就是在同一個子網中傳播改變timeToLive屬性可以限制或是擴展傳播的范圍

三 RMI方式緩存集群/配置分布式緩存 RMI 是 Java 的一種遠程方法調用技術是一種點對點的基於 Java 對象的通訊方式 EhCache 從版本開始就支持 RMI 方式的緩存集群在集群環境中 EhCache 所有緩存對象的鍵和值都必須是可序列化的也就是必須實現 java io Serializable 介面這點在其它集群方式下也是需要遵守的下圖是 RMI 集群模式的結構圖

採用 RMI 集群模式時集群中的每個節點都是對等關系並不存在主節點或者從節點的概念因此節點間必須有一個機制能夠互相認識對方必須知道其它節點的信息包括主機地址埠號等 EhCache 提供兩種節點的發現方式手工配置和自動發現手工配置方式要求在每個節點中配置其它所有節點的連接信息一旦集群中的節點發生變化時需要對緩存進行重新配置由於 RMI 是 Java 中內置支持的技術因此使用 RMI 集群模式時無需引入其它的 Jar 包 EhCache 本身就帶有支持 RMI 集群的功能使用 RMI 集群模式需要在 ehcache xml 配置文件中定義節點分布式同步緩存要讓這邊的cache知道對方的cache 叫做Peer Discovery（成員發現） EHCache實現成員發現的方式有兩種手動查找 A 在ehcache xml中配置PeerDiscovery成員發現對象 Server 配置配置本地hostName port是分別監聽 : 的mobileCache和 : 的mobileCache 注意這里的mobileCache是緩存的名稱分別對應著server server 的cache的配置 <?xml version= encoding= gbk ?><ehcache xmlns:xsi= instance xsi:noNamespaceSchemaLocation= ehcache xsd > <diskStore path= java io tmpdir /> <! 集群多台伺服器中的緩存這里是要同步一些伺服器的緩存 server hostName: port: cacheName:mobileCache server hostName: port: cacheName:mobileCache server hostName: port: cacheName:mobileCache 注意每台要同步緩存的伺服器的RMI通信socket埠都不一樣在配置的時候注意設置 > <! server 的配置 > < class= net sf ehcache distribution properties= hostName=localhost port= socketTimeoutMillis= peerDiscovery=manual rmiUrls=// : /mobileCache|// : /mobileCache /></ehcache>以上注意元素出現的位置在diskStore下

同樣在你的另外台伺服器上增加配置 Server 配置本地host port為分別同步 : 的mobileCache和 : 的mobileCache <! server 的配置 >< class= net sf ehcache distribution properties= hostName=localhost port= socketTimeoutMillis= peerDiscovery=manual rmiUrls=// : /mobileCache|// : /mobileCache />Server 配置本地host port為分別同步 : 的mobileCache緩存和 : 的mobileCache緩存 <! server 的配置 >< class= net sf ehcache distribution properties= hostName=localhost port= socketTimeoutMillis= peerDiscovery=manual rmiUrls=// : /mobileCache|// : /mobileCache />這樣就在三台不同的伺服器上配置了手動查找cache的PeerProvider成員發現的配置了值得注意的是你在配置rmiUrls的時候要特別注意url不能重復出現並且埠地址都是對的如果指定 hostname將使用InetAddress getLocalHost（） getHostAddress（）來得到警告不要將localhost配置為本地地址因為它在網路中不可見將會導致不能從遠程伺服器接收信息從而不能復制在同一台機器上有多個CacheManager的時候你應該只用localhost來配置 B 下面配置緩存和緩存同步監聽需要在每台伺服器中的ehcache xml文件中增加cache配置和cacheEventListenerFactory cacheLoaderFactory的配置 <defaultCache maxElementsInMemory= eternal= false timeToIdleSeconds= timeToLiveSeconds= overflowToDisk= false /><! 配置自定義緩存 maxElementsInMemory:緩存中允許創建的最大對象數 eternal:緩存中對象是否為永久的如果是超時設置將被忽略對象從不過期 timeToIdleSeconds:緩存數據空閑的最大時間也就是說如果有一個緩存有多久沒有被訪問就會被銷毀如果該值是就意味著元素可以停頓無窮長的時間 timeToLiveSeconds:緩存數據存活的時間緩存對象最大的的存活時間超過這個時間就會被銷毀這只能在元素不是永久駐留時有效如果該值是就意味著元素可以停頓無窮長的時間 overflowToDisk:內存不足時是否啟用磁碟緩存 memoryStoreEvictionPolicy:緩存滿了之後的淘汰演算法每一個小時更新一次緩存（小時過期） ><cache name= mobileCache maxElementsInMemory= eternal= false overflowToDisk= true timeToIdleSeconds= timeToLiveSeconds= memoryStoreEvictionPolicy= LFU > <! RMI緩存分布同步查找 class使用net sf ehcache distribution RMICacheReplicatorFactory 這個工廠支持以下屬性 replicatePuts=true | false – 當一個新元素增加到緩存中的時候是否要復制到其他的peers 默認是true replicateUpdates=true | false – 當一個已經在緩存中存在的元素被覆蓋時是否要進行復制默認是true replicateRemovals= true | false – 當元素移除的時候是否進行復制默認是true replicateAsynchronously=true | false – 復制方式是非同步的指定為true時還是同步的指定為false時默認是true replicatePutsViaCopy=true | false – 當一個新增元素被拷貝到其他的cache中時是否進行復制指定為true時為復制默認是true replicateUpdatesViaCopy=true | false – 當一個元素被拷貝到其他的cache中時是否進行復制指定為true時為復制默認是true = > <! 監聽RMI同步緩存對象配置注冊相應的的緩存監聽類用於處理緩存事件如put remove update 和expire > <cacheEventListenerFactory class= net sf ehcache distribution RMICacheReplicatorFactory properties= replicateAsynchronously=true /> replicatePuts=true replicateUpdates=true replicateUpdatesViaCopy=false replicateRemovals=true <! 用於在初始化緩存以及自動設置 > <bootstrapCacheLoaderFactory class= net sf ehcache bootstrap BootstrapCacheLoaderFactory /></cache> C 這樣就完成了台伺服器的配置下面給出server 的完整的ehcache xml的配置 <?xml version= encoding= gbk ?><ehcache xmlns:xsi= instance xsi:noNamespaceSchemaLocation= ehcache xsd > <diskStore path= java io tmpdir /> <!

集群多台伺服器中的緩存這里是要同步一些伺服器的緩存 server hostName: port: cacheName:mobileCache server hostName: port: cacheName:mobileCache server hostName: port: cacheName:mobileCache 注意每台要同步緩存的伺服器的RMI通信socket埠都不一樣在配置的時候注意設置 > <! server 的配置 > < class= net sf ehcache distribution properties= hostName=localhost port= socketTimeoutMillis= peerDiscovery=manual rmiUrls=// : /mobileCache|// : /mobileCache /> <defaultCache maxElementsInMemory= eternal= false timeToIdleSeconds= timeToLiveSeconds= overflowToDisk= false /> <! 配置自定義緩存 maxElementsInMemory:緩存中允許創建的最大對象數 eternal:緩存中對象是否為永久的如果是超時設置將被忽略對象從不過期 timeToIdleSeconds:緩存數據空閑的最大時間也就是說如果有一個緩存有多久沒有被訪問就會被銷毀如果該值是就意味著元素可以停頓無窮長的時間 timeToLiveSeconds:緩存數據存活的時間緩存對象最大的的存活時間超過這個時間就會被銷毀這只能在元素不是永久駐留時有效如果該值是就意味著元素可以停頓無窮長的時間 overflowToDisk:內存不足時是否啟用磁碟緩存 memoryStoreEvictionPolicy:緩存滿了之後的淘汰演算法每一個小時更新一次緩存（小時過期） > <cache name= mobileCache maxElementsInMemory= eternal= false overflowToDisk= true timeToIdleSeconds= timeToLiveSeconds= memoryStoreEvictionPolicy= LFU > <! RMI緩存分布同步查找 class使用net sf ehcache distribution RMICacheReplicatorFactory 這個工廠支持以下屬性 replicatePuts=true | false – 當一個新元素增加到緩存中的時候是否要復制到其他的peers 默認是true replicateUpdates=true | false – 當一個已經在緩存中存在的元素被覆蓋時是否要進行復制默認是true replicateRemovals= true | false – 當元素移除的時候是否進行復制默認是true replicateAsynchronously=true | false – 復制方式是非同步的指定為true時還是同步的指定為false時默認是true replicatePutsViaCopy=true | false – 當一個新增元素被拷貝到其他的cache中時是否進行復制指定為true時為復制默認是true replicateUpdatesViaCopy=true | false – 當一個元素被拷貝到其他的cache中時是否進行復制指定為true時為復制默認是true = > <! 監聽RMI同步緩存對象配置注冊相應的的緩存監聽類用於處理緩存事件如put remove update 和expire > <cacheEventListenerFactory class= net sf ehcache distribution RMICacheReplicatorFactory properties= replicateAsynchronously=true /> replicatePuts=true replicateUpdates=true replicateUpdatesViaCopy=false replicateRemovals=true <! 用於在初始化緩存以及自動設置 > <bootstrapCacheLoaderFactory class= net sf ehcache bootstrap BootstrapCacheLoaderFactory /> </cache></ehcache> 自動發現自動發現配置和手動查找的方式有一點不同其他的地方都基本是一樣的同樣在ehcache xml中增加配置配置如下 <! 搜索某個網段上的緩存timeToLive 是限制在同一個伺服器是限制在同一個子網是限制在同一個網站是限制在同一個region 是限制在同一個大洲是不限制 >< class= net sf ehcache distribution properties= peerDiscovery=automatic multicastGroupAddress= multicastGroupPort= timeToLive= /> lishixin/Article/program/Java/hx/201311/25706

B. 如何實現分布式緩存技術

分布式緩存系統是為了解決資料庫伺服器和web伺服器之間的瓶頸。
如果一個網站的流量很大，這個瓶頸將會非常明顯，每次資料庫查詢耗費的時間將會非常可觀。
對於更新速度不是很快的網站，可以用靜態化來避免過多的資料庫查詢。
對於更新速度以秒計的網站，靜態化也不會太理想，可以用緩存系統來構建。
如果只是單台伺服器用作緩存，問題不會太復雜，如果有多台伺服器用作緩存，就要考慮緩存伺服器的負載均衡。

C. 什麼是分布式存儲系統

分布式存儲系統，是將數據分散存儲在多台獨立的設備上。傳統的網路存儲系統採用集中的存儲伺服器存放所有數據，存儲伺服器成為系統性能的瓶頸，也是可靠性和安全性的焦點，不能滿足大規模存儲應用的需要。分布式網路存儲系統採用可擴展的系統結構，利用多台存儲伺服器分擔存儲負荷，利用位置伺服器定位存儲信息，它不但提高了系統的可靠性、可用性和存取效率，還易於擴展。

(3)分布式緩存服務特徵擴展閱讀：

分布式存儲，集中管理，在這個方案中，共有三級：

1、上級監控中心：上級監控中心通常只有一個，主要由數字矩陣、認證伺服器和VSTARClerk軟體等。

2、本地監控中心：本地監控中心可以有多個，可依據地理位置設置，或者依據行政隸屬關系設立，主要由數字矩陣、流媒體網關、iSCSI存儲設備、VSTARRecorder軟體等組成；音視頻的數據均主要保存在本地監控中心，這就是分布式存儲的概念。

3、監控前端：主要由攝像頭、網路視頻伺服器組成，其中VE4000系列的網路視頻伺服器可以帶硬碟，該硬碟主要是用於網路不暢時，暫時對音視頻數據進行保存，或者需要在前端保存一些重要數據的情況。

D. 緩存服務的特點

使用WEB高速緩存重定向技術可以為用戶帶來以下好處：
減少帶寬消耗
由於需要在網上通過的請求和響應減少，降低了託管客戶對互聯網帶寬的佔用，因此可節省大量的帶寬資源。
減少伺服器載入
伺服器處理的請求減少，可以減少伺服器的載入。
減少用戶通入時間
因為對緩存請求的響應是立即可以獲得的, 不僅極大地縮短了互聯網靜態頁面訪問的響應時間，而且也大大提高了託管客戶的WEB伺服器對於不可緩存的內容的處理能力，因此可以在現有網路和設備條件下提供更好的內容訪問服務。
增加吞吐量
在客戶投資最少的情況下增加伺服器的內容訪問服務能力。
增加可靠性
由於具有持續高性能的互聯網服務質量，系統的冗餘性和故障恢復能力，因此可有效地保證高峰值業務量的服務能力。
緩存設備工作是在比路由器更高的層次上，能夠把用戶所要訪問的網路信息抓到本地，在最短的時間內將信息連續、完整、實時地傳遞給最終用戶。可以說，緩存技術降低了目前廣域網通訊帶寬成本，是提升互聯網訪問性能的最好方法。
此外，Web Cache的功用遠不止存儲和提供數據。Cache是作為基於軟體的代理伺服器的一部分或專門的硬體（appliances，容器）出現的，它可以提供更好的性能。Cache設備可在用戶端儲存最常瀏覽的網頁內容，隨時提供給用戶存取，還可同時監控內容的來源，以測知網頁是否已更新，並同步更新儲存的內容。
一般來說，在配置了互聯網加速設備後，由於很多用戶瀏覽的內容可以從高速緩存中直接調出，網路效能會有明顯的大幅提升：網頁響應時間最多可以減少90%以上；頻寬使用率將增加30%～50%。高速緩存服務通常包括：共享內容高速緩存服務、獨享內容高速緩存服務。

E. 什麼是分布式緩存

分布式緩存能夠處理大量的動態數據，因此比較適合應用在Web 2.0時代中的社交網站等需要由用戶生成內容的場景。從本地緩存擴展到分布式緩存後，關注重點從CPU、內存、緩存之間的數據傳輸速度差異也擴展到了業務系統、資料庫、分布式緩存之間的數據傳輸速度差異。

常用的分布式緩存包括Redis和Memcached。

Memcached

Memcached是一個高性能的分布式內存對象緩存系統，用於動態Web應用以減輕資料庫負載。Memcached通過在內存中緩存數據和對象來減少讀取資料庫的次數，從而提高動態、資料庫驅動網站的速度。

特點：哈希方式存儲；全內存操作；簡單文本協議進行數據通信；只操作字元型數據；集群由應用進行控制，採用一致性哈希演算法。

限制性：數據保存在內存當中的，一旦機器重啟，數據會全部丟失；只能操作字元型數據，數據類型貧乏；以root許可權運行，而且Memcached本身沒有任何許可權管理和認證功能，安全性不足；能存儲的數據長度有限，最大鍵長250個字元，儲存數據不能超過1M。

Redis

Redis是一個開源的使用ANSI C語言編寫、支持網路、可基於內存亦可持久化的日誌型、Key-Value資料庫，並提供多種語言的API。

特點：

Redis支持的數據類型包括：字元串、string、hash、set、sortedset、list；Redis實現持久化的方式：定期將內存快照寫入磁碟；寫日誌；Redis支持主從同步。

限制性：單核運行，在存儲大數據的時候性能會有降低；不是全內存操作；主從復制是全量復制，對實際的系統運營造成了一定負擔。

F. 分布式緩存是什麼

分布式緩存使用CARP（Caching Array Routing Protocol）技術，可以產生一種高效率無接縫式的緩存，使用上讓多台緩存伺服器形同一台，並且不會造成數據重復存放的情況。
同時還有層次式緩存、動態緩存和計劃緩存三種。

G. 分布式緩存是什麼

分布式緩存主要用於在高並發環境下，減輕資料庫的壓力，提高系統的響應速度和並發吞吐。當大量的讀、寫請求湧向資料庫時，磁碟的處理速度與內存顯然不在一個量級，因此，在資料庫之前加一層緩存，能夠顯著提高系統的響應速度，並降低資料庫的壓力。作為傳統的關系型資料庫，MySQL提供完整的ACID操作，支持豐富的數據類型、強大的關聯查詢、where語句等，能夠非常客易地建立查詢索引，執行復雜的內連接、外連接、求和、排序、分組等操作，並且支持存儲過程、函數等功能，產品成熟度高，功能強大。但是，對於需要應對高並發訪問並且存儲海量數據的場景來說，出於對性能的考慮，不得不放棄很多傳統關系型資料庫原本強大的功能，犧牲了系統的易用性，並且使得系統的設計和管理變得更為復雜。這也使得在過去幾年中，流行著另一種新的存儲解決方案——NoSQL，它與傳統的關系型資料庫最大的差別在於，它不使用SQL作為查詢語言來查找數據，而採用key-value形式進行查找，提供了更高的查詢效率及吞吐，並且能夠更加方便地進行擴展，存儲海量數據，在數千個節點上進行分區，自動進行數據的復制和備份。在分布式系統中，消息作為應用間通信的一種方式，得到了十分廣泛的應用。消息可以被保存在隊列中，直到被接收者取出，由於消息發送者不需要同步等待消息接收者的響應，消息的非同步接收降低了系統集成的耦合度，提升了分布式系統協作的效率，使得系統能夠更快地響應用戶，提供更高的吞吐。
當系統處於峰值壓力時，分布式消息隊列還能夠作為緩沖，削峰填谷，緩解集群的壓力，避免整個系統被壓垮。垂直化的搜索引擎在分布式系統中是一個非常重要的角色，它既能夠滿足用戶對於全文檢索、模糊匹配的需求，解決資料庫like查詢效率低下的問題，又能夠解決分布式環境下，由於採用分庫分表，或者使用NoSQL資料庫，導致無法進行多表關聯或者進行復雜查詢的問題。

H. 分布式存儲的優點有哪些

分布式存儲的六大優點
分布式存儲往往採用分布式的系統結構，利用多台存儲伺服器分擔存儲負荷，利用位置伺服器定位存儲信息。它不但提高了系統的可靠性、可用性和存取效率，還易於擴展，將通用硬體引入的不穩定因素降到最低。優點如下：

1. 高性能

一個具有高性能的分布式存戶通常能夠高效地管理讀緩存和寫緩存，並且支持自動的分級存儲。分布式存儲通過將熱點區域內數據映射到高速存儲中，來提高系統響應速度;一旦這些區域不再是熱點，那麼存儲系統會將它們移出高速存儲。而寫緩存技術則可使配合高速存儲來明顯改變整體存儲的性能，按照一定的策略，先將數據寫入高速存儲，再在適當的時間進行同步落盤。

2. 支持分級存儲

由於通過網路進行松耦合鏈接，分布式存儲允許高速存儲和低速存儲分開部署，或者任意比例混布。在不可預測的業務環境或者敏捷應用情況下，分層存儲的優勢可以發揮到最佳。解決了目前緩存分層存儲最大的問題是當性能池讀不命中後，從冷池提取數據的粒度太大，導致延遲高，從而給造成整體的性能的抖動的問題。

3. 一致性

與傳統的存儲架構使用RAID模式來保證數據的可靠性不同，分布式存儲採用了多副本備份機制。在存儲數據之前，分布式存儲對數據進行了分片，分片後的數據按照一定的規則保存在集群節點上。為了保證多個數據副本之間的一致性，分布式存儲通常採用的是一個副本寫入，多個副本讀取的強一致性技術，使用鏡像、條帶、分布式校驗等方式滿足租戶對於可靠性不同的需求。在讀取數據失敗的時候，系統可以通過從其他副本讀取數據，重新寫入該副本進行恢復，從而保證副本的總數固定;當數據長時間處於不一致狀態時，系統會自動數據重建恢復，同時租戶可設定數據恢復的帶寬規則，最小化對業務的影響。

4. 容災性

在分布式存儲的容災中，一個重要的手段就是多時間點快照技術，使得用戶生產系統能夠實現一定時間間隔下的各版本數據的保存。特別值得一提的是，多時間點快照技術支持同時提取多個時間點樣本同時恢復，這對於很多邏輯錯誤的災難定位十分有用，如果用戶有多台伺服器或虛擬機可以用作系統恢復，通過比照和分析，可以快速找到哪個時間點才是需要回復的時間點，降低了故障定位的難度，縮短了定位時間。這個功能還非

5. 擴展性

6. 存儲系統標准化

I. 什麼是分布式存儲系統

分布式存儲系統

定義

分布式存儲系統是大量普通PC伺服器通過Internet互聯，對外作為一個整體提供存儲服務

特性

可擴展
低成本
高性能
易用

挑戰

分布式存儲系統的挑戰主要在於數據、狀態信息的持久化，要求在自動遷移、自動容錯、並發讀寫的過程中保證數據的一致性。分布式存儲涉及的技術主要來自兩個領域：分布式系統以及資料庫。

數據分布
一致性
容錯
負載均衡
事務與並發控制
易用性
壓縮/解壓縮

分類

非結構化數據，一般的文檔

結構化數據，存儲在關系資料庫中

半結構化數據，HTML文檔

不同的分布式存儲系統適合處理不同類型的數據：

分布式文件系統

非結構化數據，這類數據以對象的形式組織，不同對象之間沒有關聯，這樣的數據一般稱為Blob（二進制大對象）數據

典型的有Facebook Haystack 以及 Taobao File System

另外，分布式文件系統也常作為分布式表格系統以及分布式資料庫的底層存儲，如谷歌的GFS可以作為分布式表格系統Google Bigtable 的底層存儲，Amazon的EBS（彈性存儲塊）系統可以作為分布式資料庫（Amazon RDS）的底層存儲

總體上看，分布式文件系統存儲三種類型的數據：Blob對象、定長塊以及大文件

分布式鍵值系統

較簡單的半結構化數據，只提供主鍵的CRUD（創建、讀取、更新、刪除）

典型的有Amazon Dynamo 以及 Taobao Tair

分布式表格系統

較復雜的半結構化數據，不僅支持CRUD，而且支持掃描某個主鍵范圍

以表格為單位組織數據，每個表格包括很多行，通過主鍵標識一行，支持根據主鍵的CRUD功能以及范圍查找功能

典型的有Google Bigtable 以及 Megastore，Microsoft Azure Table Storage，Amazon DynamoDB等

分布式資料庫

存儲結構化數據，一般是由單機關系資料庫擴展而來

典型的包括MySQL資料庫分片集群、Amazon RDS以及Microsoft SQL Azure

分布式緩存服務特徵

與分布式緩存服務特徵相關的內容