㈠ 邊緣緩存影響邊緣計算嗎
影響。邊緣緩存是指使用緩存伺服器來存儲更接近歷橡喊最終用戶的內容,是實現雲計算和邊緣計算協同作用所需的關鍵技術,是影響的。邊緣計算起源於傳媒領域,是指在靠近物或數據源頭的一側,採用網路、計算、存儲、應用核心能力為一體的開放平台,就近提供最肢野近端服務。如顫
㈡ LEAD:大規模wifi系統邊緣緩存部署策略
姓名:胡娟
學號:20021110092
【嵌牛導讀】
為了適應移動設備數量的激增和不斷增長的數據流量需求,大多數企業場所(如企業、機場和校園)都部署了大規模的 WiFi 系統,為用戶提供室內的大范圍覆蓋和高速互聯網體驗。作者在本文中針對一個校園網大型 WiFi 系統進行數據分析和建模,以期最大化系統的長期緩存收益(long-term caching gain),即減少回傳流量(backhaul traffic)的總量。作者首先對收集到的大量用戶網路連接記錄數據進行了深入的統計分析,並提出名為 LEAD 的緩存部署策略(Large-scale wifi Edge cAche Deployment),在該策略中,作者首先將大型 AP 群集到大小合適的邊緣節點中,然後對邊緣級別的流量消耗進行靜態測量,並對流量統計數據行唯亂進行采樣,以便精確地描述未來的流量狀況;作者最後設計了TEG(Traffic-wEighted Greedy)演算法來解決長期緩存收益最大化問題。文章進行了大量以軌跡為驅動的模擬,結果證明了 LEAD 的有效性。
【嵌牛鼻子】
LEAD(Large-scale wifi Edge cAche Deployment),TEG(Traffic-wEighted Greedy)
【嵌牛正文】
大規模WiFi系統邊緣緩存部署策略主要挑戰:
想要在大規模 WiFi 系統中以經濟高效的方式部署邊緣緩存,在以下三個方面非常具有挑戰性。第一,在大規模的 WiFi 系統中部署邊緣緩存要耗費檔檔大量的人力和時間資源,不太可能在每個 AP 上部署邊緣緩存。因此,高效的緩存配置策略非常重要。第二,AP 的部署范圍很廣,在用戶連接記錄和流量消耗方面可能會有明顯的特徵。如何將有限的緩存存儲預算分配給更多的用戶,同時減輕後台的負擔並不是一件輕而易舉的事。一方面,如果將過多的緩存分配給用戶關聯較少的 AP ,則會浪費緩存資源;另一方面,對於那些用戶頻繁連接並消耗密集數據流量的熱門 AP ,為其分配不足的緩存存儲空間可能無法充分釋放邊緣緩存的潛力。第三,由於網路的動態和用戶移動性,接入點的流量消耗是隨時間動態變化的,而緩存部署是靜態的一次性解決方案,因此在不知道未來流量狀況的情況下,很難長期保持最高的緩存收益。
系統描述和問題定義
作者在其所在校園山芹內的 WiFi 系統中進行了大量的數據收集和實驗,該 WiFi 系統由 30925 區域中的 8000 個 AP 組成,可為 40000 多個用戶提供網路連接服務,系統的架構如圖 1 所示。
作者首先提出了一個大規模的 WiFi 緩存增益最大化(Caching Gain Maximization)問題:給定總的緩存存儲預算 C ,如何將它們分配給大型 WiFi 系統中的 AP ,使總時間內減少的總回程流量最大?我們將長期持續時間劃分為 T 個連續的時隙,並假設系統中有 N 個 AP,記為 。另外,對於 ,假設在時隙 t 期間有 個用戶與 AP 建立了連接,表示為。因此,CGM 問題可以表述為:
數據收集和分析
作者持續兩個多月,在 7710 個 AP 中收集了 41119940 條網路連接記錄,覆蓋 36952 個用戶,總數據大小超過 35 GB。通過對數據的深入分析,得出以下結論。
1. 廣泛的流量消耗
圖 2 顯示了 5月8日 - 6月8日以及 6月9日 - 7月9日每個 AP 的平均每日流量消耗,可以看出,兩條曲線非常接近,這意味著每天的流量消耗規律相似,如果緩存初始部署策略設計得當,緩存收益可以長期維持。在兩條曲線中,每日流量消耗的比例在 KB 和 KB 之間占 90%以上,流量消耗大於 KB 的總比例不超過 10%,這意味著如果可以在流量消耗非常大的那幾個 AP 上正確部署緩存,則可以獲得相當可觀的緩存收益。
2. AP 受歡迎程度呈指數型分布
作者在本文中提出 AP 流量加權熵的概念來量化一個 AP 的受歡迎程度。具體來說,在某個時間段內與一個 AP 建立連接的用戶數越多,消耗的流量越多,則流量加權熵越大,代表受歡迎程度越高。圖3展示了兩個月中所有 AP 的流量加權熵,可以看出具有相對較大的流量加權熵值(即非常受歡迎)的 AP 的比例很小。這啟發我們僅在少數具有最大流量加權熵值的 AP 上部署更多的緩存資源,以提供緩存服務,會取得更好的緩存收益。
系統設計
一、 LEAD 策略設計
作者根據上述的數據收集和分析,設計了名為 Clustering Edge Nodes 的聚簇緩存節點策略:根據 AP 的物理位置,將相鄰的 AP 聚集成大小合適的邊緣節點。當建築物較小,例如少於 20 個 AP 時,只需在該建築物中部署一台邊緣緩存伺服器,即可通過將伺服器連接到這些 AP 的 PoE 交換機來覆蓋該建築物中的所有 AP。對於可能具有超過 100 個 AP 的大型建築物,我們將每個樓層劃分為不同的邊緣節點,即同一樓層中的 AP 由於物理上彼此靠近而被聚集成一個邊緣節點,並且適合於應用邊緣節點緩存部署。根據 GPS 定位,作者將分布於校園中 201 座建築物上的 7710 個 AP 劃分到 667 個邊緣節點,並在這些節點上進行邊緣緩存的部署。
二、 TEG 演算法提出
經過作者的數據分析得到兩個主要結論:第一,每個 AP 的流量消耗在很大的范圍內變化,並且 AP 比例在該范圍內平均分布,這表明應根據基礎流量需求對緩存大小進行異構分配;第二,與單個 AP 相比,一組 AP(按物理位置劃分集群)的流量消耗更加穩定,這意味著短期流量統計信息可用於推斷未來的長期流量狀況。
於是作者提出使用短期流量消耗平均值 來近似代替邊緣節點 的未來長期流量消耗期望,於是可將 CGM 問題重寫為:
作者設計了 TEG 演算法,以貪心策略迭代地分配緩存存儲。具體來說,如圖5所示,給定總的緩存存儲預算 ,我們首先分配緩存預算的第一個節點 ,使 處的緩存收益最大,即 ,以此類推,直到沒有緩存預算可用,得到最終緩存分配結果 。TEG 演算法的時間復雜度為 ,考慮到緩存的部署是一次性的解決方案,該復雜度是可以接受的。
作者使用 5月8日至 6月8日的用戶連接數據作為訓練數據集求得 ,將 6月9日至 7月9日的數據作為測試數據集來評估系統性能。作者選取了三種基準策略與本文提出的 LEAD 策略進行對比:Optimal(在已知未來流量消耗下的最優分配策略,這種策略無法實現,僅作為 CGM 問題的上限參考)、Equipartition(系統提供商通常會採用的策略,總緩存預算平均分配給每個邊緣節點)、Demographics(根據用戶密度分配緩存)。作者以緩存收益率(Caching gain ratio,成功緩存的流量與總消耗流量的比值)為指標來衡量以上四種演算法的好壞,結果如圖 6所示,可以看出 LEAD 緩存部署策略遠遠優於 Equipartition 和 Demographics 策略,並已非常接近最優策略,證明了本文策略的有效性。
論文出處:
Lyu F , Ren J , Cheng N , et al. Demystifying Traffic Statistics for Edge Cache Deployment in Large-Scale WiFi System[C]// 2019 IEEE 39th International Conference on Distributed Computing Systems (ICDCS). IEEE, 2019.