作者介紹
熊亞軍,目前在百度負責 IT (網絡、服務器)設備監控平台研發。
主題簡介
本文將主要從以下幾個部分同大家探討:
1.多數據中心的特點及計費模式
2.數據中心的外網流量特點
3.外網流量優化的困難和挑戰
4.如何更充分利用付費帶寬
5.未來展望思考
一、多數據中心的特點及計費模式
背景:隨著互聯網業務的快速發展,大型互聯網公司數據中心的數量和網絡復雜程度也在急速上升。
多數據中心的網絡
和Google 的網絡類似,大型互聯網企業的網絡一般可以分為:
◆數據中心內部網絡(Data Center Networks)
◆WAN網(即Wide Area Networks)
其中, 按照流量的方向,可將WAN網分為兩張骨干網:
◆內網:數據中心之間互聯的網絡(Inter-DC WAN,類似Google B4),用來連接互聯網企業在地理上分布的多個數據中心。
◆外網:面向Internet用戶訪問的網絡(Internet-Facing WAN),用來提供面向用戶的雲服務,如搜索、視頻、下載。
帶寬的計費模式
互聯網企業的外網(Internet-Facing WAN)需要向運營商支付高額的費用。
並且,隨著雲服務的蓬勃發展,Internet用戶數量和流量的急劇增加,網絡容量也從數年前的10G快速增長到1T,10T甚至更大。
在數據中心的成本中,外網的帶寬費用越來越引起關注。其中,常見的外網計費模式有以下幾個:
1.峰值計費:對數據中心出口的帶寬周期(如5分鐘)采樣,按照一個月的最大帶寬采樣值進行計費。大多數數據中心都采用峰值計費的收費模式。
2.95計費:同樣進行周期采樣,去掉最大5%的采樣點,按照剩下的最大帶寬采樣值進行計費。
3.日均峰值計費:同樣進行周期采樣,每天有一個帶寬峰值,按照一個月內每天的帶寬峰值的均值進行計費。
二、數據中心的外網流量特點
一個簡單的峰值計費例子
峰值計費模式下,根據數據中心一個月的出口帶寬峰值進行收費。
如下圖所示,為某互聯網公司數據中心的流量圖,這個數據中心在第一天的夜裡22點到達峰值,依據該點的帶寬峰值進行計費。
很顯然,在非峰值時刻,該數據中心可以(免費的)使用更多流量。
如下圖的綠色部分,我們將數據中心能免費使用的流量稱為該數據中心的空閒帶寬。
在峰值計費的收費模式下,每個數據中心都有可觀的空閒帶寬,而這些帶寬並沒有被充分的利用起來。
特別的,某些特殊的日子會導致非常高的流量峰值,如京東618、雙十一或某部熱門劇集發布。
數據中心在這個月其它時間的帶寬值都遠遠小於流量峰值,存在大量空閒帶寬。
一個日均峰值計費例子
有些數據中心采用日均峰值計費的模式。
和峰值計費類似,日均峰值的數據中心也有大量空閒帶寬沒有被充分利用起來。
如下某互聯網公司數據中心的流量圖中,非當日峰值的時刻,這個數據中心的流量遠小於當日的峰值,也存在非常可觀的空閒帶寬。
三、外網流量優化的困難和挑戰
由於峰值計費的收費模式,每個數據中心經常存在非常可觀的空閒帶寬,我們希望可以充分利用這些免費的空閒帶寬,進而優化外網流量。
然而,面臨以下這些困難和挑戰:
1.面向Internet用戶流量的實時性
從上面的數據中心流量圖可以看到外網流量的波動規律。
例如,一般早上6點左右處於流量的波谷,在晚上到達流量的波峰。
一個直觀的想法是將波峰的流量遷移到波谷,那麼自