業(yè)務(wù) 可視云 網(wǎng)絡(luò):visibility-as-a- service( vaas )
vaas (visibility-as-a-service,可視即服務(wù))是星融asterfusion為 云網(wǎng)絡(luò) 設(shè)計開發(fā)的業(yè)務(wù)可視 整體解決方案,能夠輕松應(yīng)對、完美滿足云計算時代的運維所面臨的各種挑戰(zhàn)和需求。
構(gòu)建vaas方案的基石是nt(network telemetry,網(wǎng)絡(luò)遙測)技術(shù)。
那么啥是nt技術(shù)呢?
nt技術(shù)為運維人員提供網(wǎng)絡(luò)運行的實時參數(shù)和狀態(tài),并且能夠?qū)⑿枰疃确治龅木W(wǎng)絡(luò)數(shù)據(jù)復(fù)制出來,按照預(yù)先設(shè)置好的策略經(jīng)過智能處理后,交給后端運營分析系統(tǒng)的子系統(tǒng)(運維、安全、審計、回溯、優(yōu)化等)進(jìn)行關(guān)聯(lián)分析和呈現(xiàn)。
vaas 整體架構(gòu)一覽
vaas方案主要由這4部分構(gòu)成:
? int (in-band network telemetry,帶內(nèi)網(wǎng)絡(luò)遙測)
? vnt (virtual network telemetry,虛擬網(wǎng)絡(luò)遙測)
? ont (out-band network telemetry,帶外網(wǎng)絡(luò)遙測)
? afc (asteria fabric controller)
圖2:asterfusion業(yè)務(wù)可視云網(wǎng)絡(luò)整體架構(gòu)
int :基于可編程交換芯片的int方案,在轉(zhuǎn)發(fā)業(yè)務(wù)流量的同時,將網(wǎng)絡(luò)的即時性能、狀態(tài)、參數(shù)收集并記錄下來,在網(wǎng)絡(luò)的出口發(fā)送給運營分析系統(tǒng),用來精準(zhǔn)分析物理網(wǎng)絡(luò)的健康狀況 。
vnt :vnt方案是為運行在計算空間的虛擬網(wǎng)絡(luò) 開發(fā)的流量采集與分析方案,在不影響業(yè)務(wù)系統(tǒng)性能的前提下,虛擬網(wǎng)絡(luò)流量會被vnt采集出來,然后通過隧道發(fā)送給ont方案,用來分析虛擬網(wǎng)絡(luò)的運行狀況;對于那些單租戶,vnt能夠?qū)⑺杉奶摂M網(wǎng)絡(luò)流量直接發(fā)送給后端的運營分析系統(tǒng)。
ont :ont方案將來自于物理網(wǎng)絡(luò)和虛擬網(wǎng)絡(luò) 的采集流量進(jìn)行租戶和業(yè)務(wù)的關(guān)聯(lián)對應(yīng),再按照預(yù)先設(shè)定的策略進(jìn)行智能處理(例如匯聚、分流、負(fù)載均衡、隧道解封裝、業(yè)務(wù)負(fù)載裁剪、元數(shù)據(jù)提取、特征標(biāo)記等),最后將處理后的ont數(shù)據(jù)發(fā)送到后端的運營分析系統(tǒng)進(jìn)行分析。
afc :afc(asteria fabric controller)是vaas的統(tǒng)一管理和調(diào)度平臺,向南通過調(diào)用int、vnt、ont的rest api自動部署、按需調(diào)度、集中管理vaas方案,同時向北為cloud os提供業(yè)務(wù)級的rest api,接受cloud os的統(tǒng)一調(diào)度和自動化管理。
vaas整合了int、vnt和ont三個維度的技術(shù)與方案,即可以運行在星融asterfusion的硬件平臺之上,也可以運行在云計算的虛擬化環(huán)境中。
基于vaas的業(yè)務(wù)可視云網(wǎng)絡(luò)全面解決了云網(wǎng)絡(luò)運維的各種挑戰(zhàn),完美滿足云計算對云網(wǎng)絡(luò)的運營提出的各種新需求。
接下來,讓我們看看vaas方案是怎么解決這些運營需求的。
虛擬網(wǎng)絡(luò)與物理網(wǎng)絡(luò)的綜合運營
在星融asterfusion業(yè)務(wù)可視云網(wǎng)絡(luò)中,不同的組件方案都能完成對虛擬網(wǎng)絡(luò)和物理網(wǎng)絡(luò)的運營分析,并且能夠在同一張ont網(wǎng)絡(luò)上完成虛擬網(wǎng)絡(luò)與物理網(wǎng)絡(luò)分析結(jié)果的關(guān)聯(lián)對應(yīng)。
圖3:虛擬網(wǎng)絡(luò)與物理網(wǎng)絡(luò)的綜合運營
如圖3所示:
vnt方案采集虛擬網(wǎng)絡(luò) 中需要被分析的流量,并進(jìn)行適當(dāng)?shù)奶幚硪越档蛯υ浦袞|西向帶寬的消耗(例如過濾掉不感興趣的流量、將感興趣流量的負(fù)載部分裁剪掉),然后通過隧道發(fā)送到ont網(wǎng)絡(luò)進(jìn)行處理;
ont方案通過分光或者端口鏡像的方式采集物理網(wǎng)絡(luò) 中需要被分析的流量,這些流量也被發(fā)送到ont網(wǎng)絡(luò)進(jìn)行統(tǒng)一處理;
ont網(wǎng)絡(luò)接收到采集完虛擬網(wǎng)絡(luò)和物理網(wǎng)絡(luò)的流量后,提取流量當(dāng)中的特征,完成虛擬網(wǎng)絡(luò)與物理網(wǎng)絡(luò)的流量關(guān)聯(lián),然后將關(guān)聯(lián)后的流量按照預(yù)先設(shè)置的策略進(jìn)行智能處理,后發(fā)往運營分析系統(tǒng);
int方案能夠?qū)⒔粨Q機(jī)在轉(zhuǎn)發(fā)業(yè)務(wù)流量的那一瞬間自身健康狀況數(shù)據(jù)采集出來,并且在業(yè)務(wù)流量離開網(wǎng)絡(luò)進(jìn)入業(yè)務(wù)系統(tǒng)之前,將業(yè)務(wù)流量攜帶的交換機(jī)健康狀況數(shù)據(jù)從中剝離出來 ,發(fā)送給運營分析系統(tǒng);
運營分析系統(tǒng)根據(jù)接收到的ont數(shù)據(jù)和int數(shù)據(jù),對云網(wǎng)絡(luò)整體進(jìn)行綜合運營分析。
我們看到,當(dāng)云網(wǎng)絡(luò)發(fā)生故障時,
星融asterfusion業(yè)務(wù)可視云網(wǎng)絡(luò)以虛擬和物理相結(jié)合的方式 ,幫助云的運營者快速、精準(zhǔn)定位到是哪個租戶的哪個業(yè)務(wù)出了問題,問題來自于虛擬網(wǎng)絡(luò)還是物理網(wǎng)絡(luò),是業(yè)務(wù)流量超越sla、還是物理網(wǎng)絡(luò)自身性能瓶頸所致。
云級網(wǎng)絡(luò) 的整體運營
星融asterfusion業(yè)務(wù)可視云網(wǎng)絡(luò)能夠被部署在云中的任何位置~
圖4:云級網(wǎng)絡(luò)的整體運營
如圖4所示:
當(dāng)云中兩個虛擬計算節(jié)點(兩個藍(lán)色的vm)通信時,在他們之間形成了一條虛擬網(wǎng)絡(luò)路徑(圖中藍(lán)色虛線),vnt方案能夠?qū)⑦@條路徑上的流量采集出來進(jìn)行分析;
當(dāng)這條虛擬網(wǎng)絡(luò)路徑上的流量通過物理網(wǎng)絡(luò)傳送時,在物理網(wǎng)絡(luò)上存在兩條路徑在實際承載虛擬網(wǎng)絡(luò)的流量,即圖中的“物理網(wǎng)絡(luò)路徑-a(紅色)”和“物理網(wǎng)絡(luò)路徑-b(金色)”,這兩條路徑協(xié)同工作,為兩個虛擬計算節(jié)點提供高可靠、高帶寬的通信通道;
在某一瞬間,虛擬網(wǎng)絡(luò)流量使用哪一條物理網(wǎng)絡(luò)路徑,是由那一瞬間物理網(wǎng)絡(luò)設(shè)備的負(fù)載狀況、虛擬網(wǎng)絡(luò)流量的自身特征、物理網(wǎng)絡(luò)上同時承載的其他租戶和業(yè)務(wù)流量的大小等因素共同決定的,并不能提前預(yù)知;
為了對圖中的虛擬網(wǎng)絡(luò)流量做全面的分析,ont方案在物理網(wǎng)絡(luò)的各個節(jié)點上都采集了流量,然后將這些流量智能處理后,發(fā)到后端的運營分析系統(tǒng);
所以,運營分析系統(tǒng)就能夠分別通過vnt和ont獲取全面的虛擬網(wǎng)絡(luò)流量信息和全量的底層物理網(wǎng)絡(luò)流量信息進(jìn)行關(guān)聯(lián)分析。
通過對物理網(wǎng)絡(luò)的全量采集(任意位置、任意流量),再結(jié)合虛擬網(wǎng)絡(luò)采集流量進(jìn)行關(guān)聯(lián)分析后,能夠幫助運營者在網(wǎng)絡(luò)層面構(gòu)建云中業(yè)務(wù)的全景視圖,因此,星融asterfusion業(yè)務(wù)可視云網(wǎng)絡(luò)能夠為用戶提供面向全網(wǎng)的整體運營能力。
面向 云網(wǎng)絡(luò) 健康狀況的精準(zhǔn)運營
int是最近幾年出現(xiàn)的,能夠?qū)W(wǎng)絡(luò)健康狀況進(jìn)行精準(zhǔn)測量和分析的技術(shù),目前已經(jīng)被ietf所接納,正處于被標(biāo)準(zhǔn)化的過程中。int的整體架構(gòu)如下圖所示:
圖5:int的整體架構(gòu)
與傳統(tǒng)的用于觀察網(wǎng)絡(luò)健康狀況的工具及能力(例如snmp)相比,int從根本上改變了觀察網(wǎng)絡(luò)健康狀況的方法 。
int系統(tǒng)一般由運controller軟件系統(tǒng)和支持int能力的網(wǎng)絡(luò)設(shè)備構(gòu)成,controller軟件系統(tǒng)一般包含兩個模塊:策略編排模塊 、分析呈現(xiàn) 。 而網(wǎng)絡(luò)設(shè)備要能夠接收controller下發(fā)的策略,并且采集策略所要求的數(shù)據(jù),最終輸出到controller進(jìn)行分析與呈現(xiàn)。
一般來說,int系統(tǒng)的工作流程大致如下:
controller的策略編排模塊根據(jù)管理員的需求生成對某種業(yè)務(wù)的測量策略,并通過管理通道將生成的策略下發(fā)到業(yè)務(wù)轉(zhuǎn)發(fā)路徑上支持int能力的網(wǎng)絡(luò)設(shè)備上;
網(wǎng)絡(luò)設(shè)備的控制平面接收來自controller的策略,將策略編譯后下發(fā)到轉(zhuǎn)發(fā)芯片中;
工作在轉(zhuǎn)發(fā)平面的轉(zhuǎn)發(fā)芯片根據(jù)來自于控制平面的指令在其所轉(zhuǎn)發(fā)的業(yè)務(wù)流中采集相關(guān)的數(shù)據(jù)(出入接口、收發(fā)時間、隊列長度、緩存狀況等),并將這些數(shù)據(jù)按照指令的要求編碼在業(yè)務(wù)流中向前傳送;
在業(yè)務(wù)流離開網(wǎng)絡(luò)進(jìn)入業(yè)務(wù)系統(tǒng)之前,網(wǎng)絡(luò)設(shè)備將所有的采集數(shù)據(jù)從業(yè)務(wù)流中剝離出來發(fā)往controller的分析呈現(xiàn)模塊,并將復(fù)原的業(yè)務(wù)流繼續(xù)發(fā)送到業(yè)務(wù)系統(tǒng);
controller的分析呈現(xiàn)模塊對所接收到的采集數(shù)據(jù)進(jìn)行分析、呈現(xiàn),描繪業(yè)務(wù)路徑上的網(wǎng)絡(luò)設(shè)備在轉(zhuǎn)發(fā)業(yè)務(wù)流那一時刻的健康狀況。
從工作流程可以看出int具備如下主要特點:
動態(tài)。
按照業(yè)務(wù)與管理的需求對int系統(tǒng)進(jìn)行動態(tài)調(diào)整,能夠隨時對需要重點關(guān)注的業(yè)務(wù)進(jìn)行觀察。
推送。
int系統(tǒng)會在轉(zhuǎn)發(fā)業(yè)務(wù)流量的同時,主動向管理與分析系統(tǒng)推送采集的測量數(shù)據(jù),而不是響應(yīng)管理側(cè)周期性的查詢。
數(shù)據(jù)平面采集。
int系統(tǒng)直接從網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)平面獲取采集數(shù)據(jù),這樣就規(guī)避了傳統(tǒng)模型中采集數(shù)據(jù)由控制平面生成、無法反應(yīng)轉(zhuǎn)發(fā)平面的真實狀況或數(shù)據(jù)。
高精度。
傳統(tǒng)模型中網(wǎng)絡(luò)健康數(shù)據(jù)只能夠反應(yīng)網(wǎng)絡(luò)在查詢時刻的狀況,精度較低,而int采集的各種健康數(shù)據(jù)描述的則是交換機(jī)在真正轉(zhuǎn)發(fā)指定業(yè)務(wù)流量的那一時刻的狀態(tài),精準(zhǔn)度非常高。
多租戶網(wǎng)絡(luò)。
在承載著多租戶、多業(yè)務(wù)的云上,int系統(tǒng)能夠僅僅對某一個租戶的某一種業(yè)務(wù)進(jìn)行轉(zhuǎn)發(fā)過程的數(shù)據(jù)采集,幫助管理員針對租戶/業(yè)務(wù)進(jìn)行網(wǎng)絡(luò)健康狀況的精細(xì)分析。
星融asterfusion基于可編程交換芯片與全開放架構(gòu)開發(fā)的cx系列和nx系列云交換機(jī)全面支持int能力。
圖6:面向云網(wǎng)絡(luò)健康狀況的精準(zhǔn)運營
如圖6所示:
在星融asterfusion業(yè)務(wù)可視云網(wǎng)絡(luò)上,運營分析系統(tǒng)能夠為不同租戶的不同業(yè)務(wù)定義分析策略,然后動態(tài)下發(fā)到由星融asterfusion云交換機(jī)(cx系列 & nx系列)構(gòu)建的云網(wǎng)絡(luò)上去;針對不同的業(yè)務(wù)流,云交換機(jī)在轉(zhuǎn)發(fā)時刻將采集交換機(jī)的各種健康狀況數(shù)據(jù),然后將這些數(shù)據(jù)發(fā)送到運營分析系統(tǒng),由運營分析系統(tǒng)從租戶/業(yè)務(wù)維度完成對云網(wǎng)絡(luò)健康狀況的精準(zhǔn)分析。
對于發(fā)現(xiàn)問題的業(yè)務(wù)流量,運營分析系統(tǒng)能夠通過星融asterfusion云網(wǎng)絡(luò)的sflow能力采樣該業(yè)務(wù)流的部分報文,或通過ont方案獲取該業(yè)務(wù)流的全部報文,進(jìn)一步的深入分析、定位問題。
不影響生產(chǎn)網(wǎng)絡(luò)的高性能運營
星融asterfusion業(yè)務(wù)可視云網(wǎng)絡(luò)的ont方案能夠幫助運營分析系統(tǒng)全量獲取云中的業(yè)務(wù)流量,從而獲得更智能、更全面的業(yè)務(wù)分析數(shù)據(jù)。
ont方案全量獲取業(yè)務(wù)流量卻不會給生產(chǎn)網(wǎng)絡(luò)帶來任何性能的影響,并且在生產(chǎn)網(wǎng)絡(luò)與運營分析系統(tǒng)之間建立起一條不受距離和規(guī)模限制的傳送通道。
一般來說,運營分析系統(tǒng)從生產(chǎn)網(wǎng)絡(luò)獲取業(yè)務(wù)流量的主要方法是端口鏡像。
如下圖所示,當(dāng)需要對流動在生產(chǎn)網(wǎng)絡(luò)中的某一業(yè)務(wù)流量進(jìn)行跟蹤分析時,管理員通常會在該業(yè)務(wù)流量所流經(jīng)的某一臺生產(chǎn)網(wǎng)絡(luò)交換機(jī)上,利用該交換機(jī)的端口鏡像能力,將正常轉(zhuǎn)發(fā)的業(yè)務(wù)流量復(fù)制一份、經(jīng)過鏡像端口發(fā)送給后端的運營分析系統(tǒng)。
圖7:通過交換機(jī)端口鏡像采集數(shù)據(jù)
對于小規(guī)模、業(yè)務(wù)流量較小、業(yè)務(wù)變化不頻繁的場景,端口鏡像的部署方案完全沒有問題。
但是,在云計算的環(huán)境,端口鏡像方案有著顯而易見的缺點 :
對生產(chǎn)網(wǎng)絡(luò)的性能帶來巨大影響。
通常,交換機(jī)開啟端口鏡像后,會對其自身的轉(zhuǎn)發(fā)性能產(chǎn)生很大的影響;在云中因為業(yè)務(wù)路徑的不確定性,需要在業(yè)務(wù)可能路徑的所有交換機(jī)上開啟端口鏡像,才能完成針對業(yè)務(wù)路徑的全量分析;所以,在大規(guī)模的云中使用端口鏡像,將會對生產(chǎn)網(wǎng)絡(luò)的性能帶來巨大的沖擊。
交換機(jī)可支持鏡像的端口十分有限。
一般的,交換機(jī)支持鏡像端口的總數(shù)量 是有限 的(個位數(shù)),對于大規(guī)模部署的云來說,僅交換機(jī)支持的鏡像端口的數(shù)量就已經(jīng)無法滿足全量采集的需求了。
浪費生產(chǎn)網(wǎng)絡(luò)的端口資源。
對于云計算來說,云網(wǎng)絡(luò)最寶貴的資源之一就是其端口資源,在同樣的空間內(nèi),每多一個網(wǎng)絡(luò)端口投入到生產(chǎn)系統(tǒng),就意味著roi(投資回報)的提升和tco的降低,所以,將大量的生產(chǎn)網(wǎng)絡(luò)端口資源當(dāng)作鏡像端口使用實在不是一個明智之舉。
耗時耗力,為生產(chǎn)網(wǎng)絡(luò)的 安全運 維引入風(fēng)險。
因為鏡像對性能的影響,不可能隨時對任何業(yè)務(wù)流量都開啟鏡像功能,但在云中,網(wǎng)絡(luò)承載著數(shù)以十萬計的租戶和業(yè)務(wù)的流量,不同的租戶和業(yè)務(wù)隨時也都有可能產(chǎn)生運營分析的需求,這就意味著管理員要頻繁地變更生產(chǎn)網(wǎng)絡(luò)的配置,費時費力,而且為生產(chǎn)網(wǎng)絡(luò)的安全運維引入了巨大的不可控風(fēng)險。
要求后端運營分析系統(tǒng)服務(wù)器的數(shù)量線性增長。
在鏡像部署場景中,每開啟一個鏡像端口,就意味著后端的運營分析系統(tǒng)要保留一個專門的端口來接收發(fā)送過來的業(yè)務(wù)流量,無論這個端口中實際傳送的流量是端口帶寬的10%還是100%;從今天服務(wù)器的一般配置與處理能力來看,這種端口密度匹配要求,意味著后端運營分析系統(tǒng)的服務(wù)器數(shù)量的線性增長。
為了解決上述問題,星融asterfusion的ont方案采用基于分光器的旁路部署、帶外采集方案,在滿足全量、全網(wǎng)采集的同時,對生產(chǎn)網(wǎng)絡(luò)的性能、運維不帶來任何影響。
圖8:不影響生產(chǎn)網(wǎng)絡(luò)的高性能運營
如圖8所示:
在星融asterfusion ont方案中,與生產(chǎn)網(wǎng)絡(luò)并行地建設(shè)一張ont網(wǎng)絡(luò),然后通過分光器將需要采集分析的生產(chǎn)網(wǎng)絡(luò)的線路旁路接進(jìn)ont網(wǎng)絡(luò),所有通過這條線路傳輸?shù)臉I(yè)務(wù)流量在正常傳送的同時,都會被分光器全量地復(fù)制一份。通過分光線路發(fā)送給ont網(wǎng)絡(luò),經(jīng)過智能處理后進(jìn)入運營分析系統(tǒng)。
相對于鏡像方案的缺點,ont方案的優(yōu)點 也是顯而易見的:
因為分光的過程僅僅是對物理層光信號的復(fù)制與放大,因此對生產(chǎn)網(wǎng)絡(luò)的性能沒有任何影響。
數(shù)據(jù)采集的規(guī)模不受生產(chǎn)網(wǎng)絡(luò)設(shè)備端口數(shù)量的限制,只需在需要分析的線路上部署分光器即可;
生產(chǎn)網(wǎng)絡(luò)的端口可以全部用于生產(chǎn),確保采集全量分析數(shù)據(jù)的同時,生產(chǎn)網(wǎng)絡(luò)的roi不會降低;
所有的變更、操作全部在獨立的ont網(wǎng)絡(luò)上發(fā)生,不會對生產(chǎn)網(wǎng)絡(luò)的運維帶來任何風(fēng)險;
ont網(wǎng)絡(luò)的智能處理能力能夠?qū)纳a(chǎn)網(wǎng)絡(luò)采集到的業(yè)務(wù)流量進(jìn)行智能處理、高效收斂,大幅降低運營分析系統(tǒng)所需服務(wù)器的數(shù)量。
更為值得一提的是,構(gòu)建ont網(wǎng)絡(luò)的星融asterfusion px系列網(wǎng)絡(luò)可視交換機(jī)采用可編程硬件平臺,在單位空間內(nèi)提供超高端口密度和超高處理性能的同時,還提供包括流量匯聚、負(fù)載均衡、流量裁剪、租戶關(guān)聯(lián)等各種智能處理能力,并且能夠根據(jù)網(wǎng)絡(luò)規(guī)模按需任意擴(kuò)展,在生產(chǎn)網(wǎng)絡(luò)和運營分析系統(tǒng)之間建立一個全線速的智能通道。
能夠負(fù)擔(dān)得起的低tco運營
構(gòu)建一個業(yè)務(wù)可視化分析系統(tǒng)對于運營好一張云來說的確是不可或缺的,一般來說,可視化分析系統(tǒng)的架構(gòu)大致如下:
圖9:業(yè)務(wù)可視化分析系統(tǒng)的一般架構(gòu)
從邏輯上來說,業(yè)務(wù)可視化分析系統(tǒng)分為兩層:
? 網(wǎng)絡(luò)流量存儲層
? 業(yè)務(wù)分析呈現(xiàn)層
?網(wǎng)絡(luò)流量存儲層 與業(yè)務(wù)系統(tǒng)的生產(chǎn)網(wǎng)絡(luò)直接連接,接收從生產(chǎn)網(wǎng)絡(luò)鏡像或者分光過來的業(yè)務(wù)流量,完成針對網(wǎng)絡(luò)流量的初級處理之后,將報文及處理產(chǎn)生的元數(shù)據(jù)存儲在本地,供業(yè)務(wù)分析呈現(xiàn)層使用。
該層需要執(zhí)行的動作主要包括:
一對一全量接受網(wǎng)絡(luò)流量
流量過濾,匹配識別流量特征
網(wǎng)絡(luò)流量的編輯
全量儲存過濾后的網(wǎng)絡(luò)流量
解除封裝、終結(jié)隧道、識別協(xié)議
元數(shù)據(jù)的提取與分析
元數(shù)據(jù)的存儲
有一點需要強(qiáng)調(diào)的是,因為架構(gòu)的關(guān)系,同屬于一個業(yè)務(wù)的流量信息有可能存儲在網(wǎng)絡(luò)流量存儲層的任何一臺服務(wù)器上。所以,給業(yè)務(wù)分析呈現(xiàn)層帶來了分析與處理層面的復(fù)雜度。
?業(yè)務(wù)分析呈現(xiàn)層 直接向運營者展示業(yè)務(wù)分析的結(jié)果,它首先從網(wǎng)絡(luò)流量存儲層獲取各種流量報文及其對應(yīng)的元數(shù)據(jù),按照業(yè)務(wù)邏輯對這些流量報文和元數(shù)據(jù)完成重構(gòu)與各種分析后,按照預(yù)定的規(guī)則及分析邏輯將結(jié)果呈現(xiàn)在直接面對運營者的控制面板上。
該層需要執(zhí)行的動作主要包括:
獲取全量元數(shù)據(jù)
完成虛擬網(wǎng)絡(luò)與物理網(wǎng)絡(luò)的關(guān)聯(lián)
完成元數(shù)據(jù)的去重
完成業(yè)務(wù)邏輯的一致性重構(gòu)
分析與呈現(xiàn)
顯而易見的,上述架構(gòu)最大的問題在于:
大量的服務(wù)器在重復(fù)地做著同樣的事情;
服務(wù)器大量地存儲了對于業(yè)務(wù)分析來說無用的數(shù)據(jù);
大量的服務(wù)器在做不擅長的事情;
架構(gòu)沒能解決業(yè)務(wù)邏輯一致性的問題,浪費cpu的計算力來解決;
這些問題導(dǎo)致為云中業(yè)務(wù)構(gòu)建一個可視化分析系統(tǒng)的tco會非常高,除了鏡像/分光的成本以外,還意味著大量的服務(wù)器和存儲系統(tǒng)。
星融asterfusion vaas的ont方案成功的解決了上述問題,讓針對云業(yè)務(wù)進(jìn)行整體運營分析成為可以負(fù)擔(dān)得起的方案。
圖10:被ont優(yōu)化的業(yè)務(wù)可視化分析系統(tǒng)架構(gòu)
星融asterfusion vaas方案在業(yè)務(wù)系統(tǒng)的生產(chǎn)網(wǎng)絡(luò)和可視化分析系統(tǒng)之間構(gòu)建了一個獨立的ont網(wǎng)絡(luò),然后將網(wǎng)絡(luò)流量存儲層和業(yè)務(wù)分析呈現(xiàn)層原先需要服務(wù)器做的工作全部卸載到ont網(wǎng)絡(luò)上 ,由ont網(wǎng)絡(luò)一次性地、高效地、專業(yè)地完成,不再浪費服務(wù)器的計算力 做這些不擅長的事情,而是專注在對業(yè)務(wù)的可視化分析與呈現(xiàn)上。
并且,星融asterfusion的ont網(wǎng)絡(luò)還具備如下特點,可以進(jìn)一步優(yōu)化業(yè)務(wù)可視分析系統(tǒng):
網(wǎng)絡(luò)流量裁剪。 可選的報文截短功能將從生產(chǎn)網(wǎng)絡(luò)接收到的全尺寸報文截短再到指定的長度,去除對于分析系統(tǒng)無意義的負(fù)載部分而只保留報文頭部,在確保業(yè)務(wù)分析邏輯正確的前提下,有效降低后端存儲服務(wù)器接收、處理負(fù)擔(dān),同時大幅降低報文存儲的壓力,提升單臺服務(wù)器的使用效率;需要強(qiáng)調(diào)的是,星融asterfusion vnt也能夠支持網(wǎng)絡(luò)流量裁剪功能。
重復(fù)流量剔除。 星融asterfusion ont網(wǎng)絡(luò)能夠?qū)纳a(chǎn)網(wǎng)絡(luò)的不同分段,接收到的重復(fù)的網(wǎng)絡(luò)流量剔除后,只保留一個拷貝、發(fā)送給后端的報文存儲服務(wù)器,大幅節(jié)省后端報文存儲服務(wù)器的處理時間,降低其存儲壓力,并且為分析與呈現(xiàn)服務(wù)器降低處理重復(fù)數(shù)據(jù)的負(fù)擔(dān),進(jìn)一步提升其處理效率。
業(yè)務(wù)邏輯重構(gòu)。 ont網(wǎng)絡(luò)在轉(zhuǎn)發(fā)從生產(chǎn)網(wǎng)絡(luò)分光過來的流量時,除了完成原先在兩層服務(wù)器上做的工作,同時,還從業(yè)務(wù)邏輯的層面還原、重構(gòu)了同屬于一個業(yè)務(wù)的流量(即同源同宿),確保同屬于一個業(yè)務(wù)的所有數(shù)據(jù)全部輸出到同一臺網(wǎng)絡(luò)流量存儲層的服務(wù)器上,分析呈現(xiàn)層的服務(wù)器只需要從這一臺服務(wù)器上就可以獲得指定業(yè)務(wù)的所有信息,節(jié)省了從所有存儲服務(wù)器讀取數(shù)據(jù)的開銷 和自行完成業(yè)務(wù)邏輯重構(gòu)的開銷 ;
業(yè)務(wù)彈性分布。 對于流量較大、單臺服務(wù)器無法完成分析的業(yè)務(wù),星融asterfuison ont網(wǎng)絡(luò)支持將業(yè)務(wù)按照邏輯分布到由多臺服務(wù)器組成的存儲、分析集群上去,由集群中的多臺服務(wù)器并行地完成對業(yè)務(wù)的存儲、分析和呈現(xiàn),而這種情形,在ont網(wǎng)絡(luò)缺失的情況下,是根本不可能完成的。
不 妥協(xié)性能的靈活性。 構(gòu)建星融asterfuison ont網(wǎng)絡(luò)的asterfusion px系列產(chǎn)品是基于業(yè)界最領(lǐng)先的可編程交換芯片及技術(shù)開發(fā)的,能夠按照業(yè)務(wù)需求將各種功能(協(xié)議識別、隧道終結(jié)、流量裁剪、業(yè)務(wù)重構(gòu)、報文編輯、元數(shù)據(jù)提取等)在芯片內(nèi)部的處理邏輯中通過軟件編程的方式實現(xiàn),在以超強(qiáng)的靈活性確保快速響應(yīng)業(yè)務(wù)需求的同時,又不降低系統(tǒng)的性能。
通過以上架構(gòu)與能力,星融asterfusion為云計算交付的是真正能夠負(fù)擔(dān)得起的低tco運營的方案:
15:1的流量收斂;
單位空間最高6.4t的處理性能;
8倍的端口使用效率提升;
3倍的服務(wù)器效率提升;
更值得一提的是,構(gòu)建星融asterfusion ont網(wǎng)絡(luò)的px系列網(wǎng)絡(luò)可視交換機(jī)與構(gòu)建云物理網(wǎng)絡(luò)的cx系列和nx系列云交換機(jī)基于相同的硬件平臺開發(fā),對于運營來說,相同的硬件平臺則意味著統(tǒng)一庫存、備件管理和靈活的部署選擇,將進(jìn)一步降低運營的綜合成本。