數(shù)據(jù)中心正向更大、更復(fù)雜系統(tǒng)方向發(fā)展,擁有上千臺(tái)甚*萬臺(tái)服務(wù)器的數(shù)據(jù)中心比目皆是,如此龐大的信息系統(tǒng)運(yùn)維和管理問題突顯。
論數(shù)據(jù)中心發(fā)展的目標(biāo)
數(shù)據(jù)中心正向更大、更復(fù)雜系統(tǒng)方向發(fā)展,擁有上千臺(tái)甚*萬臺(tái)服務(wù)器的數(shù)據(jù)中心比目皆是,如此龐大的信息系統(tǒng)運(yùn)維和管理問題突顯。數(shù)據(jù)中心要在運(yùn)維和管理上支出相比原來要翻幾倍,給數(shù)據(jù)中心發(fā)展拖了后腿。所以,很多數(shù)據(jù)中心包括it廠商也在這方面暗暗下功夫,解決數(shù)據(jù)中心高速發(fā)展過程中產(chǎn)生的這些新難題。那么,數(shù)據(jù)中心的發(fā)展目標(biāo)是什么,未來的數(shù)據(jù)中心能長成什么樣,很多人做過大膽預(yù)測。筆者認(rèn)為,數(shù)據(jù)中心發(fā)展的目標(biāo)就是要化繁為簡,充分釋放運(yùn)維和管理的壓力,運(yùn)維和管理的成本并不會(huì)隨著規(guī)模的擴(kuò)大而顯著提升,甚至降低,這就是目標(biāo)。
充分釋放數(shù)據(jù)中心的運(yùn)維和管理工作的根本,是將人從數(shù)據(jù)中心運(yùn)行中脫離出來,讓數(shù)據(jù)中心成為一個(gè)真正的自治系統(tǒng),自我運(yùn)行和管理,整個(gè)數(shù)據(jù)中心的運(yùn)行交給機(jī)器或是機(jī)器人,這里不僅僅指運(yùn)行,還包括擴(kuò)容、變更、版本升級(jí)、故障定位和自動(dòng)修復(fù)等等,總之,之前一切由人來做的工作交還給數(shù)據(jù)中心自己,讓其自己運(yùn)行,控制器就是數(shù)據(jù)中心的大腦??刂破骶邆鋸?qiáng)大的業(yè)務(wù)處理能力,可以放在云上,是整個(gè)數(shù)據(jù)中心的高,按照自己的理解去執(zhí)行各種指令,這些命令來自于數(shù)據(jù)中心從方方面面獲取到的需求,要控制器來部署實(shí)現(xiàn),控制器當(dāng)然要根據(jù)數(shù)據(jù)中心的虛擬資源和物理硬件情況綜合評(píng)估來執(zhí)行。這里演化出兩個(gè)發(fā)展趨勢,并且在小規(guī)模的數(shù)據(jù)中心已經(jīng)開始試水應(yīng)用。
一是自動(dòng)化部署。舉一個(gè)比較實(shí)際的例子:數(shù)據(jù)中心在進(jìn)行服務(wù)器部署時(shí),往往上線一批就要數(shù)百上千臺(tái),數(shù)量非常龐大,要通過手工方式對(duì)每一臺(tái)進(jìn)行系統(tǒng)升級(jí)、下發(fā)配置是非常耗時(shí)的,也要消耗很多人力資源。如果將這部分工作改為由控制器自動(dòng)執(zhí)行,那其實(shí)就是將一套配置在數(shù)百上千臺(tái)服務(wù)器上重復(fù)下發(fā),幾分鐘就可以部署完成,這將*提升工作效率,也節(jié)約人力。再有進(jìn)行網(wǎng)絡(luò)變更和擴(kuò)容時(shí),總要增加一堆的操作命令,稍有不慎就會(huì)敲錯(cuò)或配錯(cuò),引起網(wǎng)絡(luò)故障。還有重復(fù)性的配置太多,每個(gè)端口或者接口都要反復(fù)操作下發(fā)。其實(shí),這些工作都可以交給控制器來做,人會(huì)犯錯(cuò),但機(jī)器卻很少犯錯(cuò),只要告訴控制器怎樣做,控制器就可以準(zhǔn)確執(zhí)行到位,而不會(huì)像人總是開小差,偶爾可能還溜出去抽根煙,控制器就不會(huì)。網(wǎng)絡(luò)廠商之前提出了自動(dòng)化部署的概念,并且都已開始支持。比如:思科叫poap(poweron auto provisioning),華為叫ztp(zero-touch provision)零配置敏捷部署技術(shù),新華三叫“zero-configuration零配置管理方案”,這些方案都類似,主要針對(duì)網(wǎng)絡(luò)設(shè)備進(jìn)行自動(dòng)化部署,接入層的網(wǎng)絡(luò)設(shè)備直接將其與上游設(shè)備物理鏈路連接好,控制器自動(dòng)向設(shè)備下發(fā)配置,然后完成業(yè)務(wù)部署。這些網(wǎng)絡(luò)設(shè)備初始化都會(huì)在vlan 1開啟自動(dòng)獲取地址的功能,接入到網(wǎng)絡(luò)中時(shí),自動(dòng)向dhcp服務(wù)器獲取地址。有地址之后,開始與控制器通信,通過控制器下發(fā)已存的版本,然后再將配置下發(fā)到網(wǎng)絡(luò)設(shè)備,完成部署。數(shù)據(jù)中心自然不滿足于此,于是將自動(dòng)化部署擴(kuò)大到服務(wù)器。當(dāng)一臺(tái)新服務(wù)器上線時(shí),同樣也可以通過控制器下發(fā)版本,甚至是預(yù)裝的應(yīng)用程序,后設(shè)置完服務(wù)器的運(yùn)行配置,服務(wù)器可以自動(dòng)上線,加入到業(yè)務(wù)運(yùn)行當(dāng)中。這樣,不管我們是增加或減少網(wǎng)絡(luò)設(shè)備,還是服務(wù)器以及防火墻、負(fù)載均衡等物理設(shè)備,都可以實(shí)現(xiàn)即插即用,業(yè)務(wù)自動(dòng)化部署。將來的數(shù)據(jù)中心只需要兩種人,一種是提供苦力的設(shè)備安裝人員,另一種是控制器的操控者,只要給控制器提前設(shè)置好預(yù)定操作,控制器就可以執(zhí)行。隨著人工智能和大數(shù)據(jù)技術(shù)的火熱,控制器更加智能,也會(huì)有學(xué)習(xí)能力,當(dāng)人們給控制器輸入更多的指令,控制器可以舉一反三,完成更多任務(wù)。
二是業(yè)務(wù)編排。自動(dòng)化部署仍然是數(shù)據(jù)中心發(fā)展的初級(jí)階段,后來關(guān)鍵要實(shí)現(xiàn)的是自動(dòng)的業(yè)務(wù)編排。比如有客戶想從數(shù)據(jù)中心租用一個(gè)web應(yīng)用服務(wù),這就需要數(shù)據(jù)中心內(nèi)部打通管道,從用戶認(rèn)證信息、網(wǎng)絡(luò)設(shè)備的acl、qos資源、vlan資源部署,服務(wù)器虛擬機(jī)資源的分配等多方面進(jìn)行配置,在服務(wù)器上建立虛擬機(jī),分配存儲(chǔ)資源并搭建應(yīng)用,這是一個(gè)涉及多個(gè)門類的專業(yè)技術(shù),以前總是要多業(yè)務(wù)部分,多人協(xié)作討論方案后才能實(shí)施,這個(gè)過程中也可能出錯(cuò)。業(yè)務(wù)編排就是將這些工作在控制器上或者在云上完成,當(dāng)有客戶有這個(gè)需求時(shí),控制器只要一條指令,后臺(tái)立即會(huì)執(zhí)行,幾分鐘內(nèi)即可完成部署。對(duì)服務(wù)的變更、修訂、擴(kuò)展都需要對(duì)服務(wù)涉及的各類基礎(chǔ)架構(gòu)的資源調(diào)整和再配置,這些涉及復(fù)雜的運(yùn)算和繁瑣的配置,所以這部分還是交由專業(yè)廠商來完成,設(shè)備廠商提供好各種應(yīng)用接口,交由控制器來調(diào)用,快方式實(shí)現(xiàn)業(yè)務(wù)自動(dòng)編排部署。
無論是自動(dòng)化部署,還是業(yè)務(wù)編排,目的就是要將人從數(shù)據(jù)中心的運(yùn)維和管理工作中解放出來,數(shù)據(jù)中心發(fā)展的目標(biāo)就是要脫離人類,成為一個(gè)無人參與的自治系統(tǒng),可以自我學(xué)習(xí),自我管理和運(yùn)行。人只要給數(shù)據(jù)中心提需求就可以了,或者是當(dāng)新的需求到來時(shí),由人來教授數(shù)據(jù)中心怎么做,后面重復(fù)性的需求,數(shù)據(jù)中心自己來就可以。當(dāng)然,數(shù)據(jù)中心是一個(gè)非常復(fù)雜和龐大的系統(tǒng),而人們要其實(shí)現(xiàn)的需求也是多種多樣,很多時(shí)候可能走偏。數(shù)據(jù)中心自己運(yùn)行是否正常,是否業(yè)務(wù)按照預(yù)期效果部署,很多時(shí)候還需要人的監(jiān)督,及時(shí)進(jìn)行調(diào)整策略,人的角色不會(huì)被控制器徹底替代。
(原標(biāo)題:論數(shù)據(jù)中心發(fā)展的目標(biāo))