美國數(shù)據(jù)中心可以說是將世界上最先進的信息技術(shù)都集成了起來,在數(shù)據(jù)中心里涉及到的包括網(wǎng)絡、計算、布線、存儲、動力、制冷、通風、建筑、消防、監(jiān)控等等十幾個技術(shù)門類,可是覆蓋到數(shù)十項學科的先進技術(shù)的地方。
現(xiàn)在很多的云計算、大數(shù)據(jù)、人工智能、軟件定義也都是在數(shù)據(jù)中心里大放異彩,數(shù)據(jù)中心是這些先進技術(shù)的實踐土壤,都要到數(shù)據(jù)中心來走一遭,只有經(jīng)過數(shù)據(jù)中心考驗的技術(shù)才是真正的技術(shù),能夠得到業(yè)界認可的技術(shù)。
關(guān)于數(shù)據(jù)中心,維基百科給出的定義是“數(shù)據(jù)中心是一整套復雜的設施。它不僅僅包括計算機系統(tǒng)和其它與之配套的設備,還包含冗余的數(shù)據(jù)通信連接、環(huán)境控制設備、監(jiān)控設備以及各種安全裝置”。不過這個定義還不夠全面,幾乎沒有哪個定義能夠?qū)?shù)據(jù)中心概括清楚,因為數(shù)據(jù)中心實在是太復雜了,并非用幾個詞語或者幾句話就能概括清楚。
當然,并不是一開始數(shù)據(jù)中心就很復雜,在最開始我們甚至可以將擁有幾臺PC的機房也可以叫做數(shù)據(jù)中心,但數(shù)據(jù)中心規(guī)模和技術(shù)都發(fā)展太快,復雜性呈幾何性增長,我們討論數(shù)據(jù)中心的復雜性都是基于當前現(xiàn)狀來討論的。
首先,數(shù)據(jù)中心規(guī)模增長迅速,原來占地幾千平米的大型數(shù)據(jù)中心,放到現(xiàn)在也就屬于中小型數(shù)據(jù)中心,現(xiàn)在的數(shù)據(jù)中心動輒10萬臺服務器,要將這些服務器都放滿都得需要足夠的建筑空間,這還不包括網(wǎng)絡、通風和制冷等其它不可缺少的系統(tǒng)。
一旦規(guī)模上來,所有的系統(tǒng)都需要適配,這個復雜不是簡單地累加,而是幾何倍數(shù)的增長。比如建造大樓,建設一座50層的大樓和120層的大樓成本可不是增長兩倍的關(guān)系,假如建設50層大樓,平均下來3000元一平,10萬平米就是3億。120層的話,造價應該是50層樓的10倍,3萬元一平,如果是30萬平方米,那就是90億,整整差了87億。
其次,數(shù)據(jù)中心是一個多功能的建筑物,并不僅僅是一些服務器的集合,要將這些服務器互聯(lián)互通起來,并且讓運行的應用軟件平穩(wěn)運行,需要做大量系統(tǒng)設計工作,每個設備里跑的每一條指令都有其特定的意義。我們知道僅僅以太網(wǎng)的RFC就有八千多篇了,沒有人能將所有網(wǎng)絡協(xié)議都搞懂,但卻要在數(shù)據(jù)中心里部署很多網(wǎng)絡協(xié)議,復雜度可想而知。

登錄到任意一臺網(wǎng)絡設備,都能看出至少上百行的網(wǎng)絡配置,多的有上萬行,這里的每一條配置指令都是為整個數(shù)據(jù)中心運行服務的,不可缺少,任何一個局部微小的操作都可能導致全局業(yè)務受損,為何要建設自動化運行的數(shù)據(jù)中心,其實有一個重要的原因就是靠人的經(jīng)驗去管理數(shù)據(jù)中心已經(jīng)不可能了,只能靠機器自動管理。
第三,新技術(shù)演進太快,云計算也不過才十年之久,就已經(jīng)遍地開花了,大數(shù)據(jù)、人工智能甚至區(qū)塊鏈都來了,這些技術(shù)的寄托都是在海量數(shù)據(jù)上,哪里有海量數(shù)據(jù),就是數(shù)據(jù)中心。
還有5G、移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等等,沒有哪個能離開數(shù)據(jù)中心。數(shù)據(jù)中心真是一專多能,海納百川,無所不能,這些應用都給數(shù)據(jù)中心提出了新的挑戰(zhàn),數(shù)據(jù)中心的基礎設施要能滿足這些應用,只能不斷變化調(diào)整,系統(tǒng)愈發(fā)復雜。
最后,人們對數(shù)據(jù)中心要求越來越高,現(xiàn)在的數(shù)據(jù)中心全年都不能中斷,每中斷一分鐘都會影響業(yè)務,因為很多互聯(lián)網(wǎng)業(yè)務是24小時的都有人訪問,反復多次的故障很容易導致大量用戶流失,最終造成巨大的損失,所以數(shù)據(jù)中心提供持續(xù)無中斷的能力是重中之重,如此必然要在數(shù)據(jù)中心的各個系統(tǒng)中做冗余備份設計。
冗余備份設計給數(shù)據(jù)中心帶來的就是增加復雜性,冗余做的越多,復雜性越高,看似安全,實則危險重重。過于復雜的系統(tǒng)運行起來不僅效率低,甚至在故障出現(xiàn)時,根本無法快速準確定位,所以要在冗余和復雜性之間做取舍,選擇上做好平衡。