在數(shù)據(jù)中心當(dāng)中,我們需要在設(shè)計(jì)、建設(shè)以及維護(hù)等方面投入大量精力--甚至需要比管理數(shù)據(jù)流更為用心。我們還需要對(duì)物理環(huán)境進(jìn)行深入了解。我們需要讓所有設(shè)備運(yùn)作在合理的溫度,也需要保護(hù)設(shè)備免受各種潛在風(fēng)險(xiǎn)的干擾--從未經(jīng)授權(quán)訪(fǎng)問(wèn)到帶寬“爆缸”不一而足。
環(huán)境監(jiān)控是數(shù)據(jù)中心建設(shè)及維護(hù)工作中的重要組成部分,但目前在大部分層面中都沒(méi)有得到足夠的重視。在多數(shù)情況下,設(shè)計(jì)顧問(wèn)可能在拿出一份數(shù)據(jù)中心設(shè)計(jì)方案之后就甩手走人,導(dǎo)致整套基礎(chǔ)設(shè)施雖然擁有消防及冷卻系統(tǒng)卻缺乏必要的遠(yuǎn)程遙測(cè)或者監(jiān)控系統(tǒng)。有的時(shí)候,服務(wù)器的監(jiān)控工作可能要由服務(wù)器管理人員負(fù)責(zé)、網(wǎng)絡(luò)體系的監(jiān)控工作由網(wǎng)絡(luò)管理人員負(fù)責(zé)、存儲(chǔ)機(jī)制由存儲(chǔ)管理員打理,但卻沒(méi)人關(guān)注機(jī)房本身。
對(duì)于剛剛建立起來(lái)的全新數(shù)據(jù)中心來(lái)說(shuō)(或者剛剛完成改造的原有數(shù)據(jù)中心),我們需要處理的第一要?jiǎng)?wù)在于部署遠(yuǎn)程遙測(cè)與環(huán)境監(jiān)控系統(tǒng)--不只局限于單一機(jī)房的個(gè)別區(qū)域,而是整體機(jī)房?jī)?nèi)的多個(gè)區(qū)域。自動(dòng)程控方案及其它類(lèi)似機(jī)制就是此類(lèi)環(huán)境監(jiān)控系統(tǒng)中的常見(jiàn)分布式部署類(lèi)型,而且每一家數(shù)據(jù)中心都應(yīng)該配備這些解決方案。
掌握運(yùn)行溫度
說(shuō)起應(yīng)該監(jiān)控什么、如何實(shí)施監(jiān)控,我個(gè)人的總體思路是:無(wú)論收集多少統(tǒng)計(jì)結(jié)果與數(shù)據(jù)點(diǎn)都不過(guò)分。很顯然,我們需要監(jiān)控溫度,但除了最直觀(guān)的機(jī)架入口之外、機(jī)房的天花板與地板也是監(jiān)控的必要區(qū)域。在理想狀況下,我們應(yīng)該每隔幾個(gè)機(jī)架就在前端設(shè)置一個(gè)溫度傳感器,用于測(cè)量流入硬件的空氣的實(shí)際溫度。
環(huán)境溫度同樣非常重要,如果數(shù)據(jù)中心內(nèi)設(shè)有熱空氣排放通道、我們還需要在這里設(shè)置測(cè)量裝置。除此之外,我們也不能忘記測(cè)量露點(diǎn)溫度、濕度以及氣流,其具體測(cè)試區(qū)域同樣應(yīng)該覆蓋整套基礎(chǔ)設(shè)施。再有,記得為機(jī)架安裝開(kāi)閉傳感器,用于監(jiān)控其何時(shí)被打開(kāi)。
我希望能在機(jī)架附近、空調(diào)機(jī)組附近以及任何潛在水源附近安裝液體感應(yīng)裝置,這類(lèi)出于某些原因而未能獨(dú)立排布的輸水管道很可能發(fā)生滲漏,因此必須通過(guò)感應(yīng)裝置加以監(jiān)控。大家還可以借助拉繩傳感器測(cè)量機(jī)架通道的長(zhǎng)度。這些傳感器構(gòu)造簡(jiǎn)單,能在接觸到地板上的水流時(shí)第一時(shí)間發(fā)出警報(bào)。振動(dòng)及煙霧傳感器這些在他人眼中似乎無(wú)足輕重的裝置也能為我們服務(wù),用以進(jìn)一步提升監(jiān)控效果。
當(dāng)然,攝像頭也是必不可少的。在數(shù)據(jù)中心內(nèi)部,不應(yīng)該存在任何攝像頭無(wú)法覆蓋的死角。將固定位置與旋轉(zhuǎn)-變焦攝像頭組合使用,而且至少要在關(guān)鍵位置使用具備紅外線(xiàn)功能的攝像頭,從而實(shí)現(xiàn)黑暗環(huán)境下的可視需求。
如何處理這些數(shù)據(jù)
有了這么多數(shù)據(jù)收集點(diǎn),我們已經(jīng)對(duì)數(shù)據(jù)中心有了非常深入可視化監(jiān)控基礎(chǔ)--其監(jiān)控范圍涵蓋機(jī)房當(dāng)中的服務(wù)器及其它硬件設(shè)備。這些數(shù)據(jù)應(yīng)該得到良好的維護(hù)、追蹤以及引導(dǎo)。利用SNMP(即簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議)及Cacti等工具、或者由供應(yīng)商提供的方案,大家應(yīng)該能夠在任何時(shí)間調(diào)出任何一個(gè)傳感器的數(shù)據(jù)并加以查看。大家還可以比較幾個(gè)月來(lái)隨著新設(shè)備的增加、環(huán)境溫度是否有所提升,也可以驗(yàn)證特定機(jī)架是否處于開(kāi)啟狀態(tài)。
說(shuō)起警示系統(tǒng),我們需要經(jīng)過(guò)一段時(shí)間的實(shí)際應(yīng)用來(lái)為某些傳感器找到合理的警報(bào)閾值,并通過(guò)電子郵件及文本形式交付警報(bào)消息。對(duì)于高流量數(shù)據(jù)中心來(lái)說(shuō),大家可能不希望每次有人走進(jìn)機(jī)房就收到警示;但在很多低流量數(shù)據(jù)中心內(nèi),這樣的設(shè)定就非常必要。無(wú)論何時(shí),只要傳感器被觸發(fā)、攝像頭應(yīng)該立即開(kāi)始記錄圖片或者視頻,這些圖片及視頻應(yīng)該被發(fā)送到存儲(chǔ)服務(wù)器當(dāng)中--最理想的狀態(tài)是將結(jié)果同步到離線(xiàn)系統(tǒng)當(dāng)中。
確保自己擁有至少一條模擬電話(huà)線(xiàn)路也是個(gè)不錯(cuò)的主意。將這條線(xiàn)路與Linux設(shè)備相對(duì)接,或者采用3G/4G/LTE數(shù)據(jù)連接能夠在緊急狀態(tài)下自動(dòng)啟用并發(fā)揮作用。一旦數(shù)據(jù)傳輸線(xiàn)路無(wú)法連通,這可能會(huì)成為我們檢查數(shù)據(jù)中心的惟一途徑。
如果大家感覺(jué)這樣的處理方式太過(guò)夸張,不妨問(wèn)問(wèn)那些曾經(jīng)在紐約及新澤西的數(shù)據(jù)中心里經(jīng)歷過(guò)颶風(fēng)桑迪的悲催同行們。他們會(huì)揭示這樣的真理:即使這種影響巨大、意料之外的環(huán)境災(zāi)難只發(fā)生一次,也足以證明我們數(shù)據(jù)中心監(jiān)控系統(tǒng)存在的合理性與必要性。我希望大家永遠(yuǎn)不要經(jīng)歷同樣的嚴(yán)峻考驗(yàn),但與此同時(shí),請(qǐng)各位自己不要抱有這樣的僥幸心理。
北京金恒智能系統(tǒng)工程技術(shù)有限責(zé)任公司 版權(quán)所有 Copyright 2007-2020 by Create-china.com.cn Inc. All rights reserved.
法律聲明:未經(jīng)許可,任何模仿本站模板、轉(zhuǎn)載本站內(nèi)容等行為者,本站保留追究其法律責(zé)任的權(quán)利!
電話(huà):86+10-62104277/2248/4249 傳真:86+10-62104193-819 京ICP備10010038號(hào)-2網(wǎng)站XML
智慧機(jī)房
在線(xiàn)體驗(yàn)