劉細鳳
安科瑞電氣股份有限公司 上海嘉定 201801
摘要:為了維護好數據中心機房動力環境,及時發現隱患和排除故障,降低管理成本控制能耗,提高運維效率,保障數據中心安全、高效、環保、穩定的運行,針對目前機房管理的現狀,建設一套更加直觀高效可視化的機房自動化監控系統是十分必要的。文章基于綜合業務實時監控系統技術架構,設計統一監控、集中管理的監控平臺,將整個機房監控及管理所需要的重要信息進行綜合處理,實現高度統一的界面展示、信息共享、相互協調和聯動功能,減少了管理人員的負擔,實現一體化“監、管、控"。
關鍵詞: 數據中心;機房;動環;監控;可視化
0引言
隨著信息技術的發展和普及,四川省氣象探測數據中心機房里運行的天擎、天鏡、資源池、核心網絡和安全設備,集約化精細化程度越來越高,氣象數據量飛速增加,計算機系統及通信設備數量與日俱增,規模越來越大,中心機房、計算機系統和通信網絡已成為各大單位業務管理的核心部分。為保證其安全正常運行,與之配套的機房動力系統、環境系統、消防系統、保安系統要時時刻刻穩定協調工作。傳統的機房管理往往不能及時排除故障,對事故發生的時間及責任也無科學的管理;更缺乏對已發生的故障作全面的分析數據,使得問題不能得到完善的解決。
本文基于省級綜合業務實時監控系統技術架構,充分研究機房動力環境所亟需的綜合監控需求,設計數據中心機房監控系統。該系統對機房多種設備實現了集中監控,主要包括機房動力系統監控、機房環境系統監控和視頻監控,具有完善的監測和控制功能。通過Web頁面展示,實時記錄各類事件,對故障事件提供及時的告警,有效提高了運維人員的管理效率,能夠快速高效的排除故障,并對已發生的故障做出全面的數據分析,實現了機房可靠的科學管理。
1功能設計
1.1 物理架構
該系統由通信局(站)、區域監控中心、監控中心、用戶終端、上層管理平臺組成,層次分明、結構簡單、邏輯清晰。采用分布式部署,在每一個數據中心分別部署一臺監控主機,
作為該數據中心的前端數據采集器,記錄本地監測數據、操作記錄、告警發送記錄等,并支持控制傳感器。該系統的物理 流程圖如圖1所示。
圖1 機房監控物理結構
1.1.1 通信局(站):由環境監控主機、傳感器、監控模塊等組成,實現對現場環境、動力設備、消防安防等數據采集。現場傳感器通過雙絞線接入到環境監控主機接口上,各種
智能設備通過智能監控模塊將采集到的數據直接接入環境監控主機。
1.1.2 區域監控中心:由區域監控服務器組成(可由監控中心服務器集成服務,分配訪問權限),監管及運維區域內通信局(站),存儲區域內通信局(站)上傳的數據。同時向上級監控中心轉發區域內各通信局(站)的數據。
1.1.3 監控中心:由主監控服務器、備監控服務器、智云中心組成,存儲通信局(站)上傳的數據,系統采用B/S架構,作為數據后臺可支持前端PC設備、客戶端App等多種方式訪問。同時提供接口,可向第三方傳輸數據,便于集成。
1.1.4 用戶終端:客戶端App、PC端瀏覽器等多種方式管理、查詢、控制、運維、信息推送等。可實現各種統計報表、數據分析挖掘、告警管理、運維管理、權限管理和系統配置管理等。
1.1.5 上層管理平臺:通過VPN、公網等方式將環境監測的數據傳輸至第三方兼監管平臺,集中數據大屏展示。系統具有良好的擴容性,對于監控對象的增減,機房增減,系統只需在原有設計的基礎之上增加相應的傳感器和監控模塊,而無須更改整個系統的原始設計,即可把新增的監測內容和監測對象整合到原有系統內。
1.2 技術架構
服務器端擬采用Linux操作系統,客戶端擬采用WindowsXP/Windows7/Windows10等操作系統。
1.2.1 編程語言:擬采用Java、Python編程語言,前端運維門戶網站及管理界面采用J2EE技術架構和Java編程語言進行系統開發,后端的數據采集、數據存儲管理等功能采用探針、Python腳本、爬蟲、Spring JPA等技術進行開發,以滿足系統的數據來源多樣性要求。
1.2.2 數據存儲服務:數據存儲服務程序擬采用Java等編程語言進行開發,采集數據主要通過接口進行讀寫,配置信息擬復用天鏡系統作為數據存儲平臺。
1.2.3 數據通信服務:擬采用Java等編程語言進行開發,數據通信服務程序提供FTP/HTTP/Socket等多種通信接口,以便和多個數據源進行數據交換。
1.2.4 用戶界面:擬采用AJAX+HTML+CSS3、React框架技術進行開發,豐富客戶端功能,支持IE9.0以上、Chrome2.x以上或其他主流瀏覽器。
選用主流工具和成熟的基礎軟件:開發平臺、智能報表工具、在線編輯器、WebGIS、數據庫等主要開發軟件和基礎軟件均選用穩定高效的主流開發工具,如Eclipse 3.3.x、IDEA
2018、Jasper Report、iReport、FCKeditor、HXGIS、Mysql、Restful等。
統計分析程序調用接口采用WebService技術實現,通過應用服務器的負載均衡策略,實現程序調用的高并發響應。如圖2 所示。
圖2 機房監控技術架構
1.3 平臺架構
系統基于全國統一的氣象綜合業務實時監控系統(天鏡)數據庫,對接現有省局機房系統信息,按照天鏡數據庫入庫接口規范,將機房系統的監控數據資源錄入天鏡數據庫,然后通過數據獲取接口獲取已入庫的數據資源。機房動力環境監控平臺架構包括數據支撐層、數據存儲層、技術支撐層、應用層和展示層5個部分,系統組成如圖3所示。
圖3 機房監控平臺架構
數據支撐層實現平臺所需監控數據的采集和處理,包括服務器,數據庫、網絡設備等基礎軟硬件資源,對接核心業務平臺如狀態數據對接CTS、省級綜合業務監控系統。監控數據源主要包括機房設備狀態數據、機房溫濕度數據、UPS監控數據、機房實時視頻監控數據、業務告警數據、火情漏水監控數據等。
數據存儲層通過省級綜合業務監控系統數據接口進行數據讀寫,數據存儲包括狀態數據(如精密空調運行狀態、配電開關運行狀態等)、數據指標數據(如溫濕度實時數據等)、采集任務配數據(如定時任務時間、頻次數據)等。技術支撐層包括數據采集(探針、爬蟲)、對接和web服務(Spring Boot等)、展示(Echarts、D3、React、Nginx、三維可視化組件)等方面所涉及的技術支撐。
應用層包括數據采集分析、機房設備運行狀態監控、機房溫濕度實時監控、配電開關監控、監控信息可視化展示、監控告警等,通過API接口與現有省級綜合業務監控系統對接。
展示層主要包括監控信息的可視化,實現各分系統監控功能展示及可視化視圖展示,告警信息推送給各級業務保障和管理人員。
2 系統功能
系統功能主要包括動力監測,環境監測,系統日志,告警 管理,數據統計,權限管理等模塊。系統首頁如下圖4所示。
圖4 系統首頁展示
2.1 機房動力監測
包括市電監測、配電開關狀態監測、UPS監測。市電監測實現是通過在配電柜中安裝一個電量儀,電量儀連接市電的進線和電流互感器的連接線,然后將電量儀用雙絞線與環境監控主機傳感器接口相連。從而達到監測電壓U、電流I、頻率、功率因素、有功功率、無功功率等參數。配電開關狀態監測實現是通過在配電柜中安裝一個配電開關模塊,配單開關模塊并接
空氣開關的出線和連接電源防雷器輸出的信號,然后將配電開關用雙絞線與環境監控主機傳感器接口相連。從而達到監測市電配電主要空氣開關斷開或閉和狀態,電源防雷器(帶開關量輸出)的狀態。UPS監測實現是通過用數據線或網絡線將UPS直接連接到智能監控模塊上,由智能監控模塊將數據轉發到環境監控主機上,這樣監控主機就可以直接獲取到UPS的各項運行參數、工作狀態、報警信息。從而達到監測UPS整流器、逆變器、電池(電池健康,含電壓電流等數值)、旁路、負載等各部分的運行狀態與參數。
2.2 機房環境監測
包括溫濕度監測、漏水檢測、視頻監測。溫濕度監測實現是通過將溫濕度傳感器布置在需要監測的區域,將采集到的信號傳送到環境監控主機上,在Web頁面上以動態的電子地圖,實時監測處于不同空間位置的溫濕度的真實值。漏水檢測實現是通過在易產生漏水的區域鋪設漏水感應線,將感應線接到漏水控制器上,再將控制器的輸出信號接到環境監控主機。當漏水感應線檢測到有漏水發生時,系統會立即報警。視頻監測能對機房進行實時監視并在Web頁面查看,系統支持視頻多畫面瀏覽、錄像回放、視頻控制管理。
2.3 系統日志
系統日志對自身及主機的操作、運行、訪問、告警均有日志記錄以便追溯問題。自身系統日志記錄包含:操作日志、訪問日志、告警發送日志。主機日志記錄包含:訪問日志、操作日志、事件日志。
2.4 告警管理
當監測項超過設定的上下限值,判定為告警事件,為避免環境監測量處在設定的上下限閾值波動時,系統不斷地重復判斷為報警事件,重復發送報警信息,增加預警狀態,僅當監測量越過上下限值一定的時間才判斷為報警事件,預警時間可設置。告警展示通知告警信息及告警反饋信息流水式展示,在告警臺主頁面實現對嚴重告警信息及反饋信息流水式查看,以時間規律查看嚴重告警生成情況,并通過查看某個時間的告警事件,告警信息能夠自動關聯故障源的配置信息,掌握故障資源的相關管理信息,提升故障處理效率。
2.5 數據查詢
數據統計可選擇查詢的起止時間和查詢的傳感器來查詢該監測點在這段時間內的數據。查詢的內容含有數據采集時間、描述、類型和數據。可對歷史數據做趨勢分析、對比分析,告警數據做告警次數統計、離線次數統計,并可查看更多數據。可選擇起止時間、選擇具體某一個監測對象來進行小時、日、月統計。
3安科瑞動環監控系統介紹設備選型
3.1軟件介紹
通過數據中心動環監控系統,實現了對數據中心的門禁狀態、水浸狀態,煙霧狀態,視頻狀態,環境狀態,高低壓配電狀態,設備運行狀態進行實時監測,并進行實時報警,保障數據中心正常運行,避免運行環境的失控導致配電設備運行故障,保證維護人員安全,延長設備使用壽命,減少配電室粗放式管理導致成本過高。同時實現動環監控并對各用能耗能進行能效分析,幫助用戶實現用能效率的優化。
系統功能
(1)展示當前數據中心總能耗,IT能耗,空調能耗,及其他能耗并且計算出當前數據中心實時PUE值,通過儀表盤形式直觀展示。
(2)選擇查看數據中心的中低壓配電系統主接線圖,并在一次圖顯示配電系統當前遙測、遙信數據和狀態。實時監測各配電柜的電壓、電流等電力參數,變電站的溫濕度、煙感、水浸、門禁等環境情況。
(3)電氣接點溫度實時監測,斷路器觸頭、觸臂、母排和線纜連接等位置安裝無線測溫傳感器監測接點溫度,便于提前發現溫度異常導致的事故。
(4)監測各變壓器各項參數,包括負載率、頻率、功率因數、三相不平衡度等,并且顯示歷時曲線圖,數據實時變化。
(5)電能質量在線監測,可以監測電流和電壓諧波畸變率、電壓暫升暫降暫中斷等暫態事件記錄、ITIC容忍曲線等。
(6)系統采集UPS輸入、輸出端和旁路三相電壓、電流、有功功率、功率因數頻率,同時監測UPS溫度、蓄電池電壓、當前負載下的剩余時間等數據。
(7)展示單體電池電壓、內阻和溫度,預測電池帶載時剩余時間,每節電池數據均可以設置異常報警,及時發現蓄電池異常。
(8)展示精密配電柜內進線和饋線回路電氣參數,包括電流電壓功率電能以及開關狀態,并可以對數據進行報警設置和分級,數據取自精密配電柜測量模塊。
(9)展示智能小母線的始端箱和插接箱電氣參數,包括電流電壓、開關狀態、插接點溫度,并對數據進行報警設置和分級。
(10)通過平面圖顯示數據中心能源分布,設備分布情況,并顯示設備能耗數據,點擊平面圖上設備可以進入具體設備監控界面。
(11)實時顯示當前數據中心PUE值以及歷史PUE曲線。并且顯示各分項用能的用能情況及用能排行。監測各變壓器運行及負載情況,給出本月變壓器輸出電能排行。
(12)顯示電能消耗日/月/年報表,并可對具體回路選擇曲線圖、餅圖進行展示。對數據中心用電數據進行同比、環比分析比較,查看用電趨勢。
(13)監測精密空調的回風溫濕度,出回水溫度,并可以設定精密空調的溫濕度,達到更好的控制效果。
(14)監測數據中心溫濕度、開關門、水浸、煙霧、噪聲、氣體濃度狀態等參數。曲線圖直觀明了,同時支持歷史數據查詢
(15)通過列表顯示各類報警事件數量,通過柱狀圖顯示逐日報警數量,提供報警總數以及增長趨勢。
(16)維管理功能,可針對數據中心各主要設備進行巡檢派工,消缺,搶修等維護工作。
3.2動環監控系統設備選型
名稱 | 圖片 | 型號 | 功能 |
微機綜合保護裝置 | AM6 | 線路/變壓器/母聯等回路保護和測控; 事件記錄和故障錄波功能。 | |
智能操控裝置 | ASD500 | 一次回路動態模擬圖、彈簧儲能指示; 高壓帶電顯示及自檢/閉鎖;驗電核相;斷電告警;柜內照明控制; 自動溫濕度控制/加熱回路故障告警; 遠方就地旋鈕/分合閘旋鈕/儲能旋鈕; 人體感應/語音防誤提示; 斷路器分合次數統計; 預分預合閃光指示; 分合閘回路電壓測量和完好指示; 電氣接點溫度監測。 | |
弧光保護 | ARB5 | 10kV、0.4kV母線室弧光監測; 弧光鏈路實時監測; 弧光保護、故障錄波、事件記錄。 | |
多功能儀表 | APM520 | 具有全電量測量、電能統計、電能質量分析及網絡通訊等功能,可擴展多種功能模塊。通常用于進線回路配電監測。 | |
多功能儀表 | APM510 | 具有全電量測量、電能統計、485通訊。通常用于出線回路配電監測。 | |
中壓備自投裝置 | AM6-B | 實現5個開關的備投控制; 實現進線自投自投、進線互投、母聯自投自復、柴油備投、自適應備投、聯切備投等19種切換方式; 邏輯可編程功能; | |
低壓備自投裝置 | AM6-DB | 實現5個開關的備投控制; 實現進線自投自投、進線互投、母聯自投自復、柴油備投、自適應備投、聯切備投等19種切換方式; 邏輯可編程功能; | |
開關驅動器 | ATE | 無線溫度傳感器,可以通過螺栓、磁吸和扎帶方式固定在探測點。 | |
調光驅動器 | ATC600 | 既可以對負載進行開關控制,還可以輸出0—10V調光信號對具有相應調光接口的燈具進行亮度調節,此外還可實現預設、場景功能。 | |
智能面板 | ARTM-Pn | 可通過區分按鍵短按長按并結合不同參數設置實現開關、調光、場景、數值發送等功能。 | |
觸摸面板 | ATP007 | 可實現開關、調光、場景、數值發送等功能。和我司智能面板功能一致主要用于控制回路較多的區域。 | |
電能質量在線 監測裝置 | APView500 | 支持16路電壓電流采集; 2-63次諧波電壓/電流監測; 0.5-63.5次間諧波電壓/電流監測; 電壓偏差/頻率偏差; 電壓不平衡/電流不平衡監測; 電壓波動與閃變監測; 電壓暫升、電壓暫降、短時中斷監測; *大/*小/平均值/95%概率值統計; 故障錄波與事件記錄存儲功能。 | |
多功能儀表 | APM520 | 具有全電量測量、電能統計、電能質量分析及網絡通訊等功能,可擴展多種功能模塊。通常用于進線回路配電監測。 | |
有源電力濾波器 | AnSin | 一機多能,既可補諧波,又可兼補無功,可對2~51次諧波進行全補償特定次諧波進行補償。 | |
混合動態濾波補償裝置 | AnCos | 線性輸出,無功功率全容性—全感性輸出的同時,可濾除特定次諧波; 具備三相不平衡治理及穩壓功能。 |
4結束語
該研究從頂層設計出發,建立數據中心綜合監控管理平臺,實現機房基礎設施的一體化監控、管理。該系統具備全面的監控管理功能、系統兼容能力、系統擴展能力。設計建設流程化、信息化、自動化、智能化、可視化的數據中心基礎設施監控管理系統。
可以實現機房基礎設施精細化管理,保障機房可用性;實現高度統一的信息共享、相互協調和聯動功能,機房整體監控及管理所需要的重要信息進行綜合處理、集中管理;實現各子系統之間的信息共享和集中的設備監控、報警管理等功能,并通過信息發布系統實現關鍵信息的展示與交互操作。
為機房內各系統及設備運行提供高度穩定可靠的監控信息資源,減少了管理人員的負擔,能夠快速高效的排除故障,并對已發生的故障做出全面的數據分析。
【參考文獻】
【1】楊維發,蔡明,程昌玉.省級地面氣象觀測自動化運行監控平臺設
計與應用[J].信息通信,2020(2):153-155.
【2】周立鶴,陳武.智能控制系統在數據機房中的應用[J].云南電力技
術,2016(12):141.
【3】許柳竣熙,丁洪偉,施偉凡.廣播電視臺總控系統傳輸環網故障監
測研究[J].數字通信世界,2018(10):20-21.
【4】熊安元,趙芳,王穎,等.全國綜合氣象信息共享系統的設計與實現
[J].應用氣象學報,2015,26(4):500-512.
【5】胡文翔,蔡政,郭偉瑋,等.面向RS-485控制網絡的Modbus協議擴
展及應用[J].自動化儀表,2013,34(4):59-61,65.
【6】肖奇良.動力環境監控系統的發展及前景分析[J].計算機光盤軟
件與應用,2012(14):95-96
【7】謝銀海,張常亮,何星庭,田娟.數據中心機房動環監控系統可視化研究[J].
【8】安科瑞企業微電網設計與應用手冊2022.5版.
作者簡介:劉細鳳,女,現任職于安科瑞電氣股份有限公司,主要從事數據中心的設計與應用。