1 引言
隨著UPS技術和IT技術的不斷發展,UPS朝著智能化、高頻化、網絡化等方面發展,UPS已成為金融、電信、保險、交通、稅務、證券、能源、制造、軍隊、教育等各行業的必要配置。如何對UPS設備實施統一、便捷、高效管理,實現對最感興趣UPS信息的監視、分析,如何多途徑報警、智能處理異常等,成為電源使用、管理必須面對和解決的問題。
本文對部隊戰術級指揮所多智能化UPS網絡管理問題進行了研究,設計并實現了一種合理、實用、高效的智能UPS網絡監控方案。該方案充分利用閑置的計算機串口資源,減輕了網關系統的工作量,實現了UPS的群組管理能力,具備了一定的事件智能化處理能力。
2戰術級指揮所UPS使用現狀
戰術級指揮所(以下簡稱指揮所)是指部隊師、旅級及其以下機關的指揮所,一般它是綜合戰術網的核心。為保障指揮所設備可靠運行、延長其使用壽命,保證指揮、控制、情報信息的暢通傳輸,所有指揮所均配備了高性能的UPS,這些不問斷電源除了在市電異常時提供電壓穩定、波形純正的電能外,還具有通過自帶電源監控軟件監控自身狀態,記錄、測試、自動設置、遠程遙控等功能。
指揮所一般擁有較多的計算機和通信設備,且大部分集中在一個或幾個作戰方向室(以下簡稱方向室)內,UPS的數量從幾臺到十幾臺,多數不間斷電源具有RS232智能監控接口,少數具備SNMP(簡單網絡管理協議)接口,利用這些接口經過專用通信電纜同服務器、網關等設備相連,將電源與計算機網絡構成一個具有監控功能的網絡供電系統。這樣的設計方案簡單、易于管理,但一個突出缺點是占用了大量本來就比較緊張的服務器或網關資源,對于不同方向室的UPS設備,必須增加SNMP適配器,或者增加服務器、網關等設備。
3 系統的結構與功能
3.1 系統的硬件結構
結合實際情況,本文設計了一套多UPS網絡監控系統,該系統包括UPS、網關、服務器端、監控終端、各戰斗席位、繪圖、投影等設備,如圖1所示,采用基于代理/管理器(A/M)模式的基本結構。UPS與監控終端的連接主要有以下幾種方式:
(1)UPS的RS 232數據線直接連接到監控終端串口設備上;
(2)UPS插人SNMP適配器,以TCP/IP方式接入網絡,實現與監控終端的連接;
(3)UPS的監控線連接到網關設備的串口上,網關作為協議轉換設備,將UPS接入網絡,實現與監控終端的連接;網關可以靈活插入串口擴展卡,提供較多的串口資源,本系統網關設備有9個串口,可實現最多9臺UPS的接入;
(4)將UPS監控線連接到普通計算機(工控機)的串口上,普通計算機作為服務器端,代理UPS完成與監控終端的連接;服務器端主機可以選擇任意一臺距離UPS較近的計算機,本系統使用的工控機每臺只有1個串口,能實現1臺UPS的接入。
本設計方案,將普通計算機(工控機)作為服務器端,充分利用其閑置的串口資源完成串網口協議轉換,實現UPS接入網絡的功能,從而減輕了網關工作負擔,有效降低了系統成本;同時因為UPS分布于各服務器端管理,提高了系統整體穩定性。其中的戰斗、管理席位、繪圖、投影設備等也通過裝入電源響應軟件,實現接收監控終端管控命令,完成電源應急操作的功能,與UPS等設備一起構成一套完整的電源網絡監控系統。
3.2 系統的軟件構成
代理(Agent)服務軟件:安裝在服務器端主機上或嵌入網關服務程序內,主要提供串網口協議轉換功能,一方面將串口獲取的UPS實時數據轉換成IP數據發送給指定網絡端口,另一方面解析監控終端發來的數據信息,生成相應的控制指令傳給串口。
管理器(Manager)軟件:安裝在監控終端,監控終端也可以是網絡上任一指定計算機,實現以下幾種功能:監視UPS數據、設置和控制UPS參數;記錄UPS實時狀態和異常狀態數據;檢測并診斷異常、狀態告警、廣播異常數據;智能決策方案,實現在電源異常時對各計算機設備的應急管控。
電源響應軟件:可以安裝在所有計算機(包括部分智能設備)上,用于響應監控終端軟件發來的命令,執行相應的操作,完成諸如顯示告警窗口、進行語音告警、關閉所有數據庫、正常退出應用程序、關閉計算機系統等功能。
4 各軟件模塊的結構與功能
4.1 服務器端程序設計
服務器端程序王要完成以下幾個功能:通過TCP監聽并建立與監控終端的連接;通過RS 232打開并從串口獲取UPS返回數據,向串口發送UPS設置、控制指令;將串口獲得的數據整理、打包,轉換成網絡數據發送給監控終端;接收監控終端發來的控制、設置命令,解析成相應UPS指令。
為便于監控終端快速找到UPS資源,服務器端對應于串口的網絡端口應設置為固定值9001(本系統中每臺工控機臺只有一個COM口)。當服務器端服務啟動后,程序自動打開并連接串口,同時開啟網絡服務并綁定本地9001端口,使其處于監聽模式,以便使監控終端方便地掃描、定位本機數據源地址。
考慮到串口通訊速度比較慢,為保證狀態數據的完整性,在服務程序必須對串口數據進行緩存,并實時進行數據檢測,當檢測出有回車/換行標志(或超時)時,則將此前數據從緩存中截取出來,作為一個完整的數據行發送給監控終端。
4.2 網關軟件設計
網關的主要功能是進行物理接口的引入和數據協議的轉換。網關在指揮所內完成各種接口的接入和各種協議到IP協議的轉換工作,可以透明或轉換格式地將數據在各種通訊設備上交互。本系統用到網關的串網口轉換功能,該網關為嵌入式操作系統,其協議通過軟件轉換來實現,軟件的基本設計思想同與4.1中服務器端服務過程類似。需要注意的是,網關設備不是服務器,只完成協議轉換功能,對應的網絡端口一般處于客戶端模式,不停地向監控終端發送TCP連接請求,一旦連接成功,便可以實現UPS與監控終端的對話。
本系統使用的網關自帶9個串口,每個串口配對一個固定的網絡端口(端口范圍為9001~9009),并且將網絡端口與監控終端的701~709端口對應連接,以實現UPS接入網絡的功能。
4.3 監控終端軟件設計
監控終端軟件是人機交互的接口,應具有界面友好、使用方便的特點,完成對UPS監控功能,按功能可分為數據源模塊、監視模塊、控制/設置模塊、智能決策模塊四部分。下面就前3個模塊逐一設計,智能決策模塊將在4.4部分具體闡述。
4.3.1 數據源模塊
監控終端數據來源主要由以下幾部分構成:
(1)通過串口與本機直接連接的UPS數據源;
(2)通過SNMP適配器接入網絡,再和本機連接的數據源;
(3)通過網關協議轉換和本機連接的UPS數據源;
(4)通過其他計算機(服務器端)代理和本機連接的UPS數據源。
通過對以上四部分數據源相應端口進行掃描、判斷,可以得到所有數據源的地址,如圖2所示。其中第(1)類數據源地址通過掃描本機活動串口而得到;第(2)、(3)類數據源地址通過判斷本機服務端口(701~709)的連接狀態而得到;第(4)類數據源地址通過掃描網絡上所有IP地址的9001端口活動狀態而得到。
4.3.2 監視模塊
監視模塊主要以表格、圖形、狀態條等方式顯示UPS的實時狀態,如圖3所示為監視模塊的主界面。通過界面用戶可直觀地了解到UPS的運行狀況:左側為用戶最關心的UPS狀態數據表,包括UPS的名稱/編號、實時的輸入電壓、輸出電壓、輸入頻率、輸出頻率、電池溫度、電池容量、電池剩余時間等信息;右側為用戶感興趣的數據實時柱狀圖,可以通過選擇組合框內的具體內容,定制最感興趣的監控變量;下方狀態條則顯示了從數據源獲得的實時數據,更具體地反映了UPS的狀態信息。
4.3.3 控制/設置模塊
控制、設置模塊主要完成對智能UPS的控制和設置功能。比如控制UPS進行自檢、電池校準、電源旁路轉換等功能(如圖4所示),設置電源標識、輸出電壓、輸出頻率、斷電警告、低電量警告、定時自檢等參數(如圖5所示)。
考慮到串口傳輸數據速度慢,對電源的控制/設置又是基于應答式的特點,軟件的控制/設置模塊設計為與“超級終端”工作過程相類似的模型。如圖4所示,通過點擊“獲取當前模式”,可以得到UPS的當前工作模式(上側黑底紅字顯示)和當前模式下可進行的操作(右側文本框內顯示);用戶根據UPS返回的命令及提示說明,在命令文本框(“發送控制命令”按鈕下方的文本框)內輸入相應命令,點擊“發送控制命令”完成對UPS的相應控制和設置;UPS會在右側文本框內返回操作結果,通過此結果決定下一步需要進行的操作;點擊“返回上級模式”可以使UPS控制/設置模式返回上一級目錄。
4.4 智能決策模塊
4.4.1 告警
監控終端不停地對各UPS數據進行解析、參數范圍判斷,一旦發現超壓、超頻、超溫、旁路等非正常情況,就會啟動告警程序,有選擇地進行以下幾種動作:網絡組播消息/數據告警;音箱語音告警;警示燈告警;大屏幕投影狀態條告警。使相關人員能及時了解電源異常,盡早發現隱患,采取應急措施,確保問題盡快解決。
4.4.2 日志
監控終端可以記錄較長時間段的UPS事件日志和數據日志,這些數據為故障診斷、反應歷史狀態提供數據支持。用戶可按時間段,按信號等方式及組合查詢歷史數據,以圖表、表格、曲線等可觀化形式顯示查詢結果,通過對這些數據的全面分析,查找UPS的隱患,追溯UPS發生事故的根源,真正做到設備的“預檢預修”。
4.4.3 處理電源異常
對UPS的處理主要包括以下幾種:
(1)對UPS進行有計劃的測試,適時地運行時間校準,定時開、關機,異常狀態啟動自檢等;
(2)實時監視UPS狀態,對非正常狀態能及時查詢UPS預警信息,作電池矯正試驗、自檢等操作;
(3)對UPS的其他一些常見故障,能夠按預設步驟處理或者按歷史記錄處理等功能。從而達到在無人值守環境下對UPS的最大限度管理,減少不必要的損失。
故障診斷與報告:當UPS發生故障時,監控終端能給出具體參數,及時分析、追蹤引發電源故障的重要原因,必要時給出處理方法。
對相關設備的處理:事先在各計算機上安裝電源響應軟件,當UPS狀態異常時,智能決策模塊根據當前情況,生成一個比較優化的設備處理方案,向網絡上其他計算機發送控制命令,通過電源響應軟件的代理,實現對整個監控系統的統一管控。比如,當智能決策模塊發現市電停止供應時,便生成并啟動電源應急方案,向網絡上其他計算機發送控制命令,關閉耗電量大的非核心設備(如打印機、大屏幕投影儀、繪圖儀等);如果電池電量低于60%,則關閉網絡上大部分非主要戰斗席位;如果電池電量低于30%,則控制電源響應軟件,使其對重要戰斗席位上的數據庫進行保存、正常關閉應用程序、安全退出計算機系統。從而最大限度地保障服務器、路由器等核心設備的運行時間,降低災難事件發生的概率。
4.5 電源響應軟件
電源響應軟件可安裝在網絡上任意一臺計算機,它與監視終端相連接并受其控制,可以進行如下一些動作:顯示告警提示窗口、進行語音報警;自動執行設定的命令文件,適合用戶特殊處理要求;安全關閉數據庫、正常退出應用程序,保證用戶數據安全;正常關閉其他電子設備、安全關閉計算機操作系統,保證設備安全。
5 結語
本文提出了一種結構優化、管理智能、資源節約、容災性強的UPS群組管理方案,實踐驗證了本方案的合理性、便捷性,提高了部隊指揮所電源監控的網絡化、智能化水平,增強了部隊指揮所電源抗事故能力。此方案也具有良好可靠性和通用性,可在其他相關的單位進行推廣,具有很強的推廣應用價值。