? ? ? ? 國家電網(wǎng)某地電力公司是國家電網(wǎng)有限公司的子公司,負責當?shù)仉娋W(wǎng)規(guī)劃、建設、運營和供電服務,下屬多家地市供電企業(yè)和檢修公司、信息通信公司等業(yè)務支撐實施機構。
項目現(xiàn)狀
? ? ? ? 隨著公司信息化建設加速,其信息內(nèi)網(wǎng)中存在大量物理服務器、存儲設備、光纖交換機等設備,缺少監(jiān)控設備細顆粒度部件狀態(tài)的運維工具,無法滿足實際運維需求。
設備類型:存儲設備、服務器、光纖交換機、交換機等
設備品牌:華為、H3C、浪潮、惠普、IBM、中興、聯(lián)想、DELL、曙光、南瑞、神州鯤泰、超聚變、沃趣、長城超云、Brocade、MELLANOX、貝爾、銳捷等
設備數(shù)量:2000+臺
項目期望:
智和信通方案
? ? ? ? 經(jīng)過與用戶一線運維工程師的深入交流,智和信通充分明確了其對監(jiān)控運維平臺的核心需求,并通過對其日常運維工作的分析提供出針對性的解決方案。
海量異構設備統(tǒng)一納管
? ? ? ? 內(nèi)置大量不同類型、不同品牌型號設備監(jiān)控模型,通過多維度監(jiān)控設備,獲取網(wǎng)絡最新運行狀態(tài)。監(jiān)控指標涵蓋在線狀態(tài)、Ping、CPU、內(nèi)存、網(wǎng)絡接口、磁盤、進程、電源、風扇、溫度等各方面。且不同類型和應用場景下的設備具備差異監(jiān)控資源和監(jiān)視指標,在設備統(tǒng)一納管的情況下,實現(xiàn)差異化故障告警。
? ? ? ? 提供設備、資源、設備間連接關系自動化發(fā)現(xiàn)繪制能力,以圖形方式實現(xiàn)設備、資源、鏈路狀態(tài)的直觀展示,為設備部件故障的實時發(fā)現(xiàn)和有效處理提供便利。
靈活可配的設備、資源、監(jiān)視任務模型庫
? ? ? ? 支持自定義配置設備類型、設備資源模型和故障監(jiān)視器、性能監(jiān)視器監(jiān)視任務等模型,實現(xiàn)對電力公司內(nèi)部覆蓋存儲設備、服務器、光纖交換機、交換機等設備類型,華為、H3C、浪潮、惠普、IBM、中興、聯(lián)想、DELL、曙光、南瑞、神州鯤泰、超聚變、沃趣、長城超云、Brocade、MELLANOX、貝爾、銳捷等設備品牌的近200個品牌型號的監(jiān)控支持。
全面監(jiān)控設備性能,感知網(wǎng)絡運行態(tài)勢
? ? ? ? 全面采集網(wǎng)絡內(nèi)存儲、服務器、光纖交換機、交換機等設備的性能信息,按照時間、資源、性能類型等多種維度,圖形、表格等多種形式進行實時性能和歷史性能的展示。并通過智能算法分析歷史數(shù)據(jù),對磁盤容量、交換機端口容量、機房機柜容量進行展示和預測分析,并根據(jù)容量可使用時間進行自定義預警。
多種告警機制,可自定義告警閾值
? ? ? ? 支持多種告警機制,自定義配置告警閾值,從眾多的事件、日志和狀態(tài)信息中分析提煉異常數(shù)據(jù)并轉化為告警。第一時間獲取準確的告警信息,快速標示已執(zhí)行操作的告警,迅速定位告警設備。
智能告警降噪,快速定位故障根因
? ? ? ? 采用自動去重、風暴抑制、關聯(lián)聚合、維護期時間屏蔽、依賴屏蔽等多種智能告警降噪機制,對各類告警進行自動壓縮收斂,減少無效告警,一步定位發(fā)生故障的源頭設備。快速檢索異常問題關聯(lián)涉及的各項維度與影響范圍,快速定位問題邊界,直達故障根因。
多種告警通知途徑結合故障自愈能力,實現(xiàn)快速排障
? ? ? ? 通過故障閾值的設置,在故障真正到來前,提前觸發(fā)通知機制,三級逐步預警。告警發(fā)生中,自動關聯(lián)調取內(nèi)置的故障處置預案,配合告警自愈及自動派單能力,快速實現(xiàn)排障處置;在故障消失后,系統(tǒng)能自動檢測到先前故障,并做自動清除告警處理。
? ? ? ? 提供界面顏色、提示聲、光效閃爍、信息列表、Email、短信、釘釘、企業(yè)微信、個人微信等多種通知渠道。
匹配真實運維場景的自動化巡檢
? ? ? ? 可自定義巡檢策略對設備的運行情況進行統(tǒng)計和報表生成,并可預設時間巡檢策略執(zhí)行時間,進行自動化巡檢,可向指定郵箱發(fā)送巡檢結果報告。通過平臺內(nèi)人工觸發(fā)或定時觸發(fā)的方式,將巡檢工作托管至平臺自動執(zhí)行,解放人力,實現(xiàn)對設備的定期快速檢查。
設備配置文件備份、對比、恢復
? ? ? ? 定期自動對設備策略進行巡檢備份,可在線查看、下載保留或通過本次執(zhí)行結果與上次執(zhí)行結果或基線文件的對比,當配置出現(xiàn)異常時進行自動告警,并可結合故障自愈能力,自動回滾到信任的版本。
全網(wǎng)IT資產(chǎn)統(tǒng)一管理
? ? ? ? 提供網(wǎng)絡內(nèi)IT設備一鍵同步資產(chǎn)數(shù)據(jù)庫的功能,快速同步拓撲內(nèi)的監(jiān)控設備,并對其進行資產(chǎn)生命周期管理。以圖譜的方式呈現(xiàn)資產(chǎn)與其他資產(chǎn)、配品配件、網(wǎng)絡鏈路、使用人等靜態(tài)關聯(lián)關系。
對接I6000系統(tǒng),實時推送告警與設備狀態(tài)數(shù)據(jù)
? ? ? ? 方案實現(xiàn)與I6000系統(tǒng)的對接,將設備的異常告警信息集中存儲,統(tǒng)一分析處理,轉化為I6000可識別的、符合國網(wǎng)要求的標準格式。通過設備信息同步功能,將設備資產(chǎn)、監(jiān)控信息快速同步至I6000,豐富I6000內(nèi)關于設備的性能、告警、基本信息等內(nèi)容。
應用價值
? ? ? ? 通過部署智和信通綜合監(jiān)控運維方案,7*24小時實時監(jiān)控全網(wǎng)設備,獲取IT設備的狀態(tài)信息,真正滿足用戶硬件資源精細化監(jiān)控需求。
? ? ? ? 通過精細化監(jiān)控設備的各項硬件指標,實時了解設備的運行狀態(tài)和負載情況,及時發(fā)現(xiàn)硬件組件可能出現(xiàn)的性能瓶頸和故障,不但為設備配置調整和優(yōu)化提供數(shù)據(jù)支撐,而且提前預警設備可能出現(xiàn)的故障,以便運維人員有充足的時間準備排障操作。同時,在故障出現(xiàn)后快速診斷故障產(chǎn)生的根本原因,提升排障效率,減少因設備故障帶來的業(yè)務中斷和損失。
? ? ? ? 在整體運維工作中通過智和信通綜合監(jiān)控運維方案自動采集、存儲、分析設備狀態(tài)數(shù)據(jù),通過設備遠程控制和自動化編排運維的能力,對設備進行遠程調控和維護,快速提高工作效率的同時,降低IT運維成本,保障電力信息系統(tǒng)穩(wěn)定、高效運行。