內蒙古電力集團某供電公司國產化監(jiān)控運維項目

內蒙古電力集團某供電公司國產化監(jiān)控運維項目

? ? ? ? 供電公司是一家地級市直屬供電企業(yè),隸屬于內蒙古電力(集團)有限責任公司管理,主要負責該地區(qū)的電力供應和電網(wǎng)運維工作。

項目現(xiàn)狀

? ? ? ? 隨著信息化發(fā)展和數(shù)字化轉型,供電公司的業(yè)務運營越來越依賴于信息系統(tǒng)的穩(wěn)定運行,IT網(wǎng)絡作為信息系統(tǒng)的核心支撐,其穩(wěn)定性和安全性直接關系到公司的正常運作。因此,建立一套完善的IT網(wǎng)絡監(jiān)控運維體系,對于保障供電公司業(yè)務的連續(xù)性和高效性具有極其重要的意義。

設備類型:交換機、路由器、服務器、防病毒網(wǎng)關、防火墻等。

設備品牌:華為、華三、思科、深信服、啟明星辰、安恒等

網(wǎng)絡場景:跨地區(qū)多網(wǎng)絡

項目期望

? ? ? ? 隨著網(wǎng)絡環(huán)境的日益復雜化以及業(yè)務需求的持續(xù)增長,現(xiàn)有的監(jiān)控機制已經(jīng)難以充分滿足全面且實時的網(wǎng)絡監(jiān)控需求。因此,運維團隊迫切需要一套綜合運維管理平臺,對各地區(qū)網(wǎng)絡進行統(tǒng)一監(jiān)控和管理,以提高監(jiān)控的全面性和實時性。

  • 對各地區(qū)、分局、營業(yè)廳、各辦公樓層的核心、匯聚、接入交換機、路由器、防火墻等設備統(tǒng)一管理;
  • 自動生成網(wǎng)絡拓撲,支持以可視化方式實時展示設備運行狀態(tài)信息;
  • 實時告警,快速發(fā)現(xiàn)和定位問題,解決因故障響應速度慢、恢復時間長等問題而對業(yè)務造成的影響;
  • 提供知識庫,將故障案例和解決方案記錄其中,方便運維團隊在遇到類似問題時快速查找和參考,縮短故障恢復時間。
  • 具備端到端的流量監(jiān)測分析能力,可以基于netflow/sflow監(jiān)控交換機的流量;
  • 支持資產批量導入導出,可提供不同類型資產的模板,以幫助運維吐納對實現(xiàn)資產快速維護;
  • 可部署在全國產化環(huán)境下,采用國產數(shù)據(jù)庫進行數(shù)據(jù)存儲。

智和信通方案

? ? ? ? 北京智和信通智和網(wǎng)管平臺通過集中監(jiān)控技術,對各地區(qū)、分局、營業(yè)廳、各辦公樓層的核心、匯聚、接入交換機、路由器、防火墻等設備全面納管,無縫連接并統(tǒng)一管理分布于各地的關鍵節(jié)點,以全局視角洞察全網(wǎng)狀態(tài)。

全國產化環(huán)境部署,對接國產海量數(shù)據(jù)庫

? ? ? ? 智和網(wǎng)管平臺采用JAVA和HTML5語言開發(fā),具有優(yōu)秀的可移植性,支持部署在國產操作系統(tǒng)上運行。在本項目中,我們采用了H3C服務器作為硬件平臺,操作系統(tǒng)選用麒麟Linux,處理器芯片為海光。此外,根據(jù)用戶的具體需求,我們將平臺默認的數(shù)據(jù)庫替換為海量Vastbase G100數(shù)據(jù)庫。經(jīng)過測試與驗證,整個系統(tǒng)運行穩(wěn)定可靠。

設備、資源、鏈路自動發(fā)現(xiàn)

? ? ? ? 通過先進的智能自動發(fā)現(xiàn)技術,自動發(fā)現(xiàn)網(wǎng)絡聯(lián)通范圍內,各地區(qū)、分局、營業(yè)廳內的各類設備,識別并記錄設備類型和廠商型號,自動發(fā)現(xiàn)設備內部資源,如:CPU、內存、磁盤、網(wǎng)口、電源、溫度、風扇等。發(fā)現(xiàn)設備之間的連接關系,并自動匹配故障和性能監(jiān)視器。

網(wǎng)絡拓撲自動生成

? ? ? ? 通過自動生成拓撲圖及手動布局的功能,根據(jù)某供電公司的整體網(wǎng)絡架構,規(guī)劃了從核心到分局、營業(yè)廳以及其他職能公司的多級網(wǎng)絡架構。

? ? ? ? 當設備故障、資源異?;蜴溌穯栴}時,通過不同顏色的標識來區(qū)分故障級別,從而協(xié)助運維團隊即時掌握整個網(wǎng)絡的結構狀況以及全網(wǎng)運行狀態(tài),并迅速準確地定位到具體的問題點。


動態(tài)感知網(wǎng)絡性能變化

? ? ? ? 方案采用主動輪詢與日志解析的方式,實時監(jiān)控全網(wǎng)設備。監(jiān)控范圍廣泛,包括但不僅限于CPU使用率、內存使用率、磁盤使用率、網(wǎng)絡接口流量及帶寬等。此外,內置的常規(guī)監(jiān)控指標外,用戶還可以通過模型庫持續(xù)添加其他資源和監(jiān)控指標,以滿足更多樣化的需求。


? ? ? ? 全面處理、深度分析及直觀展示全網(wǎng)設備的實時性能數(shù)據(jù)、歷史運行態(tài)勢以及性能對比分析報告。借助曲線圖、柱狀圖、表格等多種可視化手段,能夠按天、周、月的時間維度清晰展現(xiàn)性能指標的變化趨勢。運維團隊可以即時獲取設備性能的動態(tài)變化信息,進而有效預判并防范可能發(fā)生的潛在問題。

秒級故障預警,實時響應

? ? ? ? 憑借全面的故障監(jiān)測體系和靈活的告警管理策略,平臺能夠對全網(wǎng)絡范圍內的各類設備進行高效的故障監(jiān)控。采取自動檢測異常的模式,實現(xiàn)故障的提前預警和精準定位。無論是設備故障還是性能瓶頸問題,都能即刻通知相關責任人,從而顯著減少故障響應時間。


? ? ? ? 在告警通知途徑上,提供多種渠道,包括界面顏色變化、提示音、燈光閃爍、信息列表展示、電子郵件、短信、釘釘、企業(yè)微信以及個人微信等,確保運維團隊可以第一時間獲取告警信息。

搭建知識庫,賦能運維協(xié)同

? ? ? ? 將各類運維操作及故障判斷等經(jīng)驗進行集中存儲與管理,構建專業(yè)運維知識庫,將每一次高效運維的實踐經(jīng)驗轉化為團隊的智慧結晶,所有成員均可進行知識分享,從而加速問題解決過程,促進團隊間的知識共享和協(xié)作,構建起一個堅實的內部知識支撐體系。

更深層次的流量透視與回溯分析

? ? ? ? 通過sFlow、NetStream 、IPFIX等流量專用協(xié)議,從設備、接口、IP、服務、應用、會話等層級的等多個維度的實時流量監(jiān)控與歷史流量分析,精確識別占用大量帶寬的應用、服務、協(xié)議或特定IP地址,從而有效防止網(wǎng)絡容量過載現(xiàn)象的發(fā)生,更好地洞察流量模式和帶寬使用趨勢,幫助避免無效帶寬占用,進一步優(yōu)化終端用戶的網(wǎng)絡體驗質量。

構建資產CMDB庫,通過全網(wǎng)資產

? ? ? ? 集中管理公司中全部的IT資產,對硬件設備、軟件應用、網(wǎng)絡設備等,進行細致的分類、歸檔和跟蹤。提供詳細的配置項信息和關系圖譜,結合實時監(jiān)控功能,迅速準確地識別并定位問題的根本原因。在此基礎上,進一步實現(xiàn)全面的IT資產生命周期管理,從采購入庫到報廢處理,每一步都記錄在案,確保資產信息的完整性和準確性。

應用價值

? ? ? ? 通過智和信通綜合監(jiān)控運維方案構建全面、高效、智能的綜合監(jiān)控運維體系,實現(xiàn)對供電公司整個網(wǎng)絡環(huán)境的全天候、全方位監(jiān)控,實現(xiàn)對IT基礎設施、應用系統(tǒng)和業(yè)務流程的實時監(jiān)控、預警、分析和優(yōu)化。運維團隊可以即時發(fā)現(xiàn)網(wǎng)絡故障或潛在的安全威脅,并迅速采取措施進行干預,大幅縮短了故障響應時間,減少了因網(wǎng)絡中斷導致的服務損失。

? ? ? ? 通過持續(xù)監(jiān)控和分析網(wǎng)絡資源,供電公司能夠更精確地掌握網(wǎng)絡使用狀況,包括各業(yè)務系統(tǒng)帶寬占用情況及設備性能瓶頸等。這為資源優(yōu)化提供了數(shù)據(jù)支持,例如合理分配帶寬、適時升級硬件設備以及優(yōu)化網(wǎng)絡架構等措施,從而提高了網(wǎng)絡資源的利用率,并確保關鍵業(yè)務的穩(wěn)定運行。

? ? ? ? 智和信通綜合監(jiān)控運維方案為公司的數(shù)字化轉型和服務質量提升奠定堅實基礎。不僅提升了運維管理的智能化水平,還為管理層提供了豐富的數(shù)據(jù)支持,便于做出更加科學、高效的決策。通過持續(xù)優(yōu)化網(wǎng)絡性能,保障電力服務系統(tǒng)的穩(wěn)定性和可靠性,供電公司能夠更好地滿足用戶需求,提升客戶滿意度,推動業(yè)務增長。