全面監(jiān)控PTN設(shè)備,動態(tài)感知運行態(tài)勢

全面監(jiān)控PTN設(shè)備,動態(tài)感知運行態(tài)勢

? ? ? ? 隨著通信技術(shù)的快速發(fā)展,PTN已已經(jīng)成為絡(luò)架構(gòu)中的重要組成部分。在大規(guī)模PTN網(wǎng)絡(luò)建設(shè)后,面對激增的PTN網(wǎng)絡(luò)規(guī)模和多樣化的承載業(yè)務(wù),運維人員的維護工作量和難度大幅增長,如何進行高效監(jiān)管和維護,正在成為用戶的重要關(guān)注點。

? ? ? ? 北京智和信通PTN設(shè)備管控方案通過對PTN設(shè)備自動檢測、自動報警、自動修復(fù)等功能,實現(xiàn)告警抑制定位、各類故障情況下業(yè)務(wù)快速恢復(fù)、業(yè)務(wù)配置及調(diào)整等多需求場景的響應(yīng)。并將智能數(shù)據(jù)分析和可視化呈現(xiàn)結(jié)合,動態(tài)感知PTN設(shè)備的運行態(tài)勢,通過對PTN設(shè)備的有效監(jiān)控和管理,提升運維效率,保障網(wǎng)絡(luò)穩(wěn)定。

第1章 PTN設(shè)備監(jiān)控指標

? ? ? ? 方案無品牌型號限制,可對各個品牌、型號PTN設(shè)備的統(tǒng)一監(jiān)管,獲取最新運行狀態(tài)。目前,已實現(xiàn)對國內(nèi)外常見PTN設(shè)備品牌,如:華為、中興、烽火、瑞斯康達等,小眾或較為老舊的品牌型號也可通過靈活可配的模型庫進行擴展適配。

1.1.常見監(jiān)控指標

? ? ? ? 內(nèi)置電源、風扇、端口、板卡等多種資源監(jiān)測點和監(jiān)測指標,未覆蓋的資源和指標也可以通過模型庫不斷進行拓展。

設(shè)備類型

資源監(jiān)測點

監(jiān)測指標

PTN設(shè)備

Ping

狀態(tài)、平均響應(yīng)時間、抖動等

設(shè)備運行時間

本次啟動后運行時間等

系統(tǒng)

系統(tǒng)時鐘等

電源

電源狀態(tài)、單板供電電壓、核心電壓等

風扇

風扇狀態(tài)、風扇編號、轉(zhuǎn)速等

溫度

溫度狀態(tài)、當前溫度等

CPU

CPU大小、CPU使用率、CPU空閑、CPU計算資源利用率、CPU協(xié)議通道利用率等

內(nèi)存

內(nèi)存大小、內(nèi)存使用率、空閑內(nèi)存等

網(wǎng)絡(luò)接口

狀態(tài)(up、down)、索引號、名稱、描述、IP地址、子網(wǎng)掩碼、廣播包、數(shù)據(jù)包、包錯誤率、丟包率、過載丟包率、接收/發(fā)送最大帶寬、接收/發(fā)送帶寬使用率、接收/發(fā)送流量、接收/發(fā)送速率、時延、抖動、接收/發(fā)送字節(jié)數(shù)、誤碼率等

光口

狀態(tài)(up、down)、平均接收/發(fā)送光功率、最小過載光功率、傳輸距離、最小消光比、最大帶寬、帶寬使用率、流量、速率、時延、丟包率、過載丟包率、背靠背等

電口

狀態(tài)(up、down)、速率、輸入口衰減、輸入口頻偏等

時鐘性能

處理PTP節(jié)點(邊界時鐘)數(shù)、處理E2E節(jié)點數(shù)、處理P2P節(jié)點數(shù)、經(jīng)過邊界時鐘背靠背的相位精度、經(jīng)過邊界時鐘單節(jié)點輸出頻率精度、輸出相位精度、輸出頻率精度、輸出抖動等

板卡

板卡溫度、單板CPU溫度、單板核心器件溫度等


1.2.品牌型號及指標擴展

? ? ? ? 方案采取用戶自定義擴展PTN設(shè)備品牌、類型及其資源的方式,賦予用戶強大的適配能力,最大可能地實現(xiàn)對不同時期、不同品牌、不同型號PTN設(shè)備的管控。

? ? ? ? 支持自定義PTN設(shè)備類型、PTN設(shè)備資源、故障監(jiān)視器、性能監(jiān)視器、TRAP監(jiān)視器等,提供配置PTN設(shè)備模板的功能,允許用戶自定義PTN設(shè)備真實面板圖。

第2章 PTN設(shè)備實時監(jiān)控

? ? ? ? 方案通過智能算法自動發(fā)現(xiàn)核心、匯聚、接入層PTN設(shè)備以及PTN設(shè)備間、PTN設(shè)備和其他設(shè)備間的鏈路關(guān)系,自動生成網(wǎng)絡(luò)拓撲,實時監(jiān)控各項運行指標,感知網(wǎng)絡(luò)態(tài)勢。

2.1.一鍵式自動發(fā)現(xiàn)

? ? ? ? 在網(wǎng)絡(luò)可達范圍內(nèi),自動獲取網(wǎng)絡(luò)中的PTN設(shè)備及其他設(shè)備的各項信息,識別設(shè)備間的連接關(guān)系。智能識別PTN設(shè)備的廠商、型號、網(wǎng)絡(luò)接口、板卡、CPU、內(nèi)存等資源信息,生成資源邏輯拓撲或PTN設(shè)備面板圖,匹配故障/性能監(jiān)視器,通過可視拓撲動態(tài)展示PTN設(shè)備、鏈路的運行狀態(tài)。

2.2.自動生成網(wǎng)絡(luò)拓撲

? ? ? ? 方案以圖形化方式直觀的組織和呈現(xiàn)被管網(wǎng)絡(luò)內(nèi)的設(shè)備、鏈路和資源,支持樹形結(jié)構(gòu)和平面結(jié)構(gòu)的聯(lián)動展示,也可以按片區(qū)、按地域、按層級等多種布局方式劃分網(wǎng)絡(luò),支持設(shè)備、管道、業(yè)務(wù)多級拓撲展示。

? ? ? ? 在拓撲中以不同顏色圖標展現(xiàn)PTN設(shè)備的設(shè)備故障、鏈路流量、鏈路故障、網(wǎng)絡(luò)接口故障、接口狀態(tài)等實時狀態(tài)信息。


2.3.邏輯展示內(nèi)部資源

? ? ? ? 在拓撲圖的基礎(chǔ)上,進一步展示PTN設(shè)備的細節(jié),可以是其物理組件,也可以是用戶定義的其他監(jiān)控對象。提供資源邏輯拓撲,以圖形方式展示內(nèi)存、CPU、網(wǎng)口、光口、電源等資源信息,對PTN設(shè)備進行細化監(jiān)控,實時告警,對設(shè)備進行事前管理,降低故障發(fā)生率。

2.4.設(shè)備真實面板圖

? ? ? ? 提供PTN設(shè)備真實面板圖,展現(xiàn)網(wǎng)口、板卡、光口、燈、電源、風扇等PTN設(shè)備面板信息,并能直接在操作界面方便的配置和操作機架圖、面板圖。


2.5.可視化鏈路管理

? ? ? ? 智能識別鏈路關(guān)系,支持自動發(fā)現(xiàn)或手動編輯PTN設(shè)備之間、PTN設(shè)備和其他設(shè)備之間的鏈路、運行狀態(tài)、流量性能數(shù)據(jù)。通過直觀的拓撲圖幫助運維人員了解設(shè)備間鏈路環(huán)回、業(yè)務(wù)管道環(huán)回、業(yè)務(wù)管道路徑通告等的實時狀態(tài)、配置情況及設(shè)備運行情況。

? ? ? ? 支持展示上傳流量、下載流量、狀態(tài)、接收/發(fā)送數(shù)據(jù)包量、上傳下載丟包率、包錯誤率、上傳下載帶寬使用率、連通狀態(tài)、管理狀態(tài)信息等。


2.6.多維度性能態(tài)勢感知

? ? ? ? 全面采集業(yè)務(wù)流流量、業(yè)務(wù)量數(shù)量、端口占用、帶寬占用、邏輯管道占用等性能信息,支持按照時間、資源、性能類型等多種維度,圖形、表格等多種形式展示PTN設(shè)備可用性、鏈路可用性、DCN通道可用性等關(guān)鍵性能信息。


? ? ? ? 對實時、歷史性能數(shù)據(jù)進行統(tǒng)計分析,通過曲線圖、柱狀圖或表格等形象化地展示,按天、星期、月查看性能指標變化。也可選擇多個PTN設(shè)備進行同維度性能數(shù)據(jù)分析,提供可視化性能對比視圖。運維人員能隨時把握PTN設(shè)備性能變化態(tài)勢,防患于未然。

2.7.自動化運行狀態(tài)巡檢

? ? ? ? 可自定義巡檢策略,預(yù)設(shè)執(zhí)行時間進行自動化巡檢,巡查PTN設(shè)備實時運行狀態(tài),并向指定郵箱發(fā)送結(jié)果報告,實現(xiàn)對PTN設(shè)備的定期檢查,把握網(wǎng)絡(luò)運行中的易出現(xiàn)問題的環(huán)節(jié),做到預(yù)防為先。可自行選擇要統(tǒng)計的網(wǎng)絡(luò)、PTN設(shè)備、資源、流量、性能、故障類型、監(jiān)視器類型、時間范圍、報表排序規(guī)則、過濾規(guī)則等生成巡檢報表。

第3章 告警與日志管理

? ? ? ? 充分利用積累的有效定障、排障經(jīng)驗,打通基礎(chǔ)設(shè)施監(jiān)控、IP合規(guī)性監(jiān)測、流量透視、自動運維、運維工單等關(guān)聯(lián)數(shù)據(jù),實現(xiàn)從告警檢測到排障恢復(fù)的全生命周期閉環(huán)管理。

3.1.日志與事件管理

? ? ? ? 接收PTN設(shè)備主動發(fā)送如配置失配、系統(tǒng)時鐘丟失、PTP同步丟失、機盤通信終端、機盤故障、直流電壓過高/過低、盤溫過高、鎖定源頻率超過鎖定范圍、倒收、倒換失敗、連接確認信號丟失等事件與日志消息,集中存儲、解析處理后,異常信息及時地通知用戶。通過統(tǒng)一界面集中管理事件與日志,提高其完整性和可追溯性,幫助用戶快速定位問題并采取相應(yīng)的解決措施。

3.2.故障告警管理

? ? ? ? 搭載多種告警機制,自定義配置告警閾值,具備主動的故障監(jiān)控功能,從眾多的事件和狀態(tài)中,系統(tǒng)地將零散的狀態(tài)信息,總結(jié)成為當前狀態(tài),并對異常狀態(tài)進行告警,第一時間獲取準確的告警信息,快速標示已執(zhí)行操作的告警,迅速定位產(chǎn)生告警的PTN設(shè)備,提升告警處理效率,極大降低因PTN設(shè)備故障帶來的損失。


3.3.智能告警降噪

? ? ? ? 告警管理采用自動去重、風暴抑制、關(guān)聯(lián)聚合、維護期時間屏蔽、依賴屏蔽等多種智能告降噪機制,通過AI算法,對各類告警進行自動壓縮收斂,減少90%的無效告警,抑制告警風暴,有效避免誤報和漏報,直達故障根因。

3.4.多途徑告警通知

? ? ? ? 提供界面顏色、提示聲、光效閃爍、信息列表、Email、短信、釘釘、企業(yè)微信、個人微信等多種通知渠道,告警通知無延遲,告警渠道全覆蓋。告警可以向上逐步追溯,按照從全局→網(wǎng)絡(luò)→設(shè)備→資源的管理習慣來組織故障顯示。

3.5.運維知識庫

? ? ? ? 將各類運維操作、故障判斷等經(jīng)驗,轉(zhuǎn)化為存在于平臺內(nèi)的知識,形成團隊知識庫。涵蓋知識的存儲、檢索、更新、維護、審核,將運維工作中所需的運維文檔、操作指南、排障實踐、處置流程和配置信息等進行分類管理,所有成員均可進行知識分享,從而加速問題解決過程,促進團隊間的知識共享和協(xié)作,提升整體運維效率。


第4章 逐層下鉆的流量透視

? ? ? ? 從PTN設(shè)備的設(shè)備層級、接口層級到IP、服務(wù)、應(yīng)用、會話等的實時流量監(jiān)控和歷史流量分析幫助用戶進行流量趨勢分析、網(wǎng)絡(luò)優(yōu)化、網(wǎng)絡(luò)監(jiān)控等工作,并為網(wǎng)絡(luò)規(guī)劃、優(yōu)化調(diào)整和業(yè)務(wù)發(fā)展提供基礎(chǔ)依據(jù)。

4.1.流量、帶寬監(jiān)控

? ? ? ? 提供端到端的流量、帶寬使用監(jiān)控能力,識別帶寬消耗較大的應(yīng)用程序、服務(wù)、協(xié)議或IP地址,監(jiān)控帶寬使用趨勢與帶寬占用分布,并通過圖表展示,快速識別網(wǎng)絡(luò)帶寬濫用,分析高帶寬使用情況,避免網(wǎng)絡(luò)容量過載,并提升最終用戶網(wǎng)絡(luò)體驗。


4.2.流量趨勢分析

? ? ? ? 從設(shè)備、接口、IP、服務(wù)、應(yīng)用、會話等層級出發(fā),提供歷史流量趨勢圖譜,通過應(yīng)用、端口、協(xié)議等對流量進行監(jiān)控和多維度分析,支持按源和目的地進行流量,流量監(jiān)控粒度可達大小、速率、帶寬使用率、包等。

4.3.回溯分析

? ? ? ? 大容量、長時間存儲流量數(shù)據(jù),長期實時保存原始數(shù)據(jù)包。通過高效的數(shù)據(jù)檢索,實現(xiàn)流量數(shù)據(jù)的快速回溯。對已發(fā)生的流量行為進行回溯分析,迅速定位異常流量,對其進行挖掘、分析、取證,實現(xiàn)多維根因追溯,為迅速定位問題發(fā)生原因提供更全面的分析依據(jù),同時為網(wǎng)絡(luò)安全提供強有力的數(shù)據(jù)分析保障。

第5章 遠程控制和編排式配置

? ? ? ? 方案提供PTN設(shè)備遠程控制的能力,將周期性、重復(fù)性、規(guī)律性的大量日常運維工作,如PTN設(shè)備策略配置、故障自愈、自動巡檢等,轉(zhuǎn)化為依托于平臺的自動化執(zhí)行。將不同品牌、不同型號的PTN設(shè)備統(tǒng)一納入控制,集中管理。

5.1.遠程配置執(zhí)行

? ? ? ? 通過深入PTN設(shè)備協(xié)議的控制能力,實現(xiàn)對PTN設(shè)備端口、VLAN、三層IP、Tunnel、PW、VPN、ACL、QOS、路由、STP、保護、OAM等業(yè)務(wù)配置,也可實現(xiàn)管道整形、管道擁塞策略、管道隔離和調(diào)度、通信鏈路選路策略的調(diào)整。

常用遠程配置能力:

  • 用戶可通過平臺下發(fā)預(yù)設(shè)的默認配置給新入網(wǎng)的PTN設(shè)備,實現(xiàn)新入網(wǎng)設(shè)備的一鍵配置同步。
  • 基于路由策略,進行指定管道或跨段的信道、調(diào)整管道或跨段優(yōu)先級、調(diào)整管道或跨段帶寬等業(yè)務(wù)流管道全局、管道或管道某跨段策略調(diào)整。
  • 指定業(yè)務(wù)流的帶寬、服務(wù)保障等級、業(yè)務(wù)接口、業(yè)務(wù)特征碼等QOS參數(shù)調(diào)整。
  • 一鍵調(diào)整設(shè)備間的信道選路策略配置,指定信道優(yōu)先級。
  • 快速進行管道帶寬、擁塞避免策略、調(diào)度策略等負載調(diào)配。


5.2.策略編排──以(配置QoS策略為例)

? ? ? ? 以對PTN設(shè)備進行遠程配置,調(diào)整QoS策略為例。

? ? ? ? 效果要求:為不同業(yè)務(wù)配置不同QoS策略,保障核心業(yè)務(wù)通信質(zhì)量。

? ? ? ? 第一步:將PTN設(shè)備納入平臺進行統(tǒng)一監(jiān)管。

? ? ? ? 第二步,配置PTN設(shè)備策略。主要策略包括:配置信道容量、配置peak burst、配置隊列限制等。配置并應(yīng)用流策略,使QoS策略生效。


? ? ? ? 第三步,查看PTN設(shè)備策略,并與前期策略進行對比。對比基準可以是某一次的備份或?qū)S玫幕€文件,對策略異常變化進行告警。

5.3.配置備份、對比與恢復(fù)

? ? ? ? 支持配置文件批量備份、下載、周期性備份、查看等,對PTN設(shè)備的多個備份文件進行對比。定期自動對PTN設(shè)備配置進行巡檢備份,并可進行對比分析,為用戶管理網(wǎng)絡(luò)做出合理的建議提供數(shù)據(jù)支撐,支持進行已備份配置間的對比分析和針對性的配置恢復(fù)。

5.4.配置合規(guī)性審計

? ? ? ? PTN設(shè)備配置的穩(wěn)定與合規(guī)至關(guān)重要,錯誤或未經(jīng)認證的配置變更都可能導(dǎo)致嚴重的網(wǎng)絡(luò)故障,方案通過本次執(zhí)行結(jié)果與上次執(zhí)行結(jié)果或基線文件的對比,當配置出現(xiàn)異常時進行自動告警,并可結(jié)合故障自愈能力,自動回滾到信任的版本。

第6章 資產(chǎn)CMDB管理

? ? ? ? 通過構(gòu)建PTN設(shè)備資產(chǎn)數(shù)據(jù)庫,將PTN設(shè)備的信息包括資產(chǎn)編號、資產(chǎn)名稱、品牌型號、來源、購買日期、端口數(shù)量、接口類型、負責人等,以及維保到期時間、維保單位等維保信息統(tǒng)一管理。


? ? ? ? 動態(tài)感知納入監(jiān)控的資產(chǎn)運行狀態(tài),并以圖譜的方式呈現(xiàn)資產(chǎn)與其他資產(chǎn)、配品配件、網(wǎng)絡(luò)鏈路、使用人等靜態(tài)關(guān)聯(lián)關(guān)系。每個資產(chǎn)對應(yīng)唯一的二維碼標簽,用戶可通過手機端直接掃碼查看資產(chǎn)信息。

第7章 方案應(yīng)用價值

? ? ? ? 北京智和信通PTN設(shè)備管控方案在實現(xiàn)對PTN設(shè)備跨品牌、跨型號統(tǒng)一管理的基礎(chǔ)上,同時可納管多種網(wǎng)絡(luò)設(shè)備、服務(wù)器、多媒體設(shè)備、衛(wèi)星通訊設(shè)備、無線設(shè)備、微波設(shè)備、安全設(shè)備等,真正實現(xiàn)一個平臺管理全網(wǎng)。此外,針對多廠商設(shè)備間兼容性問題,平臺內(nèi)置了設(shè)備模型庫和無需開發(fā)即可使用的模型庫擴展功能,確保無論設(shè)備來自何種品牌、型號,都能無縫接入管理平臺,實現(xiàn)統(tǒng)一監(jiān)控與配置。

? ? ? ? 通過簡單便捷的操作界面,將用戶關(guān)注的核心信息直觀的呈現(xiàn)給用戶,極大的降低了平臺的上手難度,大幅減少維護工作量。

? ? ? ? 在此基礎(chǔ)上,北京智和信通PTN設(shè)備管控方案更進一步引入了智能化運維分析功能。實時收集并分析各類設(shè)備的運行狀態(tài)數(shù)據(jù),利用大數(shù)據(jù)和AI算法,預(yù)測潛在故障點,提前預(yù)警,實現(xiàn)從被動應(yīng)對到主動預(yù)防的轉(zhuǎn)變。同時,該方案支持自定義告警規(guī)則,滿足不同用戶對于告警信息敏感度的個性化需求,確保關(guān)鍵業(yè)務(wù)系統(tǒng)的穩(wěn)定運行。

? ? ? ? 同時,為了提升應(yīng)急響應(yīng)速度,方案還支持遠程故障診斷與修復(fù)功能。在面對常規(guī)故障時,可通過運維編排自動觸發(fā)自愈流程,實現(xiàn)無人值守的排障處置;而面對非常規(guī)故障時,運維人員也可通過平臺遠程訪問問題設(shè)備,快速定位故障原因,并執(zhí)行遠程修復(fù)操作,極大地縮短了故障恢復(fù)時間,保障了業(yè)務(wù)連續(xù)性。

? ? ? ? 綜上,北京智和信通PTN設(shè)備管控方案以其全面的兼容性、智能化的運維分析、個性化的告警策略以及高效的遠程運維能力,為現(xiàn)代網(wǎng)絡(luò)環(huán)境的運維管理提供了強有力的支持,助力企業(yè)構(gòu)建更加穩(wěn)定、高效、智能的網(wǎng)絡(luò)體系。