網(wǎng)絡(luò)運維 設(shè)備管控

如何實現(xiàn)網(wǎng)絡(luò)安全監(jiān)控運維?

電信運營商綜合網(wǎng)管解決方案

電信運營商綜合網(wǎng)管解決方案
    馬上咨詢

    ? ? ? ? 隨著新一代信息技術(shù)加快普及應(yīng)用,5G、云和人工智能正加速智能社會的到來,三大技術(shù)正在重構(gòu)網(wǎng)絡(luò)。隨著我國5G產(chǎn)業(yè)快速推進(jìn),中國移動、中國聯(lián)通、中國電信加快步伐,全業(yè)務(wù)運營時代已經(jīng)到來。全業(yè)務(wù)運營時代的特點是:網(wǎng)絡(luò)規(guī)模大;業(yè)務(wù)種類將越來越多。越來越多的人開始進(jìn)入信息通信網(wǎng)絡(luò)且使用各種娛樂、商務(wù)、貿(mào)易等信息通信服務(wù),一旦網(wǎng)絡(luò)安全出現(xiàn)問題,必將帶來十分嚴(yán)重的后果。因此,IT運維系統(tǒng)在逐步升級的過程中,除了要支撐多業(yè)務(wù)、融合計費等需求之外,還要提供高等級的安全保障。

    第1章?電信運營商網(wǎng)絡(luò)運維痛點

    ? ? ? ? 5G時代的到來,為運營商帶來了全新的商業(yè)模式,隨著運營商業(yè)務(wù)發(fā)展,業(yè)務(wù)支撐網(wǎng)絡(luò)和業(yè)務(wù)系統(tǒng)越來越復(fù)雜。網(wǎng)絡(luò)線路、網(wǎng)絡(luò)設(shè)備、云資源等基礎(chǔ)設(shè)施的不斷增加,使得整個網(wǎng)絡(luò)結(jié)構(gòu)變得非常龐大而且復(fù)雜;同時隨著業(yè)務(wù)系統(tǒng)的增加,業(yè)務(wù)場景越來越多,業(yè)務(wù)復(fù)雜度越也越來越高。在傳統(tǒng)運維管理手段下,對于多段網(wǎng)絡(luò)、多層架構(gòu)的應(yīng)用,在問題發(fā)生時,分析定位、排障的速度相對較慢。

    具體表現(xiàn)為如下:

    • 各電信運營商網(wǎng)絡(luò)中都存在大量的 IT 基礎(chǔ)架構(gòu)設(shè)施、云、虛擬化等,各種設(shè)備類型和設(shè)備廠家眾多,難以統(tǒng)一管理;
    • 設(shè)備多分布在大大小小很多個機房,運維管理效率低下,且各系統(tǒng)的分散建設(shè),造成重復(fù)建設(shè)、重復(fù)投資,造成資源浪費、能耗無謂增加;
    • 隨著業(yè)務(wù)系統(tǒng)逐步上云,電信運營商對云的監(jiān)控提出更高要求,目前對云環(huán)境、容器環(huán)境的管控覆蓋面及手段尚有不足;
    • 電信運營商網(wǎng)絡(luò)中業(yè)務(wù)系統(tǒng)眾多、網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,其中的網(wǎng)絡(luò)設(shè)備、服務(wù)器、數(shù)據(jù)庫、中間件、分流設(shè)備、交換機、存儲、云、虛擬化、應(yīng)用等發(fā)生問題時定位困難;
    • 分層、多廠家、異構(gòu)等多種場景下,問題診斷和分析的復(fù)雜度高,故障定位和根因分析困難,排障費時費力;
    • 運維監(jiān)控產(chǎn)品能力參差不齊、運維數(shù)據(jù)分散,缺乏數(shù)據(jù)統(tǒng)計和分析,分析問題故障時無法形成有效聯(lián)動;
    • 缺乏對IP地址等網(wǎng)絡(luò)資產(chǎn)生命周期管理;
    • 運維人力外包形式普遍,手工運維+零散工具導(dǎo)致工作量居高不下,缺乏靈活定制和使用的能力,且對運維人員經(jīng)驗依賴較重

    第2章?智和信通電信運營商IT運維方案

    ? ? ? ? 當(dāng)前,電信運營商面臨著5G、虛擬化、物聯(lián)網(wǎng)等技術(shù)沖擊的壓力,為推進(jìn)自身業(yè)務(wù)數(shù)字化,電信運營商建設(shè)了大量的IT系統(tǒng),系統(tǒng)規(guī)模呈幾何級增長,加之虛擬化微服務(wù)架構(gòu)復(fù)雜多變,同時也急需提升效率、優(yōu)化成本。北京智和信通電信運營商IT運維方案,通過對各類網(wǎng)絡(luò)場景下的跨域資源整合、數(shù)據(jù)深度挖掘、異常監(jiān)測、自動化運維等能力,實現(xiàn)電信運營商IT運維從標(biāo)準(zhǔn)化向自動化、智能化、數(shù)字化轉(zhuǎn)型。

    智和信通電信運營商運維平臺功能模型

    2.1.多網(wǎng)融合架構(gòu)可視化

    運營商多采用多網(wǎng)融合架構(gòu),一般來講,運營商網(wǎng)絡(luò)包括省際和省內(nèi)骨干網(wǎng)絡(luò),各省內(nèi)又包含許多城域網(wǎng),城域網(wǎng)下又有許多用戶駐地網(wǎng)通過接入網(wǎng)連接進(jìn)來。網(wǎng)絡(luò)架構(gòu)中軟硬件環(huán)境涉及的技術(shù)復(fù)雜,廠商眾多。北京智和信通通過網(wǎng)絡(luò)架構(gòu)拓?fù)淇梢暬芰?,將網(wǎng)絡(luò)數(shù)據(jù)從離線表格轉(zhuǎn)移至平臺內(nèi),從靜態(tài)的網(wǎng)絡(luò)架構(gòu)數(shù)據(jù)轉(zhuǎn)化為動態(tài)智能拓?fù)?,實現(xiàn)全網(wǎng)設(shè)備、資源、鏈接關(guān)系、IP等實時更新、快速定位。

    多網(wǎng)融合網(wǎng)絡(luò)拓?fù)涫疽鈭D

    2.2.核心網(wǎng)絡(luò)架構(gòu)可視化

    ? ? ? ? 在動態(tài)拓?fù)渖险宫F(xiàn)設(shè)備實時狀態(tài),通過樹形、平面結(jié)構(gòu)聯(lián)動展示設(shè)備間鏈接關(guān)系,按片區(qū)、按地域、按層級等多種布局方式劃分網(wǎng)絡(luò),使用不同顏色、粗細(xì)、圖標(biāo)表示被管對象的狀態(tài)信息,助力運維人員實時了解網(wǎng)絡(luò)架構(gòu)及全網(wǎng)運行狀態(tài),快速感知資源、鏈路、流量等異常信息。

    IP承載網(wǎng)絡(luò)拓?fù)涫疽鈭D

    2.3.基站、機房架構(gòu)可視化

    ? ? ? ? 以2.5D管理視圖對不同品牌、類型、版本的網(wǎng)絡(luò)設(shè)備、安全設(shè)備、存儲、主機、中間件、數(shù)據(jù)庫、虛擬化、應(yīng)用服務(wù)、視頻監(jiān)控、動力設(shè)備、環(huán)境設(shè)備等進(jìn)行統(tǒng)一、全方位、多層次的綜合管理,實時分析資源當(dāng)前性能和運行狀態(tài),直觀反映資源的動態(tài)變化對支撐業(yè)務(wù)的影響。

    2.5D機房監(jiān)控示意圖

    2.4.端到端全鏈路可視化

    從整體維度到局部維度展示電信運營商網(wǎng)絡(luò)內(nèi)設(shè)備鏈路各項指標(biāo),整體可觀測、可告警、可分析、可統(tǒng)計,通過實時監(jiān)控各個端口以及每條線路的通斷情況和性能指標(biāo),結(jié)合專業(yè)的流量監(jiān)控分析能力,對鏈路容量進(jìn)行即時監(jiān)控,并生成流量分析報告,為容量規(guī)劃提供依據(jù)。

    鏈路綜合信息示意圖

    2.5.全網(wǎng)資源監(jiān)控可視化

    ? ? ? ? 本方案實現(xiàn)網(wǎng)絡(luò)設(shè)備信息高頻采集,并結(jié)合智能算法,實現(xiàn)對整體網(wǎng)絡(luò)架構(gòu)、設(shè)備運行狀態(tài)、業(yè)務(wù)可用狀態(tài)的實時信息采集和感知。針對電信運營商網(wǎng)絡(luò)內(nèi)各類設(shè)備、業(yè)務(wù)系統(tǒng)構(gòu)建統(tǒng)一、智能監(jiān)控體系,對業(yè)務(wù)系統(tǒng)、操作系統(tǒng)、基礎(chǔ)設(shè)施、主機存儲、數(shù)據(jù)庫、中間件、虛擬化、云、數(shù)據(jù)中心機房等全方位監(jiān)管。屏蔽廠商、型號差異,掌握電信運營商網(wǎng)絡(luò)整體運行情況和運行效能,能高效、快速、精準(zhǔn)進(jìn)行故障定位診斷。

    設(shè)備資源可視化顯示

    2.6.視頻設(shè)備集中監(jiān)控

    ? ? ? ? 本方案可對不同品牌、不同型號的攝像頭進(jìn)行統(tǒng)一運維,融合網(wǎng)絡(luò)高清、智能分析、多級管控為一體。支持監(jiān)管視頻監(jiān)控體系涉及的視頻前端設(shè)備(攝像頭、卡口、編解碼器)、傳輸設(shè)備(光纖收發(fā)器、EPON 等)、內(nèi)場設(shè)備(網(wǎng)絡(luò)與安全設(shè)備、主機/虛擬機、存儲設(shè)備)、機房動力環(huán)境等統(tǒng)一接入、集中管理。

    視頻監(jiān)控效果示意圖

    2.7.精細(xì)化私有云監(jiān)控

    ? ? ? ? 方案基于對私有云中的系統(tǒng)資源、租戶資源的監(jiān)控,實現(xiàn)云資源的生命周期管理,通過可視化運維編排,進(jìn)行云管理策略預(yù)設(shè)配置、云策略批量/定時執(zhí)行、智能監(jiān)控巡檢。支持多云納管、持續(xù)監(jiān)控,對云的容量進(jìn)行智能化分析,為容量優(yōu)化提供依據(jù)。

    2.8.設(shè)備模型庫監(jiān)管無限制

    ? ? ? ? 方案采取用戶自定義設(shè)備類型及其設(shè)備資源的方式,賦予用戶自定義適配設(shè)備的能力,更大可能地支持對不同設(shè)備類型的支持。通過自定義設(shè)備類型及其設(shè)備資源,更大限度上提高了智和網(wǎng)管平臺的管理范圍,真正實現(xiàn)了對設(shè)備及其資源的化管理,達(dá)到管控萬物的目標(biāo)。


    2.9.實時故障預(yù)警,及時洞察異常信息

    ? ? ? ? 方案通過統(tǒng)一的故障管理平臺,將各個模塊中的監(jiān)控信息統(tǒng)一采集、分析,實現(xiàn)整個電信運營商網(wǎng)絡(luò)中各種事件信息、設(shè)備故障、網(wǎng)絡(luò)異常、流量異常等告警,以智能化手段進(jìn)行標(biāo)準(zhǔn)化的分析、壓縮、并歸關(guān)聯(lián)等,通過多種方式實時傳達(dá)告警信息,保證落實到指定人員進(jìn)行處理,為電信運營商提供主動式的故障解決方案。


    ? ? ? ? 采集電信運營商所有聯(lián)網(wǎng)設(shè)備,如存儲、服務(wù)器、路由器、交換機、防火墻、虛擬化、云、PTN等設(shè)備、資源、應(yīng)用、服務(wù)等狀態(tài)信息,通過對告警機制以及閾值的設(shè)置,即時獲取準(zhǔn)確的告警信息,快速定位告警設(shè)備,提升告警處理效率,降低因設(shè)備故障帶來的損失。

    2.10.人工運維與故障自愈結(jié)合

    ? ? ? ? 將人工運維與故障自愈結(jié)合,無需針對告警進(jìn)行手動處置,只需預(yù)編排告警處理流程,平臺根據(jù)場景自動觸發(fā),實現(xiàn)故障自愈。

    ? ? ? ? 通過實時發(fā)現(xiàn)告警,進(jìn)行預(yù)診斷分析,判斷告警類型和級別,如果是一般告警,平臺進(jìn)行自動恢復(fù),如果是嚴(yán)重復(fù)雜告警則通過告警通知、運維工單等形式通知運維管理人員,進(jìn)行人工處理。同時,將只能有專家處理的各類操作和判斷轉(zhuǎn)化為可存在于平臺內(nèi)的流程,形成可保留可復(fù)用的運維知識。

    2.11.IP地址全生命周期監(jiān)管

    ? ? ? ? 對于電信運營商的網(wǎng)絡(luò)IP資產(chǎn),采取統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn),對整體網(wǎng)絡(luò)中的IP和MAC進(jìn)行梳理和管理,記錄MCA和IP的對應(yīng)關(guān)系、IP使用單位并關(guān)聯(lián)合同附件,IP/合同到期后進(jìn)行提醒。

    IP生命周期管理

    ? ? ? ? 建立健全I(xiàn)P資產(chǎn)臺賬,通過自定義多級資產(chǎn)分類,細(xì)化資產(chǎn)類別,實現(xiàn)資產(chǎn)分類管控,提高資產(chǎn)精細(xì)管理程度。從IP分配、調(diào)用、回收等,每一步操作均實現(xiàn)完整記錄,支持追溯,通過平臺實現(xiàn)IP資產(chǎn)整個生命周期的全流程閉環(huán)管理,使得IP資產(chǎn)每一次生命周期變更,都有流程可依、都有跡可循,從而實現(xiàn)IP監(jiān)管。

    IP變更記錄

    2.11.1.子網(wǎng)及IP地址信息查看

    ? ? ? ? 方案支持端到端規(guī)劃、部署、管理和監(jiān)控IP 地址。通過智能IP掃描能力,定義多層次子網(wǎng),然后掃描其范圍內(nèi)每個IP地址的當(dāng)前狀態(tài),包括IP地址,MAC地址等信息,也可以查看IP段內(nèi)地址使用詳情,便于IP地址分配管理等。


    2.11.2.IP地址分配與使用

    ? ? ? ? 支持通過端口視圖及列表視圖的形式,展示當(dāng)前IP地址的使用情況,可查看某個子網(wǎng)的IP現(xiàn)網(wǎng)詳情信息,如IP、掩碼、主機名、設(shè)備類型、現(xiàn)網(wǎng)MAC、現(xiàn)網(wǎng)接入設(shè)備、現(xiàn)網(wǎng)接入端口、規(guī)劃MAC、規(guī)劃接入設(shè)備、使用人等,可批量分配IP地址。


    2.11.3.IP地址異常追蹤

    ? ? ? ? 方案支持通過追蹤IP地址的歷史關(guān)聯(lián)MAC、接入設(shè)備/端口變更記錄等與規(guī)劃綁定MAC、規(guī)劃接入設(shè)備/端口進(jìn)行對比分析,當(dāng)與規(guī)劃不一致時生成一條異常記錄,從而審核IP/MAC是否正確使用。

    2.11.4.IP-MAC綁定

    ? ? ? ? 對全網(wǎng)MAC和IP進(jìn)行配對綁定,并周期性對MAC-IP進(jìn)行檢測。自動將規(guī)劃表中的IP-MAC設(shè)置為綁定關(guān)系,自動掃描在線終端,當(dāng)MAC-IP的綁定關(guān)系發(fā)生沖突時產(chǎn)生告警,保證入網(wǎng)終端安全可信。

    2.12.全覆蓋IT資源自動巡檢

    ? ? ? ? 傳統(tǒng)的人工巡檢,尤其是應(yīng)用巡檢,缺乏統(tǒng)一的規(guī)范、標(biāo)準(zhǔn),導(dǎo)致巡檢的范圍和深度都存在一定的局限性,并且是基于人工的手工統(tǒng)計,工作效率比較低,同時耗費較大的人力資源。

    ? ? ? ? 本方案依托平臺將以前依賴手工進(jìn)行的日常巡檢轉(zhuǎn)換為自動化、定時執(zhí)行的巡檢策略。制定統(tǒng)一的巡檢指標(biāo)、巡檢方式、巡檢頻度等,保證巡檢標(biāo)準(zhǔn)化、巡檢范圍、巡檢深度;通過設(shè)計巡檢作業(yè)、數(shù)據(jù)采集方式、自動化作業(yè)調(diào)度等實現(xiàn)日常巡檢的自動化,代替手工工作,提高效率的同時,解放管理人員,釋放管理人員更多的精力,使更多的精力處理更重要的事項。

    2.13.業(yè)務(wù)可用性管理

    ? ? ? ? 電信運營商業(yè)務(wù)系統(tǒng)流程從終端用戶側(cè)的柜面、手機APP、官網(wǎng)、CRM系統(tǒng)、在線客服系統(tǒng),到在線計費系統(tǒng),再到后端核心系統(tǒng),每個環(huán)節(jié)互相關(guān)聯(lián)影響。本方案以保障業(yè)務(wù)可用性為基礎(chǔ),通過對承載業(yè)務(wù)的IT基礎(chǔ)設(shè)施構(gòu)建真實的業(yè)務(wù)模型。直觀呈現(xiàn)面向服務(wù)的業(yè)務(wù)系統(tǒng)體系架構(gòu);準(zhǔn)確反映設(shè)備異常對核心業(yè)務(wù)、用戶造成的影響和威脅,快速查明導(dǎo)致業(yè)務(wù)中斷的故障源,幫助運維人員做出及時響應(yīng),保障業(yè)務(wù)連續(xù)性。

    電信運營商業(yè)務(wù)系統(tǒng)示意圖

    2.13.1.業(yè)務(wù)可用性撥測分析

    ? ? ? ? 針對業(yè)務(wù)應(yīng)用性能與用戶體驗進(jìn)行檢測分析,無需安裝插件即可提供開箱即用的主動撥測試業(yè)務(wù)監(jiān)測。直觀、便捷地幫助運維人員對電信運營商內(nèi)辦公系統(tǒng)、支付系統(tǒng)、在線客服系統(tǒng)、在線計費系統(tǒng)、CRM系統(tǒng)、官網(wǎng)、手機APP系統(tǒng)等進(jìn)行監(jiān)控,掌握業(yè)務(wù)的運行狀態(tài)和健康水平,了解業(yè)務(wù)動態(tài)變化趨勢,快速定位故障源,降低運營風(fēng)險。

    電信運營商業(yè)務(wù)看板示意圖

    2.13.2.業(yè)務(wù)依賴關(guān)系可視展示

    ? ? ? ? 方案通過構(gòu)建包含各業(yè)務(wù)整體流程的調(diào)用依賴關(guān)系圖譜,展示業(yè)務(wù)部署中網(wǎng)絡(luò)設(shè)備間多維度關(guān)系拓?fù)?。對從業(yè)務(wù)的前臺受理到真正完成的整個業(yè)務(wù)流程所依賴的業(yè)務(wù)應(yīng)用、服務(wù)器、中間件、數(shù)據(jù)庫、操作系統(tǒng)等進(jìn)行實時監(jiān)控分析,通過可視化的方式呈現(xiàn)業(yè)務(wù)健康狀況,聯(lián)動設(shè)備監(jiān)控,快速定位導(dǎo)致業(yè)務(wù)健康指數(shù)波動的原因,保障核心業(yè)務(wù)流程穩(wěn)定、高效。

    2.14.全網(wǎng)帶寬、流量監(jiān)控與回溯分析

    ? ? ? ? 方案基于海量流量數(shù)據(jù)的存儲挖掘,實現(xiàn)對網(wǎng)絡(luò)流量的偵測分析。通過網(wǎng)絡(luò)流量分析技術(shù),采集、分析、存儲所有網(wǎng)絡(luò)流量,回溯分析數(shù)據(jù)包特征、異常網(wǎng)絡(luò)行為,以多維數(shù)據(jù)分析和深度挖掘為手段,實現(xiàn)數(shù)據(jù)包層面的流量追蹤,發(fā)現(xiàn)潛伏于網(wǎng)絡(luò)中的未知攻擊。


    ? ? ? ? 提供設(shè)備、接口、IP、服務(wù)、應(yīng)用、會話等層級的帶寬監(jiān)控,實時監(jiān)控帶寬使用趨勢與帶寬占用分布,并通過圖表展示,快速識別網(wǎng)絡(luò)帶寬濫用,分析高帶寬使用情況,識別帶寬消耗較大的應(yīng)用程序、服務(wù)、協(xié)議或 IP 地址,避免網(wǎng)絡(luò)容量過載,并提升更終用戶網(wǎng)絡(luò)體驗。

    2.15.無人值守的設(shè)備遠(yuǎn)程配置

    ? ? ? ? 網(wǎng)絡(luò)承載的業(yè)務(wù)經(jīng)常發(fā)生變更,面對業(yè)務(wù)的變更運維工程師往往要對大量設(shè)備進(jìn)行操作,此時如果依靠工程師逐一登錄設(shè)備進(jìn)行命令下發(fā)、策略配置,將產(chǎn)生大量重復(fù)性的工作,不但導(dǎo)致運維效率低下,也不可避免地產(chǎn)生人為配置錯誤。


    ? ? ? ? 通過批量作業(yè)并行處理能力,實現(xiàn)多設(shè)備并發(fā)批處理操作。通過自動化流程,將簡單的設(shè)備控制操作在大批量設(shè)備進(jìn)行執(zhí)行,并對執(zhí)行過程進(jìn)行監(jiān)督,對執(zhí)行結(jié)果進(jìn)行檢查。在安全合規(guī)的前提下,將運維人員從整體的變更流程及變更內(nèi)容的準(zhǔn)備中解脫出來,實現(xiàn)網(wǎng)絡(luò)變更、設(shè)備配置自動化。

    針對不同類型的設(shè)備,支持進(jìn)行各種控制、配置操作。

    • 對服務(wù)器/主機/虛擬化,支持一鍵開關(guān)機、進(jìn)程管理、應(yīng)用管理、容量管理等
    • 對交換機/路由器,支持ACL、QoS、流量策略、端口策略等
    • 對安全設(shè)備,支持防護管理、認(rèn)證管理、NAT管理、VPN管理、內(nèi)容控制等
    • 對數(shù)據(jù)庫/中間件,支持空間管理、池管理、會話管理、連接控制等
    • 對傳輸設(shè)備,支持終端管理、鏈路管理、信號控制、功率配置等
    • 對其他設(shè)備,支持結(jié)合用戶實際場景,通過拖拽流程的方式實現(xiàn)自定義管控策略

    ? ? ? ? 支持不同廠商,如Cisco、HP、Nortel、Juniper、3Com、D-link、Foundry、Dell、Proxim、NetScreen、華為、H3C、銳捷、中興等多家廠商的網(wǎng)絡(luò)設(shè)備。

    2.16.全場景自動化運維

    ? ? ? ? 方案將電信運營商網(wǎng)絡(luò)運維中涉及的服務(wù)、命令、操作、執(zhí)行組件化、策略化,將需要進(jìn)行的運維服務(wù)、操作等以組件、策略的形式托管至平臺中進(jìn)行維護和管理,通過簡單靈活地編排能力,使用者可以選擇業(yè)務(wù)場景所需地測,通過可視化拖拽的編排方式進(jìn)行組合,即可完成應(yīng)用場景端到端的圖形化編排,最后以多種方式觸發(fā)執(zhí)行即可完成期望的運維變更任務(wù),從而實現(xiàn)高效、穩(wěn)定、安全的智能運維。

    2.17.可視化數(shù)據(jù)分析

    ? ? ? ? 利用圖形、圖表、圖表等易于理解的形式,提取和分析大量復(fù)雜的電信運營商網(wǎng)絡(luò)中各類運維數(shù)據(jù),呈現(xiàn)分析結(jié)果,從而幫助運維人員在短時間內(nèi)更好地理解和獲得更多的信息,幫助運維部門能夠?qū)崟r了解業(yè)務(wù)和其所依賴IT資源的運行狀況,以及提供系統(tǒng)運維和優(yōu)化的指示和依據(jù)。

    ? ? ? ? 適配各種應(yīng)用場景,二十四小時不間斷監(jiān)控,細(xì)粒度可達(dá)網(wǎng)絡(luò)中每個設(shè)備、資源和鏈路。所有的網(wǎng)絡(luò)故障都一目了然地呈現(xiàn),大大降低了管理成本,同時也提高了運維人員處理故障的能力,節(jié)省的故障處理時間,為運維人員管理網(wǎng)絡(luò)提供了可靠的保證。

    運營商大屏示意圖2.18.快速建設(shè)運維工單體系

    ? ? ? ? 通過方案實現(xiàn)運維工單“無紙化”,支持于設(shè)備和故障管理頁面快速創(chuàng)建工單,把控故障處理進(jìn)度,通過工單平臺簡化故障處理流程,形成自動化故障處理機制,并在每個處理流程的節(jié)點上責(zé)任到人,實現(xiàn)在快速響應(yīng)故障的同時,實現(xiàn)兼顧運維流程管控。

    業(yè)務(wù)工單示意圖

    ? ? ? ? 結(jié)合電信運營商開戶、銷戶、彩鈴、如裝機、 拆機、 加三方通話、減增新業(yè)務(wù)等業(yè)務(wù)需求場景,自定義工單模板內(nèi)的字段,并對字段排序進(jìn)行調(diào)整,使工單根據(jù)業(yè)務(wù)的不同更加貼合用戶實際使用情況,提供為不同工單模板設(shè)置不同狀態(tài)的能力。

    第3章?自主研發(fā)安全可控 適配國產(chǎn)信創(chuàng)環(huán)境

    ? ? ? ? 信創(chuàng)產(chǎn)業(yè)包含了從IT底層的基礎(chǔ)軟硬件到上層應(yīng)用軟件的全產(chǎn)業(yè)鏈的安全可控,涵蓋了應(yīng)用軟件、信息安全、IT基礎(chǔ)設(shè)置、基礎(chǔ)軟件四個領(lǐng)域。其中,基礎(chǔ)軟件是信息系統(tǒng)更核心的部件,是保障信息系統(tǒng)安全的重要陣地和防線,其創(chuàng)新應(yīng)用與自主可控關(guān)系到國家安全和利益,也是產(chǎn)業(yè)自主發(fā)展的基礎(chǔ)。


    ? ? ? ? 本方案支持部署運行在中標(biāo)麒麟、銀河麒麟、紅旗Linux等國產(chǎn)操作系統(tǒng),支持在達(dá)夢、金倉、神州等國產(chǎn)數(shù)據(jù)庫進(jìn)行數(shù)據(jù)存儲,通過東方通等國產(chǎn)中間件提供對外服務(wù)[8],支持龍芯、申威等國產(chǎn)CPU架構(gòu),并實現(xiàn)對國產(chǎn)化CPU、服務(wù)器、數(shù)據(jù)庫、中間件等IT軟硬件設(shè)備的綜合監(jiān)控與運維管理。

    第4章?方案應(yīng)用價值

    ? ? ? ? 通過部署智和信通電信運營商IT運維方案,構(gòu)建了自動、自優(yōu)、自愈、自治的智能運維模式,助力運營商達(dá)到統(tǒng)一標(biāo)準(zhǔn)、統(tǒng)一運營、統(tǒng)一管控、統(tǒng)一規(guī)劃管理。

    ? ? ? ? 實現(xiàn)對所有IT設(shè)施不同層次、不同維度的拓?fù)淇梢暬靶阅苤笜?biāo)智能分析;建立面向宿主機、虛擬機、容器、5G網(wǎng)元的多維度網(wǎng)絡(luò)監(jiān)測視圖,通過跨硬件層、虛擬層、網(wǎng)元層的統(tǒng)一可視化監(jiān)控運維能力,降低各技術(shù)專業(yè)運維難度;實現(xiàn)跨層的可視化,解決了故障快速定界、定責(zé)的難題,快速定位故障源,提升排障時效。

    第5章?標(biāo)桿案例

    ? ? ? ? 智和信通電信運營商IT運維方案成果,其可靠性在電信運營商大規(guī)模、高復(fù)雜的網(wǎng)環(huán)境下得到了驗證,并得到用戶的充分認(rèn)可。

    5.1.中國移動集中統(tǒng)一運維

    5.1.1.項目背景

    ? ? ? ? 中國移動是我國三大移動運營商之一,公司主要經(jīng)營移動通信業(yè)務(wù),國內(nèi)、國際固定電話網(wǎng)絡(luò)與設(shè)施,語音、數(shù)據(jù)、圖像及多媒體通信與信息服務(wù),電信增值業(yè)務(wù),IP電話業(yè)務(wù)等國家批準(zhǔn)的其他業(yè)務(wù),以及與通信及信息業(yè)務(wù)相關(guān)的系統(tǒng)集成等業(yè)務(wù)。

    ? ? ? ? 2010年中國移動通信集團在全國建設(shè)了不良信息過濾系統(tǒng),此系統(tǒng)由不良信息過濾軟件、Windows 服務(wù)器、Linux 服務(wù)器、數(shù)據(jù)庫、分流設(shè)備、交換機、存儲服務(wù)器等構(gòu)成。

    5.1.2.核心需求

    ? ? ? ? 中國移動需要一套集中的OMC(操作維護中心)監(jiān)控軟件,對不良信息過濾系統(tǒng)的所有的設(shè)施進(jìn)行監(jiān)控,包括過濾軟件、Windows 服務(wù)器、Linux 服務(wù)器、數(shù)據(jù)庫、分流設(shè)備、交換機、存儲服務(wù)器等。具體需求如下:

    • 集中部署OMC,分域管理:各省市管理人員從Internet登錄到OMC系統(tǒng),對本省的設(shè)備進(jìn)行監(jiān)控;
    • 穿透私網(wǎng):要管理的設(shè)備分散在各省公司下不同城市的機房中, 網(wǎng)管服務(wù)器無法直接訪問各省設(shè)備;在北京的中心機房,可以監(jiān)控到其他機房的設(shè)備運行情況;
    • 嚴(yán)格的故障處理機制:故障發(fā)生、故障通知、故障清除、故障確認(rèn)、故障恢復(fù),需要符合中國移動的運維管理規(guī)定;
    • 時效性要高:發(fā)現(xiàn)故障的時間,平均不能低于30秒,更大不能過1分鐘;每臺設(shè)備 10—20個需要監(jiān)控的故障/性能指標(biāo),監(jiān)控周期為10秒鐘;
    • 統(tǒng)一監(jiān)控:所有的服務(wù)器、網(wǎng)絡(luò)設(shè)備、軟件系統(tǒng)在同一界面中統(tǒng)一監(jiān)控;
    • 7*24 小時的監(jiān)控畫面:主監(jiān)控屏幕需要7*24小時不間斷展示告警和警報。

    5.1.3.智和信通解決方案

    ? ? ? ? 智和網(wǎng)管平臺已實現(xiàn)包括設(shè)備拓?fù)?、故障管理、性能管理、配置管理以及安全管理等在?nèi)的過1000種基礎(chǔ)網(wǎng)管功能,且支持功能擴展。針對中國移動的具體需求,智和信通提出以下解決方案:

    • 智和網(wǎng)管平臺利用WebService技術(shù)采用集中式部署運維平臺,分布式部署的網(wǎng)管采集代理,實現(xiàn)中心、片區(qū)的層級監(jiān)測,片區(qū)獨立運行,中心可以集中管理分部的監(jiān)測數(shù)據(jù);
    • 配置代理服務(wù)器的IP和端口,做到采集服務(wù)端的代理模式,可以做到監(jiān)控私有網(wǎng)段下的設(shè)備;
    • 具備主動的故障監(jiān)控功能,能從眾多的事件和狀態(tài)中,系統(tǒng)將零散的狀態(tài)信息,總結(jié)成為當(dāng)前工作狀態(tài),并產(chǎn)生告警,可以用聲音、郵件、短信及時提醒網(wǎng)管人員;
    • 采用JAVA多線程任務(wù)并發(fā)技術(shù),把監(jiān)測頻率提升到秒級,以保證監(jiān)測數(shù)據(jù)的實時性和準(zhǔn)確性,監(jiān)控周期更低可以設(shè)置為5秒;
    • 智和網(wǎng)管平臺采用了設(shè)備統(tǒng)一模型,可以統(tǒng)一管理Windows 服務(wù)器、Linux 服務(wù)器、數(shù)據(jù)庫、分流設(shè)備、交換機等各種設(shè)備類型;
    • 客戶端與服務(wù)端之間網(wǎng)絡(luò)故障恢復(fù)后,網(wǎng)管客戶端無需重啟,自動恢復(fù),數(shù)據(jù)庫停機/故障恢復(fù)后,網(wǎng)管系統(tǒng)客戶端、服務(wù)端無需重啟,自動恢復(fù),支持雙機熱備功能。

    5.1.4.方案成果

    ? ? ? ? 智和運維平臺憑借著優(yōu)秀的秒級故障監(jiān)控能力、直觀的拓?fù)鋱D界面展示、特有的分省Proxy SNMP網(wǎng)關(guān)技術(shù)、穩(wěn)固的故障提示和警報提示,更終在中國移動不良信息過濾系統(tǒng)的北方區(qū)域:北京、天津、黑龍江、吉林、遼寧、山東、山西、甘肅、青海、西藏、河南、寧夏共13個省公司 上線使用,并通過了更為嚴(yán)格的功能驗收和性能驗收。

    按地域劃分管理網(wǎng)絡(luò)

    5.2.北京聯(lián)通IPTV網(wǎng)絡(luò)運維

    5.2.1.項目背景

    ? ? ? ? 中國聯(lián)通是我國三大移動運營商之一,公司主要經(jīng)營移動通信業(yè)務(wù),國內(nèi)、國際固定電話網(wǎng)絡(luò)與設(shè)施,語音、數(shù)據(jù)、圖像及多媒體通信與信息服務(wù),電信增值業(yè)務(wù),IP電話業(yè)務(wù)等國家批準(zhǔn)的其他業(yè)務(wù),以及與通信及信息業(yè)務(wù)相關(guān)的系統(tǒng)集成等業(yè)務(wù)。

    ? ? ? ? IPTV業(yè)務(wù)管理平臺提供統(tǒng)一業(yè)務(wù)監(jiān)控模塊,實現(xiàn)對華為能力平臺(華為S9306、S5352、S930、華為E1000防火墻)、中興能力平臺(中興2826、4507、8905交換機)、播控網(wǎng)關(guān)、IPTV盒端管理平臺、IPTV業(yè)務(wù)管理平臺等平臺的統(tǒng)一業(yè)務(wù)監(jiān)控,監(jiān)控內(nèi)容包括網(wǎng)絡(luò)、主機、存儲、應(yīng)用、業(yè)務(wù)數(shù)據(jù)等。

    5.2.2.核心需求

    ? ? ? ? 更終用戶IPTV統(tǒng)一網(wǎng)管負(fù)責(zé)對IPTV系統(tǒng)涉及的所有網(wǎng)元(包括服務(wù)器、交換機、防火墻、存儲設(shè)備)及系統(tǒng)和應(yīng)用的故障告警、日志、性能、拓?fù)?、歷史數(shù)據(jù)(保留一年的歷史數(shù)據(jù))等信息進(jìn)行集中管理和展現(xiàn),并能夠按時、日、月進(jìn)行統(tǒng)計和輸出報表。

    網(wǎng)元數(shù)據(jù)要求

    ? ? ? ? 對于網(wǎng)絡(luò)中的節(jié)點要求獲取的信息包括但不局限于設(shè)備基本信息(IP、類型、名稱等)、設(shè)備網(wǎng)卡、網(wǎng)卡流量、CPU內(nèi)存、CDN信息、存儲信息、設(shè)備性能等參數(shù)。

    故障告警的要求

    ? ? ? ? 提供多種告警通知(聲音、短信、郵件等),多種告警分類,登錄失敗應(yīng)產(chǎn)生告警通知管理員,告警閾值可調(diào)節(jié),可以分權(quán)分區(qū)域進(jìn)行告警。

    日志管理的要求

    ? ? ? ? 除了記錄基本的操作外,系統(tǒng)中的各設(shè)備都需要建立自己的日志文件,定期傳遞給系統(tǒng)的日志管理,進(jìn)行集中收集、分析和故障告警。

    性能管理的要求

    ? ? ? ? 實時監(jiān)控設(shè)備和網(wǎng)絡(luò)的狀態(tài),獲取有關(guān)CDN 網(wǎng)絡(luò)運行的信息及統(tǒng)計數(shù)據(jù);并能在所收集的數(shù)據(jù)的基礎(chǔ)上,提供網(wǎng)絡(luò)的性能統(tǒng)計。

    集中展現(xiàn)管理

    ? ? ? ? 對所管理區(qū)域CDN 及EPG全網(wǎng)設(shè)備提供網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),提供分級的網(wǎng)絡(luò)拓?fù)鋱D像及其相關(guān)信息,并根據(jù)實際運行情況展現(xiàn)維護和管理網(wǎng)絡(luò)資源,包括各網(wǎng)元設(shè)備。支持資源的查詢以及統(tǒng)計功能,并且可以實現(xiàn)資源的自動更新。

    5.2.3.智和信通解決方案

    ? ? ? ? 針對北京聯(lián)通IPTV項目的實際需求,智和信通提出了基于智和網(wǎng)管平臺定制開發(fā)的解決方案。通過開發(fā)擴展,讓智和網(wǎng)管平臺支持各平臺通過SNMP、SNMP Trap、FTP、WebServer等協(xié)議接口方式進(jìn)行數(shù)據(jù)上報的采集監(jiān)控的采集方式,使平臺監(jiān)控模塊可直接采集被監(jiān)控設(shè)備信息。

    • 支持SSH協(xié)議監(jiān)控主機、CLI、SMI協(xié)議監(jiān)控存儲,JDBC協(xié)議監(jiān)控數(shù)據(jù)庫、HTTP/JMX協(xié)議監(jiān)控中間件;
    • 通過SNMP協(xié)議,自動發(fā)現(xiàn)設(shè)備上的資源,如網(wǎng)絡(luò)接口、內(nèi)存、CPU與磁盤等信息,通過TCP可以發(fā)現(xiàn)設(shè)備上存在的軟件服務(wù);
    • 平臺通過SNMP 、SNMP Trap、FTP、WebServer等協(xié)議接口方式進(jìn)行數(shù)據(jù)上報,平臺監(jiān)控模塊直接采集被監(jiān)控設(shè)備信息;?
    • 智和網(wǎng)管平臺具備主動的故障監(jiān)控功能,能從眾多的事件和狀態(tài)中,系統(tǒng)將零散的狀態(tài)信息,總結(jié)成為當(dāng)前工作狀態(tài),并產(chǎn)生告警,可以用聲音、郵件、短信及時提醒網(wǎng)管人員;
    • 提供了多項已定義好的數(shù)據(jù)對象,用于從設(shè)備上采集系統(tǒng)信息、網(wǎng)絡(luò)信息、交換信息、軟件信息、磁盤CPU資源、流量信息,可以通過曲線圖、趨勢圖等展示性能指標(biāo),可以按天、星期、月 、任意時間段查看性能指標(biāo)變化。

    5.2.4.方案成果

    ? ? ? ? 聯(lián)通IPTV網(wǎng)管部署上線后,管理員可以通過IPTV網(wǎng)管對網(wǎng)絡(luò)下的所有網(wǎng)元設(shè)備(包括服務(wù)器、交換機、防火墻、存儲設(shè)備)及系統(tǒng)和應(yīng)用的故障告警、日志、性能、拓?fù)?、歷史數(shù)據(jù)等信息進(jìn)行集中管理和展現(xiàn),并能夠按時、日、月進(jìn)行統(tǒng)計和輸出報表,方便了管理員對系統(tǒng)的管理,提高了管理的效率。