網(wǎng)絡運維 設備管控

如何實現(xiàn)網(wǎng)絡安全監(jiān)控運維?

基于AIOps實現(xiàn)智慧園區(qū)更簡IT運維

基于AIOps實現(xiàn)智慧園區(qū)更簡IT運維
    馬上咨詢

    隨著物聯(lián)網(wǎng)、云平臺、大數(shù)據(jù)、人工智能等技術(shù)的發(fā)展,并逐步投入到智慧園區(qū)的建設,傳統(tǒng)園區(qū)數(shù)字化轉(zhuǎn)型加快。園區(qū)的形式包括產(chǎn)業(yè)園區(qū)、教育園區(qū)、制造業(yè)園區(qū)、科研園區(qū)、社區(qū)等等,園區(qū)形態(tài)不斷演進和發(fā)展,園區(qū)網(wǎng)承載的對象和業(yè)務也越來越多。業(yè)務種類爆炸性增長,業(yè)務變更愈加頻繁,網(wǎng)絡運維的復雜程度與難度逐漸升高,引入大數(shù)據(jù)、AI技術(shù)促進網(wǎng)絡運維更加智能高效已成為智慧園區(qū)網(wǎng)絡運維的必然趨勢。

    第1章 智慧園區(qū)IT運維的痛點

    隨著園區(qū)數(shù)字化轉(zhuǎn)型加速,智慧園區(qū)內(nèi)的各類資產(chǎn)設備數(shù)量激增,運維問題不斷凸顯。如,設備種類多、數(shù)量大、分布廣,故障排障難、效率低,人工運維成本高等等,園區(qū)網(wǎng)IT運維部門面臨巨大網(wǎng)絡運維壓力。

    面臨的具體難題如下:

    • 園區(qū)網(wǎng)建設時期與階段不同,缺乏統(tǒng)一的網(wǎng)絡規(guī)劃管理,網(wǎng)絡架構(gòu)相對混亂,難以實時觀測,對網(wǎng)絡性能瓶頸缺乏準確評估與擴容依據(jù)。
    • 園區(qū)網(wǎng)內(nèi)包含的設備、系統(tǒng)類型多,數(shù)量大,分布廣泛,缺乏態(tài)勢感知能力,網(wǎng)絡運行態(tài)勢難以實時掌握,人工巡檢難度大。
    • 網(wǎng)絡中出現(xiàn)故障或異常時,因網(wǎng)絡結(jié)構(gòu)復雜,設施異地等原因難以快速定位,又因設備品牌、型號、配置等存在差異,難以快速定位故障根因,造成排障困難。
    • 園區(qū)網(wǎng)絡缺乏故障自愈能力,未實現(xiàn)遠程運維,人工運維成本高、效率低。
    • 網(wǎng)絡性能、流量、巡檢和配置檢查的數(shù)據(jù)多為手工整理,數(shù)據(jù)分析統(tǒng)計難度大,效率和正確率較低,難滿足更高的運維管理需求。
    • 園區(qū)管理涉及的IT設備、業(yè)務軟件、行政資產(chǎn)、備品備件等數(shù)量巨大,種類繁多,僅靠人工管理難以對其備件、配件信息詳細統(tǒng)計工作力量巨大且更易出錯,資產(chǎn)的采購、調(diào)撥、報廢等管理效率低,難審計。


    第2章 智慧園區(qū)全息感知運維方案

    在傳統(tǒng)運維方式下,智慧園區(qū)運維工作中,集中監(jiān)控能力薄弱且依賴于經(jīng)驗和規(guī)則,因網(wǎng)絡故障引起的業(yè)務中斷現(xiàn)象,網(wǎng)絡故障的定位、診斷、分析過程對IT運維人員的能力和經(jīng)驗水平要求不斷增高。因此,簡單有效的圖形化運維工具,對全區(qū)內(nèi)網(wǎng)絡、設備、業(yè)務的實時監(jiān)測和分析預警,已成為園區(qū)實現(xiàn)全局化統(tǒng)籌管控、高效決策的必然選擇。

    北京智和信通智慧園區(qū)運維方案,通過智和網(wǎng)管平臺對這些設備分布在智慧園區(qū)的不同區(qū)域、線路、位置的IT基礎設施進行統(tǒng)一納管、統(tǒng)一監(jiān)測。通過實時網(wǎng)絡拓撲、狀態(tài)監(jiān)控和各類故障、事件的預警,動態(tài)展現(xiàn)感知各種設備的分布情況、狀態(tài)信息、異常情況等,并對園區(qū)內(nèi)路徑的流量信息進行統(tǒng)計分析,對網(wǎng)絡帶寬進行管理和規(guī)劃,給后續(xù)網(wǎng)絡擴容提供參考。

    智和信通智慧園區(qū)一體化運維監(jiān)控架構(gòu)

    2.1.智慧園區(qū)網(wǎng)絡全景觀測

    智慧園區(qū)網(wǎng)絡涉及大量傳輸設備、數(shù)通設備、安全設備、服務器、云、攝像頭、感知終端等多種類型并存且相互連接,連接方式多樣復雜,常規(guī)運維方案難以清晰管理設備間的鏈接關(guān)系。通過北京智和信通的網(wǎng)絡全景觀測方案將智慧園區(qū)的IT設施納入智和網(wǎng)管平臺中一站管控,采取智能技術(shù),實現(xiàn)網(wǎng)絡拓撲可視化的能力,通過動態(tài)智能拓撲實現(xiàn)全量設備、資源、鏈接關(guān)系、IP等實時更新、快速定位。

    智和園區(qū)網(wǎng)絡拓撲示意圖

    2.2.端到端網(wǎng)絡連接關(guān)系可視化

    方案通過對交換機光口和網(wǎng)絡接口的監(jiān)控,通過數(shù)據(jù)采集分析,實現(xiàn)對網(wǎng)絡流量和關(guān)鍵連接的預測性維護,從整體維度到局部維度展示智慧園區(qū)網(wǎng)絡內(nèi)IT設施間鏈路各項指標,整體可觀測、可告警、可分析、可統(tǒng)計。通過實時監(jiān)控各個端口以及每條線路的通斷情況和性能指標,結(jié)合專業(yè)的流量監(jiān)控分析能力,對鏈路容量進行及時監(jiān)控,并生成流量分析報告,為容量規(guī)劃提供依據(jù)。

    2.3.園區(qū)視頻監(jiān)控攝像頭運維

    智慧園區(qū)的視頻監(jiān)控體系的穩(wěn)定運行是對智慧園區(qū)實時了解的有效手段,因此對視頻監(jiān)控系統(tǒng)內(nèi)攝像頭運行狀態(tài)、畫面質(zhì)量的監(jiān)測尤為重要。

    本方案支持對不同品牌、不同型號的攝像頭進行統(tǒng)一運維,將網(wǎng)絡高清、智能分析、多級管控融合為一體。通過onvif接口協(xié)議和智能化識別技術(shù),實現(xiàn)對視頻畫面自動偵測、自動提取,主動監(jiān)控發(fā)現(xiàn)和分析出攝像機設備常見的故障,如設備不連通、畫面偏色、信號缺失、清晰度異常、亮度異常等問題和原因,并及時在拓撲圖中顯示出當前視頻監(jiān)控的可用情況。

    2.4.PON設備監(jiān)控管理

    方案采集、監(jiān)控PON設備和其他網(wǎng)絡設備數(shù)據(jù),實現(xiàn)全域網(wǎng)絡數(shù)據(jù)統(tǒng)一分析,統(tǒng)一呈現(xiàn),對PON設備和以太網(wǎng)有線、無線設備統(tǒng)一智能分析,分析結(jié)果集中呈現(xiàn),提升管理運維體驗。通過智能技術(shù),用戶只需輸入IP范圍即可發(fā)現(xiàn)PON設備,滿足整個網(wǎng)絡大量設備接入需求;支持單個添加設備,在管理少量設備時逐個添加。

    2.5.園區(qū)終端可視管理

    PC、手機、PAD、攝像頭、打印機、IP電話、視頻會議等終端快速增長,方案通過多種發(fā)現(xiàn)算法,自動搜索發(fā)現(xiàn)交換機的下掛設備,智能識別網(wǎng)絡中的智能終端和物聯(lián)網(wǎng)終端,分析其的IP、MAC、端口等信息。自動生成設備拓撲圖,簡化添加刪除等設備操作,提升管理效率。

    2.6.虛擬化資源統(tǒng)一管理

    方案支持對虛擬化環(huán)境下的虛擬機、宿主機等進行全方位運維監(jiān)控,支持Exi5、KVM、Xen、Hyper-v等,監(jiān)測指標涵蓋物理機內(nèi)部虛擬化設備的電源、操作系統(tǒng)、CPU、內(nèi)存、磁盤等,更大化利用計算資源,保障虛擬化平臺運行穩(wěn)定。

    2.7.云上云下資源統(tǒng)一監(jiān)控

    方案對復雜的多云異構(gòu)環(huán)境、云上云下資源、信創(chuàng)云等進行管理,實現(xiàn)云下服務器、網(wǎng)絡設備、安全設備、機房、機柜、專線、配件等設施,云上各類云服務器、云磁盤等云產(chǎn)品以及各類IP、NAT、DNS等資源的真正一站式運維,并支持對納管資源的快速擴展。自動監(jiān)測基礎設施及資源,其中包括云、混合云、容器、虛擬主機、網(wǎng)絡、服務器、存儲等。對進程、資源利用率、網(wǎng)絡使用量、性能、日志、事件進行監(jiān)測。


    2.8.彈性擴展,滿足網(wǎng)絡發(fā)展需求

    方案支持設備及資源彈性伸縮,滿足網(wǎng)絡中設備量持續(xù)增長及更新的需求。可對設備類型模型進行擴展,可自定義新設備的類型、圖標、類型識別策略;可對設備資源模型進行擴展,自定義新設備類型的網(wǎng)口、指示燈、風扇、電源的圖標、識別發(fā)現(xiàn)策略;可自定義設備面板圖,以拖拽、鼠標操作完成設備面板模板的制作;支持故障和性能擴展。

    通過自定義設備類型及其設備資源,更大限度上提高了智和網(wǎng)管平臺的管理范圍,真正實現(xiàn)了對設備及其資源的化管理,達到管控萬物的目標。


    第3章 IT基礎設施運行態(tài)勢感知

    方案融合人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)、遠程2.5D全景呈現(xiàn)等技術(shù),實時感知IT設施全息運行狀態(tài),輕松觀測智慧園區(qū)任一IT基礎設施,無論主機、進行、網(wǎng)絡設備等,通過統(tǒng)一的監(jiān)測面板,洞察IT設施運行狀態(tài)和性能,對全局網(wǎng)絡態(tài)勢實時追蹤,快速定位故障和異常。

    3.1.運行性能態(tài)勢分析

    實時監(jiān)測并感知網(wǎng)絡性能相關(guān)情況,覆蓋IT環(huán)境,采集設備資源、應用、服務等性能信息,通過智能分析,多維度處理、分析、展示網(wǎng)絡基礎設施性能狀態(tài),實現(xiàn)全網(wǎng)態(tài)勢的“可觀、可管、可控”。


    3.2.日志與事件管理

    將事件和告警分離管理,接收設備/服務器主動發(fā)送的消息,集中處理后,及時地通知用戶,并可以通過集中的管理界面進行管理。接收設備/服務器主動發(fā)送的消息,更大地提高了管理的主動性,通過統(tǒng)一界面集中管理事件,降低了管理的難度。

    3.3.故障態(tài)勢感知

    方案通過統(tǒng)一的故障管理中心,統(tǒng)一檢測、統(tǒng)一管理、統(tǒng)一分析園區(qū)網(wǎng)中各種事件日志、設備故障、網(wǎng)絡異常、業(yè)務指標異常、流量異常等信息,快速感知網(wǎng)絡故障?;诠收夏P秃虯I算法分析故障原因,分析、壓縮、并歸關(guān)聯(lián)故障信息,降低故障風暴,秒級定位故障位置,主動出擊快速排障,故障處置全流程展示。


    3.4.跨地域自動巡檢

    傳統(tǒng)的人工巡檢,尤其是應用巡檢,缺乏統(tǒng)一的規(guī)范、標準,導致巡檢的范圍和深度都存在一定的局限性,并且是基于人工的手工統(tǒng)計,工作效率比較低,同時耗費較大的人力資源。本方案依托平臺將以前依賴手工進行的日常巡檢轉(zhuǎn)換為自動化、定時執(zhí)行的巡檢策略,日常例行巡檢、節(jié)假日和重要事件前的巡檢均可自動化執(zhí)行。


    第4章 全網(wǎng)流量透視

    隨著智慧園區(qū)信息化建設的加速,其業(yè)務、應用層出不窮,對網(wǎng)絡帶寬的需求越來越高。正常的業(yè)務需要良好的帶寬環(huán)境保障機制,避免被一些與業(yè)務無關(guān)的雜事干擾,影響工作效率。方案對智慧園區(qū)路網(wǎng)絡全局流量和帶寬實時監(jiān)控,將出入雙方向流量情況可視化展現(xiàn)。基于海量流量數(shù)據(jù)的存儲挖掘,統(tǒng)計分析流量峰值、谷值、流量趨勢、設備流量等數(shù)據(jù),為網(wǎng)絡流量管理提供數(shù)據(jù)支撐。


    第5章 端到端業(yè)務運維體系

    隨著業(yè)務的不斷增長,基于園區(qū)網(wǎng)的應用系統(tǒng)也越來越多,如OA、Email、ERP等數(shù)據(jù)業(yè)務,VoIP、PTSN等語音業(yè)務,視頻會議等視頻業(yè)務以及其他的辦公、運營業(yè)務。如何維護園區(qū)網(wǎng)絡的可靠穩(wěn)定,不中斷、不丟包、低延時、低抖動,以保障關(guān)鍵業(yè)務穩(wěn)定運行。


    第6章 全網(wǎng)IP合規(guī)監(jiān)測

    對于園區(qū)網(wǎng)內(nèi)的IP地址采取統(tǒng)一數(shù)據(jù)標準進行梳理和管理,分網(wǎng)段、端到端的規(guī)劃、部署、管理和監(jiān)控IP地址。通過多種合規(guī)性策略檢測全網(wǎng)MAC-IP的使用情況,實現(xiàn)從規(guī)劃、分配到使用、回收的IP地址全視角管理,提升IP信息準確性,真正IP地址集中化、自動化、規(guī)范化管控。


    黑白名單配置:通過黑白名單功能用來檢測用戶所關(guān)心的設備是否在網(wǎng)絡中出現(xiàn)及出現(xiàn)時間。支持配置黑名單或白名單,智能劃撥規(guī)劃表中的IP、MAC設置為白名單策略,對非法接入設備進行告警處置。

    IP-MAC綁定:對全網(wǎng)MAC和IP進行配對綁定,并周期性對MAC-IP進行檢測。自動將規(guī)劃表中的IP-MAC設置為綁定關(guān)系,自動掃描在線終端,當IP-MAC的綁定關(guān)系發(fā)生沖突時產(chǎn)生告警,保證入網(wǎng)終端安全可信。

    第7章 無人值守地設備遠程配置

    園區(qū)網(wǎng)承載的業(yè)務經(jīng)常發(fā)生變更,面對業(yè)務的變更運維工程師往往要對大量設備進行操作,此時如果依靠工程師逐一登錄設備進行命令下發(fā)、策略配置,將產(chǎn)生大量重復性的工作,不但導致運維效率低下,也不可避免地產(chǎn)生人為配置錯誤。

    通過智和信通全場景自動化運維方案納入監(jiān)控的設備進行單獨、批量的配置操作,設備策略遠程配置管理,可以自動批量進行設備配置修改,并可對設備配置進行備份、對比、恢復,宕機后設備配置可快速復原,保障設備及時恢復運行,提升配置效率、質(zhì)量和安全性,降低運維復雜度。

    針對不同類型的設備,支持進行各種控制、配置操作。

    • 對服務器/主機/虛擬化,支持一鍵開關(guān)機、進程管理、應用管理、容量管理等
    • 對交換機/路由器,支持ACL、QoS、流量策略、端口策略等
    • 對安全設備,支持防護管理、認證管理、NAT管理、VPN管理、內(nèi)容控制等
    • 對數(shù)據(jù)庫/中間件,支持空間管理、池管理、會話管理、連接控制等
    • 對傳輸設備,支持終端管理、鏈路管理、信號控制、功率配置等
    • 對其他設備,支持結(jié)合用戶實際場景,通過拖拽流程的方式實現(xiàn)自定義管控策略

    對不同廠商,如Cisco、HP、Nortel、Juniper、3Com、D-link、Foundry、Dell、Proxim、NetScreen、華為、H3C、銳捷、中興等多家廠商的網(wǎng)絡設備。

    第8章 全場景自動化運維

    隨著智慧園區(qū)信息化建設發(fā)展而來的是越來越復雜的業(yè)務和越來越多樣化的需求,不斷擴展的應用需要更加合理的運維模式來保障。傳統(tǒng)園區(qū)網(wǎng)運維依賴人工進行,運維效率低,網(wǎng)絡配置管理易出錯,排障處置困難。

    方案通過運維自動化將IT運維中涉及的服務、命令、操作、執(zhí)行組件化、策略化,將需要進行的運維服務、操作等以組件、策略的形式托管至平臺中進行維護和管理,通過簡單靈活的編排能力,使用者可以選擇業(yè)務場景所需的策略,通過可視化拖拽的編排方式進行組合,即可完成應用場景端到端的圖形化編排。

    在安全合規(guī)的前提下,將運維人員從整體的變更流程及變更內(nèi)容的準備中解脫出來,實現(xiàn)網(wǎng)絡變更、設備配置自動化,業(yè)務需求變更,通過平臺自動部署實現(xiàn),無需手工敲命令行,快速響應需求變化。

    將人工運維與故障自愈結(jié)合,無需針對告警進行手動處置,只需預編排告警處理流程,平臺根據(jù)場景自動觸發(fā),實現(xiàn)故障自愈。降低甚至清除排障處置中的延遲時間,完成零延遲的IT運維。


    在智慧園區(qū)日常網(wǎng)絡運維服務中,重復的故障和請求約占到70%,只有30%的故障真正需要專業(yè)人員來解決,知識經(jīng)驗對提升重復工作的效率起到了至關(guān)重要的作用。通過智和網(wǎng)管平臺自動化運維的能力,將只能由專家處理的各類操作和判斷轉(zhuǎn)化為可存在于平臺內(nèi)的流程,形成可保留可復用的運維知識,減少因誤操作帶來的損失,保障運維效率。


    第9章 運維大數(shù)據(jù)分析

    智慧園區(qū)涉及的IT設施及各業(yè)務系統(tǒng)產(chǎn)生的海量數(shù)據(jù)無法得到深層次的應用,管理者決策缺乏數(shù)據(jù)依據(jù),難以參考各類網(wǎng)絡業(yè)務指標、數(shù)據(jù)等實現(xiàn)對運行態(tài)勢、隱患風險的實時掌控及運營管理。

    為解決此難題,智和信通智慧園區(qū)監(jiān)控運維方案利用圖形、圖表、圖表等易于理解的形式,提取和分析大量復雜的各類運維數(shù)據(jù),呈現(xiàn)分析結(jié)果,將全域資源融合展示。從而幫助運維人員在短時間內(nèi)更好地理解和獲得更多的信息,幫助運維中心能夠?qū)崟r了解業(yè)務和其所依賴IT資源的運行狀況,以及提供系統(tǒng)運維和優(yōu)化的指示和依據(jù)。

    智慧園區(qū)運維大屏示意圖

    第10章 更多協(xié)同運維能力

    10.1.IT資產(chǎn)生命周期監(jiān)管?

    建立健全資產(chǎn)臺賬,實現(xiàn)一機一檔,通過自定義多級資產(chǎn)分類,細化資產(chǎn)類別,實現(xiàn)資產(chǎn)分類管控,提高資產(chǎn)精細管理程度。從資產(chǎn)入庫、領用、變更、維修、調(diào)撥、到報廢處置,資產(chǎn)每一步操作均實現(xiàn)完整記錄,支持追溯,通過平臺實現(xiàn)資產(chǎn)整個生命周期的全流程閉環(huán)管理,使得IT資產(chǎn)每一次生命周期變更,都有流程可依、都有跡可循,從而實現(xiàn)IT資產(chǎn)監(jiān)管,解決網(wǎng)絡設備在日常運維過程中出現(xiàn)“脫管”或“半脫管”的問題。


    10.2.可量化運維工單體系

    通過方案實現(xiàn)運維工單“無紙化”,支持于設備和故障管理頁面快速創(chuàng)建工單,把控故障處理進度,通過工單平臺簡化故障處理流程,形成自動化故障處理機制,并在每個處理流程的節(jié)點上責任到人,實現(xiàn)在快速響應故障的同時,實現(xiàn)兼顧運維流程管控。


    第11章 智和信通信創(chuàng)國產(chǎn)化支持

    智和信通提供的信創(chuàng)運維方案,立足于北京智和信通10年的國產(chǎn)融合經(jīng)驗,與國產(chǎn)軟硬件產(chǎn)品深度適配,方案應用覆蓋各行各業(yè)。方案支持在中標麒麟、銀河麒麟、紅旗Linux等國產(chǎn)操作系統(tǒng)上運行,支持在達夢、金倉、神州等國產(chǎn)數(shù)據(jù)庫進行數(shù)據(jù)存儲,通過東方通等國產(chǎn)中間件提供對外服務,支持龍芯、申威等國產(chǎn)CPU架構(gòu),并實現(xiàn)對國產(chǎn)化CPU、服務器、數(shù)據(jù)庫、中間件等IT軟硬件設備的綜合監(jiān)控與運維管理。


    第12章 方案應用價值

    通過對園區(qū)網(wǎng)內(nèi)的IT基礎設施、IT機房、鏈路、資產(chǎn)、流程、業(yè)務的梳理、全棧監(jiān)控、實時告警、故障自愈等智能化運維手段,解決園區(qū)運維面臨的各項難題,助力智慧園區(qū)IT運維部門告別傳統(tǒng)“救火式”運維,運維效率大幅度上升。