? ? ? ? 隨著網(wǎng)絡(luò)規(guī)模不斷擴大,復雜程度不斷增加,給運維工作帶來更大挑戰(zhàn)。為保障網(wǎng)絡(luò)正常、穩(wěn)定、高效運行,對網(wǎng)絡(luò)流量進行監(jiān)測、存儲、回溯成為不可或缺的手段,通過對流量的分析,運維人員可以更加全面的了解整體網(wǎng)絡(luò)的運行狀態(tài),快速定位、解決網(wǎng)絡(luò)中存在問題。
? ? ? ? 智和信通網(wǎng)絡(luò)流量監(jiān)測分析方案通過采集、存儲、分析網(wǎng)絡(luò)流量并以可視化的方式,將流量態(tài)勢進行呈現(xiàn),協(xié)助運維人員對網(wǎng)絡(luò)流量趨勢進行分析,助力網(wǎng)絡(luò)監(jiān)控、網(wǎng)絡(luò)優(yōu)化,并為網(wǎng)絡(luò)規(guī)劃、優(yōu)化調(diào)整和業(yè)務(wù)支撐提供基礎(chǔ)依據(jù)。
第1章?網(wǎng)絡(luò)鏈路可視化觀測
? ? ? ? 方案采用可視化圖形的方式實現(xiàn)網(wǎng)絡(luò)中設(shè)備、資源、鏈路狀態(tài)的整體觀測,用戶只需要輸入IP范圍一步操作,通過平臺的智能發(fā)現(xiàn)技術(shù),即可自動完成如下全部功能:網(wǎng)絡(luò)設(shè)備發(fā)現(xiàn)、設(shè)備類型識別、設(shè)備鏈路發(fā)現(xiàn)、設(shè)備故障和性能采集、鏈路流量和狀態(tài)以及網(wǎng)絡(luò)拓撲生成。
1.1.網(wǎng)絡(luò)設(shè)備與鏈路自動發(fā)現(xiàn)
? ? ? ? 在自動發(fā)現(xiàn)的過程中,搜索網(wǎng)絡(luò)設(shè)備并識別設(shè)備類型和廠商型號,生成設(shè)備的面板圖或搜索設(shè)備資源,如:板卡、端口、CPU、內(nèi)存、磁盤等,并發(fā)現(xiàn)設(shè)備之間的鏈路關(guān)系。通過圖形化方式系統(tǒng)展現(xiàn)網(wǎng)絡(luò)拓撲,支持樹形結(jié)構(gòu)和平面結(jié)構(gòu)的聯(lián)動展示,也可以按片區(qū)、按地域、按層級等多種布局方式劃分網(wǎng)絡(luò),在拓撲中以不同顏色設(shè)備圖標實時展現(xiàn)設(shè)備和鏈路的實時狀態(tài)信息。
? ? ? ? 實時對網(wǎng)絡(luò)鏈路進行監(jiān)控和可視化數(shù)據(jù)分析,從整體維度到局部維度全面展示網(wǎng)絡(luò)內(nèi)設(shè)備鏈路各項指標,整體可觀測、可告警、可分析、可統(tǒng)計,通過實時監(jiān)控各個端口及每條線路的通斷情況和性能指標,如帶寬利用率、流入流出流量、延遲、丟包率等,并在拓撲上直觀顯示出來。
? ? ? ? 對鏈路容量進行即時監(jiān)控,根據(jù)故障閾值比對,當性能指標超過預(yù)設(shè)閾值時,即可觸發(fā)響應(yīng)級別告警,幫助用戶快速發(fā)現(xiàn)并解決潛在問題。
1.3.網(wǎng)絡(luò)流量透視
? ? ? ? 基于網(wǎng)絡(luò)流量分析技術(shù),采集、分析、存儲所有網(wǎng)絡(luò)流量,以多維數(shù)據(jù)分析和深度挖掘為手段,實現(xiàn)數(shù)據(jù)包層面的流量追蹤。
通過全局流量和帶寬實時監(jiān)控,將出入雙方向流量情況可視化展現(xiàn)?;诤A苛髁繑?shù)據(jù)的存儲挖掘,統(tǒng)計分析流量峰值、谷值、流量趨勢、設(shè)備流量等數(shù)據(jù),為網(wǎng)絡(luò)流量管理提供數(shù)據(jù)支撐。
? ? ? ? 提供端到端的流量監(jiān)控能力,從設(shè)備、接口、IP、服務(wù)、應(yīng)用、會話、QoS等層級的實時流量監(jiān)控和歷史流量分析,識別帶寬消耗較大的應(yīng)用程序、服務(wù)、協(xié)議或 IP 地址,避免網(wǎng)絡(luò)容量過載,并提升最終用戶網(wǎng)絡(luò)體驗。
? ? ? ? 提供設(shè)備、接口、IP、服務(wù)、應(yīng)用、會話等層級的帶寬使用率監(jiān)控,實時監(jiān)控帶寬使用趨勢與帶寬占用分布,并通過圖表展示,快速識別網(wǎng)絡(luò)帶寬濫用,分析高帶寬使用情況。
? ? ? ? 采集并存儲網(wǎng)絡(luò)流量,形成原始流量和聚合流量數(shù)據(jù)庫,支持快速提取多維度的流量元數(shù)據(jù)進行正常、異常流量排查,為后續(xù)運維人員對原始網(wǎng)絡(luò)流量進行查詢檢索及關(guān)聯(lián)回溯分析。
? ? ? ? 大容量、長時間存儲流量數(shù)據(jù),長期實時保存原始數(shù)據(jù)包。通過高效的數(shù)據(jù)檢索,實現(xiàn)流量數(shù)據(jù)的快速回溯。對已發(fā)生的流量行為進行回溯分析,迅速定位異常流量,對其進行挖掘、分析、取證,實現(xiàn)多維根因追溯,為迅速定位問題發(fā)生原因提供更全面的分析依據(jù),同時為網(wǎng)絡(luò)安全提供強有力的數(shù)據(jù)分析保障。
1.3.4.流量趨勢分析
? ? ? ? 從設(shè)備、接口、IP、服務(wù)、應(yīng)用、會話、QoS等層級出發(fā),提供歷史流量趨勢圖譜,通過應(yīng)用、端口、協(xié)議等對流量進行監(jiān)控和多維度分析,支持按源和目的地進行流量,流量監(jiān)控粒度可達大小、速率、帶寬使用率、包等。
1.3.5.源和目的地分析
? ? ? ? 查看近30分鐘、近1小時、近1天及自定義時間內(nèi)作為源或目的地的節(jié)點產(chǎn)生的流量信息,以圖表的形式進行展示,并給出產(chǎn)生流量最多的10個節(jié)點。
? ? ? ? 通過統(tǒng)一故障管理將監(jiān)控信息統(tǒng)一采集、分析,實現(xiàn)網(wǎng)絡(luò)中各種事件信息、設(shè)備故障、網(wǎng)絡(luò)異常、流量異常等告警,以智能化手段進行標準化的分析、壓縮、并歸關(guān)聯(lián)等,通過多種方式實時傳達告警信息,快速標識已經(jīng)執(zhí)行操作的告警,定位異常流量,提供主動式的故障解決方案,協(xié)助用戶及時處理網(wǎng)絡(luò)安全威脅,避免惡意流量對有限帶寬資源的侵蝕。
? ? ? ? 采用自動去重、風暴抑制、關(guān)聯(lián)聚合、維護期時間屏蔽、依賴屏蔽等多種智能告警降噪機制,通過AI算法,對各類告警進行自動壓縮收斂,減少90%的無效告警,抑制告警風暴,直達故障根因。包括事件過濾機制、故障事件上報機制、故障事件呈現(xiàn)過濾、故障事件入庫過濾、故障事件確認等處理機制,有效避免誤報和漏報。
2.2.根因定位
? ? ? ? 實現(xiàn)快速的異常流量定位,能一步定位到發(fā)生流量異常的源頭設(shè)備、接口、IP、應(yīng)用、會話等,及時處理好故障,有效地預(yù)防故障發(fā)。
? ? ? ? 全面采集告警信息,將告警信息數(shù)據(jù)按照時間、資源、性能類型等多種維度以圖表等形式展現(xiàn)。通過豐富的、可自定義的多維度報表,實現(xiàn)平臺內(nèi)所有模塊告警的統(tǒng)一管理分析,從變化趨勢、告警關(guān)聯(lián)、排障處置等多方面、多視角洞察告警態(tài)勢。
第3章 流量巡檢
? ? ? ? 支持自定義流量巡檢策略,對網(wǎng)絡(luò)流量情況進行實時巡檢和報表生成,并可自定義預(yù)設(shè)時間向指定郵箱發(fā)送巡檢結(jié)果報表,實現(xiàn)對網(wǎng)絡(luò)流量的定期檢查,把握網(wǎng)絡(luò)運行中的易出現(xiàn)問題的環(huán)節(jié),做到預(yù)防為先。
用戶可自行選擇要巡檢的類型,包括:網(wǎng)絡(luò)、設(shè)備類型、設(shè)備、業(yè)務(wù)、鏈路等,定義巡檢的范圍和指標,如:輸入輸出流量、輸入輸出帶寬、帶寬利用率等。
? ? ? ? 實現(xiàn)基于設(shè)備、資源層面的深度管控。在控制策略管理方面,基于多種協(xié)議等設(shè)備管理協(xié)議,進行統(tǒng)一安管、運維規(guī)范配置,實現(xiàn)多品牌設(shè)備集中管控、安全策略可見、配置準確性核查等功能。
提供多設(shè)備、多資源批量策略下發(fā)操作。提供拓撲圖右鍵快捷命令下發(fā)操作。支持對華為、華三、邁普、迪普、銳捷等國產(chǎn)設(shè)備的深刻管控,包括ACL、QOS、路由配置、賬號安全、終端準入等。
4.1.流量策略
? ? ? ? 平臺支持流量策略批量下發(fā)、失敗重發(fā),方便全網(wǎng)實施統(tǒng)一流量策略,策略可進行同步、批量查詢和對比核查。如通過可視化界面進行端口級QOS策略 ,支持QOS、流行為、包過濾、類、流量監(jiān)管 優(yōu)先級等流量策略,用戶可對QOS策略對比、核查。
4.2.網(wǎng)絡(luò)安全策略
? ? ? ? 平臺支持實現(xiàn)多設(shè)備、多端口批量進行準入控制操作,方便全網(wǎng)實施統(tǒng)一準入策略。如自定義ACL模板,實現(xiàn)ACL策略、源和目的IP、協(xié)議、端口、訪問動作等細粒度的控制。
4.3.故障自愈策略
? ? ? ? 無需針對告警進行手動處置,只需預(yù)編排告警處理流程,平臺根據(jù)場景自動觸發(fā),實現(xiàn)故障自愈。以網(wǎng)絡(luò)狀態(tài)監(jiān)控、設(shè)備性能監(jiān)測為基礎(chǔ),結(jié)合網(wǎng)絡(luò)流量偵測功能,動態(tài)發(fā)現(xiàn)網(wǎng)絡(luò)故障。
? ? ? ? 智能判斷告警類型及級別,自動觸發(fā)預(yù)設(shè)的故障處置流程,復雜告警指派工單專人處理,常規(guī)告警觸發(fā)安全策略全自動處理。
? ? ? ? 通過自定義智能報表模板,運用鉆取、旋轉(zhuǎn)、切片等操作,實現(xiàn)流量數(shù)據(jù)的靈活展現(xiàn)和統(tǒng)計分析,通過自助式數(shù)據(jù)同比、環(huán)比、TOPN等分析方式及周期自動生成報表功能,實現(xiàn)運維數(shù)據(jù)有效利用。
? ? ? ? 利用圖形、圖表等易于理解的形式,將采集到的網(wǎng)絡(luò)流量數(shù)據(jù)進行整合分析,通過強大的可視化能力對有效信息進行呈現(xiàn),從流量利用方面為網(wǎng)絡(luò)和業(yè)務(wù)穩(wěn)定提供支撐。
6.1.某銀行總行兩地三中心引入智和信通運維平臺,實現(xiàn)集中監(jiān)控、統(tǒng)一運維
6.1.1.項目背景
? ? ? ? 近年來,某銀行總行中心業(yè)務(wù)持續(xù)發(fā)展,各項業(yè)務(wù)數(shù)量與復雜的逐年上升,信息系統(tǒng)數(shù)量增加且規(guī)模不斷擴大,作為支撐的網(wǎng)絡(luò)設(shè)備數(shù)量逐漸增長、類型不斷增加。為保障業(yè)務(wù)連續(xù)性,其上線了各類運管工具,然而,現(xiàn)有運管工具多,相互獨立,缺少關(guān)聯(lián),數(shù)據(jù)分散,導致工具聯(lián)動弱、監(jiān)控處置慢、運維效率低,且部分系統(tǒng)易用性差難以靈活擴展、配置。因此,急需一款集中運維監(jiān)控平臺,替換老舊監(jiān)控平臺,形成統(tǒng)一的運維管理,實現(xiàn)統(tǒng)一監(jiān)控、統(tǒng)一告警、統(tǒng)一分析。
6.1.2.項目現(xiàn)狀
? ? ? ? 某銀行總行中心目前因設(shè)備類型與品牌型號復雜,采用了多種運管工具進行管理,工具相互獨立,難以滿足其日益豐富的運維需求。現(xiàn)急促統(tǒng)一監(jiān)控運維平臺對設(shè)備進行集中監(jiān)控,打通數(shù)據(jù)孤島,實現(xiàn)跨團隊數(shù)據(jù)共享及宏觀統(tǒng)一監(jiān)控。
? ? ? ? 設(shè)備類型:Aix、Windows Server、Centos等操作系統(tǒng);DB2、MySQL、Gbase等數(shù)據(jù)庫;nginx、WAS、MQ等中間庫;浪潮、華三、曙光等品牌服務(wù)器;浪潮、IBM等小型機;docker容器;存儲設(shè)備、安全設(shè)備、網(wǎng)絡(luò)設(shè)備等。
? ? ? ? 設(shè)備數(shù)量:1600+臺設(shè)備。
? ? ? ? 部署需求:兩地三中心部署。
功能需求:
6.1.3.智和信通方案
? ? ? ? 經(jīng)過與某銀行總行中心運維團隊的深入交流和詳細需求調(diào)研,智和信通通過分布式部署的方式支撐其兩地三中心架構(gòu),在北京中心、北京災(zāi)備中心、某地分中心分別部署智和網(wǎng)管平臺,同時提供容災(zāi)機制,任一中心出現(xiàn)問題可以無縫被其他中心接管。最終實現(xiàn),運維數(shù)據(jù)全量同步,在任意中心均可查看全部數(shù)據(jù)的同時,各中心可分別管理各自下屬的設(shè)備,北京中心可以對全部設(shè)備進行管理、查看。
兼容信創(chuàng)國產(chǎn)生態(tài),產(chǎn)品安全可控
? ? ? ? 立足于北京智和信通10年的國產(chǎn)融合經(jīng)驗,智和信通全部產(chǎn)品與國產(chǎn)軟硬件產(chǎn)品深度適配,涉及的產(chǎn)品與模塊,均由北京智和信通自主研發(fā),從功能模塊、數(shù)據(jù)庫、界面全部基于統(tǒng)一Java技術(shù)平臺和統(tǒng)一數(shù)據(jù)關(guān)系模型,不包含任何第三方功能庫。在支撐用戶構(gòu)建信創(chuàng)環(huán)境的同時,也針對各類信創(chuàng)設(shè)備、服務(wù)組件等提供相應(yīng)的運維服務(wù),在降本增效的同時,促進政企用戶業(yè)務(wù)創(chuàng)新發(fā)展。
智能發(fā)現(xiàn)技術(shù),一鍵發(fā)現(xiàn)網(wǎng)絡(luò)設(shè)備
? ? ? ? 通過智能發(fā)現(xiàn)技術(shù),在智和網(wǎng)管平臺中用戶僅需輸入IP范圍一步操作,即可自動完成網(wǎng)絡(luò)設(shè)備發(fā)現(xiàn)、設(shè)備類型識別、設(shè)備鏈路發(fā)現(xiàn)、設(shè)備故障和性能采集、鏈路流量和狀態(tài)以及網(wǎng)絡(luò)拓撲生成。并且在自動發(fā)現(xiàn)的過程中可以搜索到網(wǎng)絡(luò)設(shè)備,并識別設(shè)備類型和廠商型號,生成設(shè)備的面板圖或搜索設(shè)備資源,如:板卡、端口、CPU、內(nèi)存、磁盤等,并發(fā)現(xiàn)設(shè)備之間的鏈路關(guān)系。
自動生產(chǎn)網(wǎng)絡(luò)拓撲,網(wǎng)絡(luò)架構(gòu)可觀測
? ? ? ? 已發(fā)現(xiàn)的設(shè)備、資源、鏈路可自動生產(chǎn)網(wǎng)絡(luò)拓撲,以圖形方式整體觀測,并以聲光進行告警提醒。實時分析資源當前性能和運行狀態(tài),直觀反映資源的動態(tài)變化對支撐業(yè)務(wù)的影響。同時,采取統(tǒng)一數(shù)據(jù)標準,對整體網(wǎng)絡(luò)中的IP地址進行梳理和管理,建立IP與MAC對應(yīng)關(guān)系庫,端到端規(guī)劃、部署、管理和監(jiān)控IP地址使用情況。
海量設(shè)備集中監(jiān)控,統(tǒng)一管理
? ? ? ? 集中監(jiān)控中心的各類設(shè)備,統(tǒng)一監(jiān)控配置和策略,獲取網(wǎng)絡(luò)設(shè)備、硬件服務(wù)器、存儲設(shè)備的性能運行數(shù)據(jù)、日志事件數(shù)據(jù)、流量數(shù)據(jù)等。監(jiān)控策略根據(jù)資源類型的不同,涵蓋狀態(tài)信息、響應(yīng)時長、使用率、輸出輸入流量、輸入輸出帶寬、時延、命中率、讀寫速度等方方面面。整個監(jiān)控指標體系,支持完全自定義,根據(jù)設(shè)備不同應(yīng)用場景的不同進行差異化配置。
? ? ? ? 全量匯聚異常告警信息,基于故障模型和AI算法分析故障原因,分析、壓縮、并歸關(guān)聯(lián)故障信息,降低故障風暴,秒級定位故障位置,主動出擊快速排障,故障處置全流程展示。根據(jù)各省管理權(quán)限及人員排班安排,定義告警通知策略,從系統(tǒng)內(nèi)聲光閃爍到郵件、短信通知,運維人員第一時間獲知告警信息,排障處置責任到人。
? ? ? ? 支持通過Flow流量數(shù)據(jù),提供端到端的流量監(jiān)控能力,從設(shè)備、接口、IP、服務(wù)、應(yīng)用、會話、QoS等層級的實時流量監(jiān)控和歷史流量分析,識別帶寬消耗較大的應(yīng)用程序、服務(wù)、協(xié)議或IP地址,避免網(wǎng)絡(luò)容量過載,并提升最終網(wǎng)絡(luò)體驗。
全景業(yè)務(wù)觀測,智能業(yè)務(wù)、應(yīng)用監(jiān)管
? ? ? ? 智能化、自動化的業(yè)務(wù)監(jiān)管方案,支持可量化、可視化的技術(shù)手段,全面監(jiān)控IT業(yè)務(wù)系統(tǒng)服務(wù)的響應(yīng)性能,幫助用戶準確感知整體業(yè)務(wù)的性能和質(zhì)量狀況。提供業(yè)務(wù)拓撲、可用性撥測、調(diào)用鏈追蹤、業(yè)務(wù)告警、根因定位等能力。
7×24小時不間斷監(jiān)控,運維數(shù)據(jù)大屏展示
? ? ? ? 智和網(wǎng)管平臺平臺內(nèi)置5種大屏樣式與自定義大屏能力,適配各種應(yīng)用場景,二十四小時不間斷監(jiān)控,細粒度可達網(wǎng)絡(luò)中每個設(shè)備、資源和鏈路。所有的網(wǎng)絡(luò)故障都一目了然地呈現(xiàn),大大降低了管理成本,同時也提高了運維人員處理故障的能力,節(jié)省的故障處理時間,為運維人員管理網(wǎng)絡(luò)提供了可靠的保證。
多維度權(quán)限劃分,軟件安全可靠
? ? ? ? 提供給該中心多角色管理員分權(quán)管理網(wǎng)絡(luò)能力,角色與地域權(quán)限立體化管理,使各種角度的運維人員責權(quán)分明。對不同的管理人員分配不同的操作權(quán)限,可以對不同的管理人員分配不同的網(wǎng)絡(luò),做到粗、細粒度的權(quán)限控制,避免越權(quán)管理。同時,針對危險操作,能夠有良好的提示以及提供日志記錄。
二次開發(fā)平臺,具備靈活擴展能力
? ? ? ? 二次開發(fā)平臺在基礎(chǔ)框架、可重用組件和軟件功能之間保持隔離,既確保了快速定制又不損失組件化、架構(gòu)化特性,該中心研發(fā)人員可選中API或代碼的形式對平臺進行二次開發(fā),提高研發(fā)效率。同時,智和信通提供全套開發(fā)資料以及完善的培訓服務(wù),該中心可以隨心定制出符合自身需求的運維監(jiān)控功能。
6.1.4.應(yīng)用價值
? ? ? ? 通過上線智和網(wǎng)管平臺該中心實現(xiàn)兩地三中心設(shè)備集中管理,當出現(xiàn)故障時可進行關(guān)聯(lián)分析,通過跨崗位信息聯(lián)動,為運維人員提供更加便捷的故障分析和處置手段,在降低故障發(fā)生概率的同時,在故障發(fā)生后,“早感知、快定位、急止損、優(yōu)改進”,降低影響范圍。為日常運維保障、高層管理決策提供支撐,助力保障業(yè)務(wù)連續(xù)性。
? ? ? ? 利用圖形、圖表等易于理解的形式,將采集到的網(wǎng)絡(luò)流量數(shù)據(jù)進行整合分析,通過強大的可視化能力對有效信息進行呈現(xiàn),從流量利用方面為網(wǎng)絡(luò)和業(yè)務(wù)穩(wěn)定提供支撐。