? ? ? ? 當前,云計算、大數(shù)據(jù)、人工智能等IT技術(shù)迅猛發(fā)展,企業(yè)的信息化步入了一個嶄新的時代,企業(yè)規(guī)模不斷壯大,業(yè)務不斷拓展,企業(yè)信息化依賴的網(wǎng)絡結(jié)構(gòu)和IT技術(shù)越來越復雜。因建設時期等原因,企業(yè)網(wǎng)絡中分布著不同時期、不同廠商、不同型號的IT設備,運維人員需頻繁切換不同廠商的管理平臺對其進行管理,監(jiān)控的效率不高,后期擴展困難,同時無法和企業(yè)的業(yè)務情況結(jié)合起來,無法提供足夠的安全管控功能,致使難以高效地開展運維工作。
? ? ? ? 針對此種情況,北京智和信通提出多廠商網(wǎng)管統(tǒng)一運維方案,對接集成異構(gòu)廠商的自有網(wǎng)管系統(tǒng),運維人員僅需登錄智和網(wǎng)管平臺一個軟件,即可對網(wǎng)絡內(nèi)所有的不同廠商的設備進行管理,通過統(tǒng)一界面即可調(diào)用各設備廠商網(wǎng)管的功能。
第1章?采用分級部署,高效管理海量設備?
? ? ? ? 采用智和網(wǎng)管平臺-設備網(wǎng)管系統(tǒng)-設備的結(jié)構(gòu),部署多級架構(gòu)運維平臺方案,智和網(wǎng)管平臺獲取下級設備網(wǎng)管的監(jiān)控信息,并進行集中展示。智和網(wǎng)管平臺可以管理所有設備,設備網(wǎng)管系統(tǒng)對本品牌的設備進行管理。每級可以單獨監(jiān)控各自的網(wǎng)絡設備,也可以由綜合運維平臺集中管理。實現(xiàn)上級智和網(wǎng)管平臺對各設備網(wǎng)管中納管的網(wǎng)絡設備運行數(shù)據(jù)的采集、管理、存儲。
部署方案優(yōu)勢:
第2章 復用現(xiàn)有功能,實現(xiàn)異構(gòu)廠商設備集中管理
? ? ? ? 憑借多年運維開發(fā)經(jīng)驗,北京智和信通支持與設備廠商網(wǎng)管進行集成對接,目前已與華為、中興、華三、烽火、思科等設備廠商的對接測試,智和網(wǎng)管平臺內(nèi)拓撲觀測、綜合監(jiān)控、業(yè)務分析、統(tǒng)一告警、數(shù)據(jù)分析展示、資產(chǎn)管理、工單管理等監(jiān)控運維功能以及開次開發(fā)模塊均可直接使用。
? ? ? ? (1)拓撲觀測模塊:提供直觀形象的拓撲圖繪制能力,以圖形方式輕松實現(xiàn)網(wǎng)絡設備、資源、鏈路狀態(tài)直觀展示,并以聲光進行告警提醒。通過一目了然的網(wǎng)絡拓撲,為網(wǎng)絡故障的實時發(fā)現(xiàn)和有效處理提供便利。
? ? ? ? (2)綜合監(jiān)控模塊:以提供全方位網(wǎng)絡監(jiān)控功能,管理聯(lián)網(wǎng)設備為目標,深入用戶需求,實現(xiàn)個性化網(wǎng)絡監(jiān)控解決方案。監(jiān)控設備類型覆蓋網(wǎng)絡設備、服務器、交換機、中間件、數(shù)據(jù)庫、安全設備、應用服務等;監(jiān)測指標涵蓋連通性、可用性、負載、使用率、系統(tǒng)進程等。
? ? ? ? (3)業(yè)務分析模塊:前端用戶體驗、網(wǎng)絡延遲到后端的業(yè)務服務和基礎(chǔ)架構(gòu),全棧溯源為用戶提供端到端的完整全鏈路數(shù)據(jù)融合和關(guān)聯(lián)分析,為用戶快速發(fā)現(xiàn)業(yè)務性能瓶頸,提升用戶體驗奠定基礎(chǔ)。
? ? ? ? (4)統(tǒng)一告警模塊:充分利用積累的有效定障、排障經(jīng)驗,打通告警中心、監(jiān)控中心、工單中心等關(guān)聯(lián)數(shù)據(jù),實現(xiàn)從告警檢測到排障恢復的全生命周期閉環(huán)管理。
? ? ? ? (5)數(shù)據(jù)分析模塊:提供可視化數(shù)據(jù)分析能力,對網(wǎng)絡海量數(shù)據(jù)進行圖形化分析展示。通過直觀的圖表和圖形化手段清晰有效地將運維數(shù)據(jù)分析結(jié)果進行傳達,幫助用戶由宏觀到微觀更快地了解網(wǎng)絡運維現(xiàn)狀,做出更具時效性的決策。
? ? ? ? (6)資產(chǎn)管理模塊:提供標準化資產(chǎn)錄入、個性化資產(chǎn)模板設置、自定義資產(chǎn)分類和資產(chǎn)二維碼管理等功能。通過資產(chǎn)管理模塊將資產(chǎn)實物與運維數(shù)據(jù)庫一一對應,為用戶提供更加便捷高效資產(chǎn)生命周期管理,資產(chǎn)跟蹤、維護和統(tǒng)計分析。
? ? ? ? (7)工單管理模塊:具備基礎(chǔ)工單和運維工單能力,提供自定義工單模板、配置智能工單服務水平(SLA)、我的工單、所有工單展示及實時工單狀態(tài)展示等功能。通過運維工單形成自動化故障處理機制,并在每個流程節(jié)點上責任到人,在快速響應故障的同時,兼顧企業(yè)流程管控。
? ? ? ? (8)二次開發(fā)模塊:提供6大開發(fā)模式,在智和網(wǎng)管平臺已有功能基礎(chǔ)上,支持模塊式或代碼式的開發(fā)形式,以便在更短的時間內(nèi)滿足定制需求。同時提供全套開發(fā)資料及完備的培訓服務,支撐用戶隨心定制出運維監(jiān)控平臺,并對平臺功能不斷更新,以滿足日益變化的管理需求。
2.1.打破異構(gòu)品牌隔離,全網(wǎng)設備集中展示
? ? ? ? 整合各設備廠商網(wǎng)管輸出的設備信息,在拓撲圖上以圖形方式輕松實現(xiàn)網(wǎng)絡設備及資源、鏈路狀態(tài)的整體觀測,并以聲光進行告警提醒。通過一目了然的網(wǎng)絡架構(gòu)呈現(xiàn)方式,提供高可用的網(wǎng)絡態(tài)勢感知能力,為網(wǎng)絡故障的實時發(fā)現(xiàn)和有效處理提供便利。
? ? ? ? 以2.5D管理視圖對不同品牌、類型、版本的網(wǎng)絡設備、安全設備、存儲、主機、中間件、數(shù)據(jù)庫、虛擬化、應用服務、視頻監(jiān)控、動力設備、環(huán)境設備等進行統(tǒng)一、全方位、多層次的綜合管理,實時分析資源當前性能和運行狀態(tài),直觀反映資源的動態(tài)變化對支撐業(yè)務的影響。真實展示機柜及柜內(nèi)設備狀態(tài),直觀呈現(xiàn)機柜總U位數(shù)、使用U位數(shù)以及剩余U位數(shù),機房機柜容量數(shù)字化直觀展示。
2.2.匯總各全網(wǎng)設備關(guān)鍵指標,網(wǎng)絡態(tài)勢綜合呈現(xiàn)
? ? ? ? 將各設備廠商網(wǎng)管輸出的關(guān)鍵指標信息通過可視化圖形的方式匯總、分析、呈現(xiàn),實時反映網(wǎng)絡態(tài)勢,助力用戶掌控網(wǎng)絡變化趨勢
2.3.統(tǒng)一告警信息處置,形成告警閉環(huán)管理
? ? ? ? 一體化集中管理各設備廠商網(wǎng)管系統(tǒng)生成的告警信息,橫跨網(wǎng)絡監(jiān)控、日志管理、流量透視、IP合規(guī)監(jiān)測應用等場景,全量匯聚異常告警信息,基于故障模型和AI算法分析故障原因,分析、壓縮、并歸關(guān)聯(lián)故障信息,降低故障風暴,秒級定位故障位置,主動出擊快速排障,故障處置全流程展示。
? ? ? ? 平臺提供界面顏色、聲光、告警列表、Email、釘釘、企業(yè)微信等多種通知渠道,告警通知無延遲,告警渠道全覆蓋。告警可以向上逐步追溯,按照從全局→網(wǎng)絡→設備→資源的管理習慣來組織故障顯示。
? ? ? ? 支持快速的故障定位,能一步定位到發(fā)生故障的源頭設備,及時處理好故障,有效地預防故障發(fā)生。支持以拓撲圖的方式回放歷史告警下的設備告警變化、拓撲圖和鏈路告警變化,支持快進、后退等播放操作。
? ? ? ? 告警發(fā)生中,自動關(guān)聯(lián)調(diào)取內(nèi)置的故障處置預案,協(xié)助運維人員進行排障處理;通過觸發(fā)告警自愈及自動派單能力,快速實現(xiàn)排障處置;在故障消失后,系統(tǒng)能自動檢測到先前故障,并作自動清除告警處理。
? ? ? ? 采集告警信息,將告警信息數(shù)據(jù)按照時間、資源、性能類型等多種維度以圖表等形式展現(xiàn)。通過豐富的、可自定義的多維度報表,實現(xiàn)平臺內(nèi)所有模塊告警的統(tǒng)一管理分析,從變化趨勢、告警關(guān)聯(lián)、排障處置等多方面、多視角洞察告警態(tài)勢。
? ? ? ? 將各類運維操作、故障判斷等經(jīng)驗,轉(zhuǎn)化為存在于平臺內(nèi)的知識,形成團隊知識庫,提升整體運維效率。
2.4.從人工到自動化跨廠商設備巡檢
? ? ? ? 傳統(tǒng)的人工巡檢,尤其是應用巡檢,缺乏統(tǒng)一的規(guī)范、標準,導致巡檢的范圍和深度都存在一定的局限性,并且是基于人工的手工統(tǒng)計,工作效率比較低,同時耗費較大的人力資源。本方案依托平臺將以前依賴手工進行的日常巡檢轉(zhuǎn)換為自動化、定時執(zhí)行的巡檢策略,日常例行巡檢、節(jié)假日和重要事件前的巡檢均可自動化執(zhí)行。
? ? ? ? 通過制定統(tǒng)一的巡檢指標、巡檢方式、巡檢頻度等,保證巡檢標準化、巡檢范圍、巡檢深度;通過設計巡檢作業(yè)、數(shù)據(jù)采集方式、自動化作業(yè)調(diào)度等實現(xiàn)日常巡檢的自動化,代替手工工作,提高效率的同時,解放管理人員,釋放管理人員更多的精力,使更多的精力處理更重要的事項。
2.5.日志與事件集中管理,異常自動轉(zhuǎn)告警
? ? ? ? 將事件和告警分離管理,接收設備/服務器主動發(fā)送的消息,集中處理后,及時地通知用戶,并可以通過集中的管理界面進行管理。通過智能解析策略,將異常信息自動轉(zhuǎn)化為告警信息,由統(tǒng)一界面集中展示,更大地提高了管理的主動性,降低了管理的難度。
2.6.IP地址分配與管理
? ? ? ? 方案支持端到端規(guī)劃、部署、管理和監(jiān)控IP 地址。通過智能IP掃描能力,定義多層次子網(wǎng),然后掃描其范圍內(nèi)每個IP地址的當前狀態(tài),包括IP地址,MAC地址等信息,也可以查看IP段內(nèi)地址使用詳情,便于學校進行IP地址分配管理等。
可手動、自動獲取子網(wǎng)信息,并根據(jù)網(wǎng)絡結(jié)構(gòu)對子網(wǎng)信息進行管理。定時獲取全網(wǎng)的MAC-IP信息,并自動保存,可根據(jù)MAC或IP對在線設備進行查詢。以端口圖的形式顯示當前網(wǎng)段內(nèi)端口的使用情況。
? ? ? ? 支持通過端口視圖及列表視圖的形式,展示當前IP地址的使用情況,可查看某個子網(wǎng)的IP現(xiàn)網(wǎng)詳情信息,如IP、掩碼、主機名、設備類型、現(xiàn)網(wǎng)MAC、現(xiàn)網(wǎng)接入設備、現(xiàn)網(wǎng)接入端口、規(guī)劃MAC、規(guī)劃接入設備、使用人等,可批量分配IP地址。
? ? ? ? 通過追蹤IP地址的歷史關(guān)聯(lián)MAC、接入設備/端口變更記錄等與規(guī)劃綁定MAC、規(guī)劃接入設備/端口進行對比分析,當與規(guī)劃不一致時生成一條異常記錄,從而審核IP/MAC是否正確使用。通過黑白名單功能用來檢測用戶所關(guān)心的設備是否在網(wǎng)絡中出現(xiàn)及出現(xiàn)時間。支持配置黑名單或白名單,智能劃撥規(guī)劃表中的IP、MAC設置為白名單策略,對非法接入設備進行告警處置。
? ? ? ? 對全網(wǎng)MAC和IP進行配對綁定,并周期性對MAC-IP進行檢測。自動將規(guī)劃表中的IP-MAC設置為綁定關(guān)系,自動掃描在線終端,當IP-MAC的綁定關(guān)系發(fā)生沖突時產(chǎn)生告警,保證入網(wǎng)終端安全可信。
2.7.彈性擴展,滿足網(wǎng)絡發(fā)展需求
? ? ? ? 對于沒有自身網(wǎng)管系統(tǒng)的設備,可通過智和網(wǎng)管平臺直接納管,支持設備及資源彈性伸縮,滿足網(wǎng)絡中設備量持續(xù)增長及更新的需求。可對設備類型模型進行擴展,可自定義新設備的類型、圖標、類型識別策略;可對設備資源模型進行擴展,自定義新設備類型的網(wǎng)口、指示燈、風扇、電源的圖標、識別發(fā)現(xiàn)策略;可自定義設備面板圖,以拖拽、鼠標操作完成設備面板模板的制作;支持故障和性能擴展。
? ? ? ? 通過自定義設備類型及其設備資源,更大限度上提高了智和網(wǎng)管平臺的管理范圍,真正實現(xiàn)了對設備及其資源的化管理,達到管控萬物的目標。
第3章 跨廠商設備管理,構(gòu)建端到端業(yè)務運維體系
? ? ? ? 通過構(gòu)建業(yè)務系統(tǒng)與部門、IT資源及關(guān)鍵指標的關(guān)聯(lián)關(guān)系,整合前端、應用、后臺任務、外部服務、數(shù)據(jù)庫及基礎(chǔ)設施,直觀呈現(xiàn)面向服務的業(yè)務系統(tǒng)體系架構(gòu);通過影響傳遞,準確反映設備異常對核心業(yè)務、用戶造成的影響和威脅,并對造成業(yè)務影響的故障進行實時告警,快速查明導致業(yè)務中斷的故障源,幫助運維人員做出及時響應,保障業(yè)務連續(xù)性。
3.1.業(yè)務可用性撥測分析
? ? ? ? 針對業(yè)務應用性能與用戶體驗進行檢測分析,無需安裝插件即可提供開箱即用的主動撥測試業(yè)務監(jiān)測。從前端用戶體驗、網(wǎng)絡延遲到后端業(yè)務服務和基礎(chǔ)架構(gòu),全棧溯源為用戶提供端到端完整全鏈路數(shù)據(jù)融合和關(guān)聯(lián)分析,為用戶快速發(fā)現(xiàn)業(yè)務性能瓶頸,提升用戶體驗奠定基礎(chǔ)。
? ? ? ? 直觀、便捷地幫助運維人員對業(yè)務、應用進行監(jiān)控,掌握業(yè)務的運行狀態(tài)和健康水平,了解業(yè)務動態(tài)變化趨勢,快速定位故障源,降低運營風險。
3.2.全量業(yè)務調(diào)用鏈追蹤
? ? ? ? 方案實現(xiàn)完整全鏈路調(diào)用鏈追蹤,包含詳細的調(diào)用鏈訪問路徑和性能等訪問信息,以及相關(guān)的各類請求參數(shù)等業(yè)務數(shù)據(jù)指標,為故障定位、根因分析提供詳盡的參考數(shù)據(jù)。
? ? ? ? 通過構(gòu)建包含各業(yè)務整體流程的調(diào)用依賴關(guān)系圖譜,展示業(yè)務部署中網(wǎng)絡設備間多維度關(guān)系拓撲。對從業(yè)務的前臺受理到真正完成的整個業(yè)務流程所依賴的業(yè)務應用、服務器、中間件、數(shù)據(jù)庫、操作系統(tǒng)等進行實時監(jiān)控分析,通過可視化的方式呈現(xiàn)業(yè)務健康狀況,聯(lián)動設備監(jiān)控,快速定位導致業(yè)務健康指數(shù)波動的原因,保障核心業(yè)務流程穩(wěn)定、高效。
3.3.業(yè)務瓶頸根因定位
? ? ? ? 方案通過業(yè)務數(shù)據(jù)可視化能力,既可集中呈現(xiàn)業(yè)務數(shù)據(jù)的用戶體驗狀態(tài),也可以基于應用、設備實時監(jiān)控、呈現(xiàn)業(yè)務各節(jié)點的實時運行狀態(tài),包括用戶體驗、節(jié)點可用性、節(jié)點負載等狀態(tài)信息?;谧远x閾值自動監(jiān)測,異常指標自動觸發(fā)告警,快速定位業(yè)務瓶頸根因,并可根據(jù)用戶自愈策略,觸發(fā)自動運維實現(xiàn)故障自愈。
第4章 整合各設備網(wǎng)管監(jiān)控數(shù)據(jù),可視化展示
? ? ? ? 異構(gòu)網(wǎng)絡中各廠商網(wǎng)管系統(tǒng)及各業(yè)務系統(tǒng)產(chǎn)生的海量數(shù)據(jù)無法得到深層次的應用,管理者決策缺乏數(shù)據(jù)依據(jù),難以參考各類網(wǎng)絡業(yè)務指標、數(shù)據(jù)等實現(xiàn)對運行態(tài)勢、隱患風險的實時掌控及運營管理。
? ? ? ? 為解決此難題,智和信通混合云智能運維方案對全網(wǎng)運維數(shù)據(jù)進行整合分析、分層級地進行直觀的圖形、圖表、圖例等展示,從而幫助運維人員在短時間內(nèi)更好地理解和獲得更多的信息,幫助運維中心能夠?qū)崟r了解業(yè)務和其所依賴IT資源的運行狀況,以及提供系統(tǒng)運維和優(yōu)化的指示和依據(jù)。
4.1.監(jiān)控運維駕駛艙
? ? ? ? 適配各種應用場景,二十四小時不間斷監(jiān)控,細粒度可達網(wǎng)絡中每個設備、資源和鏈路。所有的網(wǎng)絡故障都一目了然地呈現(xiàn),大大降低了管理成本,同時也提高了運維人員處理故障的能力,節(jié)省的故障處理時間,為運維人員管理網(wǎng)絡提供了可靠的保證。
4.2.多設備性能對比報告
? ? ? ? 方案支持選擇多設備進行同維度性能數(shù)據(jù)分析,提供可視化性能對比視圖。如用戶獲知宿主機的CPU利用率逐漸增加,即可對其中的虛擬機性能進行對比分析,以定位高消耗的虛擬機,快速找到性能瓶頸節(jié)點。
4.3.多維度數(shù)據(jù)分析展示
? ? ? ? 提供多維數(shù)據(jù)的統(tǒng)計功能,并通過多種類型的圖表展現(xiàn),使用戶對整體網(wǎng)絡有一個直觀的了解,通過數(shù)據(jù)分析,把握網(wǎng)絡狀況為決策提供依據(jù)。
第5章 更多協(xié)同運維能力,提升異構(gòu)設備運營價值5.1.資產(chǎn)整合管理
? ? ? ? 對于企業(yè)各類資產(chǎn)管理,采取統(tǒng)一數(shù)據(jù)標準進行梳理和調(diào)用,避免資產(chǎn)信息在運維系統(tǒng)和實物間的差異,減少網(wǎng)絡運維過程中信息不一致、數(shù)據(jù)不統(tǒng)一等問題通過平臺將資產(chǎn)實物與運維數(shù)據(jù)庫一一對應,解決網(wǎng)絡設備在日常運維過程中出現(xiàn)“脫管”或“半脫管”的問題。
? ? ? ? 建立健全資產(chǎn)臺賬,實現(xiàn)一機一檔,通過自定義多級資產(chǎn)分類,細化資產(chǎn)類別,實現(xiàn)物資資產(chǎn)、虛擬資產(chǎn)、云資產(chǎn)分類管控,通過在橫向上納管異構(gòu)云平臺,在縱向上理清異構(gòu)跨層級資產(chǎn)間的對應關(guān)系,從根本上解決IT資源割裂、分散的問題,提高資產(chǎn)精細管理程度。
? ? ? ? 從資產(chǎn)入庫、領(lǐng)用、變更、維修、調(diào)撥、到報廢處置,資產(chǎn)每一步操作均實現(xiàn)完整記錄,支持追溯,通過平臺實現(xiàn)資產(chǎn)整個生命周期的全流程閉環(huán)管理,使得IT資產(chǎn)每一次生命周期變更,都有流程可依、都有跡可循,從而實現(xiàn)IT資產(chǎn)監(jiān)管。
5.2.運維工單無紙化流轉(zhuǎn)
? ? ? ? 通過方案實現(xiàn)運維工單“無紙化”,支持于設備和故障管理頁面快速創(chuàng)建工單,把控故障處理進度,通過工單平臺簡化故障處理流程,形成自動化故障處理機制,并在每個處理流程的節(jié)點上責任到人,實現(xiàn)在快速響應故障的同時,實現(xiàn)兼顧運維流程管控。
? ? ? ? 通過建立工單服務基準,預設工單在不同優(yōu)先級、不同狀態(tài)時,受理人應該響應的時間及未響應時的處理方式,生成工單自動化處理規(guī)則,并以多種方式進行通知,避免時響應提升全流程服務管理質(zhì)量。
5.3.全網(wǎng)帶寬、流量透視
? ? ? ? 隨著政企用戶數(shù)字化轉(zhuǎn)型和上云的加速,其業(yè)務、應用層出不窮,對網(wǎng)絡帶寬的需求越來越高,正常的業(yè)務需要良好的帶寬環(huán)境保障機制,避免被一些與業(yè)務無關(guān)的雜事干擾,影響工作效率。方案對混合云路網(wǎng)絡全局流量和帶寬實時監(jiān)控,將出入雙方向流量情況可視化展現(xiàn)。基于海量流量數(shù)據(jù)的存儲挖掘,統(tǒng)計分析流量峰值、谷值、流量趨勢、設備流量等數(shù)據(jù),為網(wǎng)絡流量管理提供數(shù)據(jù)支撐。
第6章 兼容信創(chuàng)國產(chǎn)生態(tài)
? ? ? ? 智和信通提供的信創(chuàng)運維方案,立足于北京智和信通10年的國產(chǎn)融合經(jīng)驗,與國產(chǎn)軟硬件產(chǎn)品深度適配,方案所涉及的產(chǎn)品與模塊,均由北京智和信通自主研發(fā),從功能模塊、數(shù)據(jù)庫、界面全部基于統(tǒng)一Java技術(shù)平臺和統(tǒng)一數(shù)據(jù)關(guān)系模型,不包含任何第三方功能庫。
? ? ? ? 方案實現(xiàn)對國產(chǎn)云、信創(chuàng)云、國產(chǎn)服務器的統(tǒng)一納管,也支持在中標麒麟、銀河麒麟、紅旗Linux等國產(chǎn)操作系統(tǒng)上運行,支持在達夢、金倉、神州等國產(chǎn)數(shù)據(jù)庫進行數(shù)據(jù)存儲,通過東方通等國產(chǎn)中間件提供對外服務,支持龍芯、申威等國產(chǎn)CPU架構(gòu),助力用戶業(yè)務應用的國產(chǎn)化環(huán)境改造。在支撐用戶構(gòu)建信創(chuàng)環(huán)境的同時,也針對各類信創(chuàng)設備、服務組件等提供相應的運維服務,在降本增效的同時,促進政企用戶業(yè)務創(chuàng)新發(fā)展。