網(wǎng)絡(luò)運(yùn)維 設(shè)備管控

如何實(shí)現(xiàn)網(wǎng)絡(luò)安全監(jiān)控運(yùn)維?

無人值守的IDC機(jī)房動(dòng)環(huán)綜合監(jiān)控運(yùn)維

無人值守的IDC機(jī)房動(dòng)環(huán)綜合監(jiān)控運(yùn)維
    馬上咨詢

    ? ? ? ? 企業(yè)數(shù)字化轉(zhuǎn)型以及5G、物聯(lián)網(wǎng)、云計(jì)算、人工智能等新業(yè)態(tài)帶動(dòng)了數(shù)據(jù)中心的發(fā)展,在國家一體化大數(shù)據(jù)中心及“東數(shù)西算”節(jié)點(diǎn)布局的推動(dòng)下,數(shù)據(jù)中心機(jī)房已成為各大企事業(yè)單位維持業(yè)務(wù)正常運(yùn)營的重要組成部分,網(wǎng)絡(luò)設(shè)備、系統(tǒng)、業(yè)務(wù)應(yīng)用數(shù)量與日俱增,規(guī)模逐漸擴(kuò)大,一旦機(jī)房內(nèi)的設(shè)備出現(xiàn)故障,將對(duì)數(shù)據(jù)處理、傳輸、存儲(chǔ)以及整個(gè)業(yè)務(wù)構(gòu)成威脅,若機(jī)房設(shè)備出現(xiàn)故障不能及時(shí)被發(fā)現(xiàn)、處理,不但會(huì)影響整個(gè)業(yè)務(wù)系統(tǒng)的正常運(yùn)行,甚至造成設(shè)備報(bào)廢,使系統(tǒng)陷入癱瘓,造成嚴(yán)重后果和無法挽回的損失。

    ? ? ? ? 尤其對(duì)于銀行、稅務(wù)、證券、電信、電力、大型企業(yè)等需要實(shí)時(shí)交換數(shù)據(jù)的單位的機(jī)房,一旦系統(tǒng)發(fā)生故障,造成的經(jīng)濟(jì)損失更是不可估量,因此,數(shù)據(jù)中心機(jī)房實(shí)時(shí)監(jiān)控管理顯得更為重要。

    第1章 數(shù)據(jù)中心機(jī)房運(yùn)維痛點(diǎn)

    ? ? ? ? 隨著“東數(shù)西算”工程和新基建的加速落地,數(shù)智化技術(shù)正逐漸滲透到各領(lǐng)域。但隨著數(shù)據(jù)中心建設(shè)規(guī)模的逐步擴(kuò)大,必然帶來能耗的大幅增長和機(jī)房設(shè)備數(shù)量的不斷擴(kuò)充,傳統(tǒng)機(jī)房監(jiān)控和管理模式已無法滿足數(shù)據(jù)中心“集中監(jiān)控、統(tǒng)一管理”的需求,運(yùn)維工作面臨大量難題。

    ? ? ? ? (1)數(shù)據(jù)中心機(jī)房內(nèi)的設(shè)備種類繁多,涉及IT、電力、通信、網(wǎng)絡(luò)、消防、安防等,加上虛擬化云架構(gòu)的出現(xiàn)和普及,機(jī)房的復(fù)雜度越來越高,而運(yùn)維管理的復(fù)雜性急劇增加。

    ? ? ? ? (2)數(shù)據(jù)中心機(jī)房內(nèi)的設(shè)備需要長期、不間斷、低能耗、安全可靠的運(yùn)行。一旦發(fā)生故障,需要快速定位,及時(shí)準(zhǔn)確處理,但由于設(shè)備故障處理需經(jīng)過多個(gè)環(huán)節(jié),需要耗費(fèi)大量時(shí)間,導(dǎo)致故障處理時(shí)間較長,影響業(yè)務(wù)的正常運(yùn)行。

    ? ? ? ? (3)作為企業(yè)的核心資產(chǎn)之一,數(shù)據(jù)中心機(jī)房的重要性毋庸置疑,一旦機(jī)房發(fā)生災(zāi)難,恢復(fù)時(shí)間相對(duì)較長,將對(duì)企業(yè)正常運(yùn)營造成較大影響。

    ? ? ? ? (4)數(shù)據(jù)中心機(jī)房設(shè)備量大,但實(shí)際資源利用率往往不高。例如,有些服務(wù)器的CPU利用率、內(nèi)存利用率和磁盤利用率很低,導(dǎo)致機(jī)房的整體資源利用率較低,影響了機(jī)房的運(yùn)行效率。

    ? ? ? ? (5)數(shù)據(jù)中心機(jī)房的檢查工作多依靠人工現(xiàn)場(chǎng)檢測(cè)、紙質(zhì)記錄等方式,智能化程度低,工作繁重,耗時(shí)耗力,卻依然存在不連續(xù)、不及時(shí)、遺漏、錯(cuò)漏等問題。

    ? ? ? ? (6)數(shù)據(jù)中心機(jī)房運(yùn)維工具多樣化,人員學(xué)習(xí)困難,且各工具產(chǎn)生的運(yùn)維數(shù)據(jù)格式不統(tǒng)一,導(dǎo)致運(yùn)維數(shù)據(jù)利用率低下。

    ? ? ? ? (7)快速變化的IT業(yè)務(wù)需求導(dǎo)致資產(chǎn)變更成為常態(tài),依靠Excel等工具進(jìn)行資產(chǎn)管理,無法保障機(jī)房的資產(chǎn)信息能夠準(zhǔn)確及時(shí)變更,長時(shí)間就會(huì)導(dǎo)致,資產(chǎn)數(shù)據(jù)信息逐漸失真。

    第2章 智和信通數(shù)據(jù)中心機(jī)房無人值守方案

    ? ? ? ? 一個(gè)完備的數(shù)據(jù)中心機(jī)房監(jiān)控運(yùn)維系統(tǒng),應(yīng)具備五個(gè)特點(diǎn),一是實(shí)現(xiàn)從及設(shè)備運(yùn)行到機(jī)房環(huán)境的多層次監(jiān)控;二是支持設(shè)置多種豐富的閾值來監(jiān)控危機(jī);三是提供豐富的報(bào)警方式來確保相關(guān)人員能夠接收到告警信息;四是提供可視化的自動(dòng)運(yùn)維編排方式,實(shí)現(xiàn)自動(dòng)巡檢和故障自愈;五是兼容國產(chǎn)軟硬環(huán)境,符合國產(chǎn)信創(chuàng)要求。

    ? ? ? ? 北京智和信通作為自研廠商,核心產(chǎn)品“智和網(wǎng)管平臺(tái)”,通過遠(yuǎn)程監(jiān)控、遠(yuǎn)程配置等技術(shù)手段實(shí)現(xiàn)對(duì)數(shù)據(jù)中心機(jī)房的自動(dòng)運(yùn)行、故障自動(dòng)檢測(cè)、自動(dòng)報(bào)警、自動(dòng)修復(fù)等功能,從而達(dá)到無需人工干預(yù)的狀態(tài),實(shí)現(xiàn)機(jī)房內(nèi)設(shè)備安全穩(wěn)定運(yùn)行,減少人為因素對(duì)設(shè)備運(yùn)行的干擾,從而提高機(jī)房的運(yùn)行效率和安全性。

    北京智和信通 智和網(wǎng)管平臺(tái)機(jī)房監(jiān)控運(yùn)維架構(gòu)

    ? ? ? ? 機(jī)房設(shè)備具有數(shù)量大、種類多、價(jià)值高、使用周期長、使用地點(diǎn)分散、缺少實(shí)時(shí)性管理、管理難度大等特點(diǎn)。智和信通數(shù)據(jù)中心機(jī)房無人值守方案,通過形象化的虛擬場(chǎng)景和真實(shí)數(shù)據(jù)相結(jié)合,增強(qiáng)機(jī)房設(shè)備、設(shè)施數(shù)據(jù)的直觀可視性、提高其利用率。

    ? ? ? ? 在設(shè)備采集層,智和網(wǎng)管平臺(tái)可對(duì)動(dòng)力系統(tǒng)如配電、UPS等,環(huán)境系統(tǒng)如溫濕度、漏水、新風(fēng)系統(tǒng)等,安防系統(tǒng)如煙感、視頻監(jiān)控等,以及其他常規(guī)網(wǎng)絡(luò)設(shè)備、機(jī)柜等進(jìn)行監(jiān)控。

    ? ? ? ? 在集中監(jiān)控層,平臺(tái)部署在應(yīng)用服務(wù)器上,負(fù)責(zé)采集、存儲(chǔ)運(yùn)維數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行分析展示,對(duì)異常數(shù)據(jù)進(jìn)行告警等。

    ? ? ? ? 在智能運(yùn)維層,以實(shí)時(shí)監(jiān)控為基礎(chǔ),結(jié)合自動(dòng)化運(yùn)維和設(shè)備控制,實(shí)現(xiàn)對(duì)機(jī)房的立體管控。提供多種故障預(yù)警通知方式,保證用戶可以即時(shí)獲取故障信息,進(jìn)行干預(yù),并對(duì)實(shí)時(shí)、歷史的機(jī)房數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。

    2.1.數(shù)據(jù)中心機(jī)房架構(gòu)可視化

    ? ? ? ? 北京智和信通通過網(wǎng)絡(luò)架構(gòu)拓?fù)淇梢暬芰?,將網(wǎng)絡(luò)數(shù)據(jù)從離線表格轉(zhuǎn)移至平臺(tái)內(nèi),從靜態(tài)的網(wǎng)絡(luò)架構(gòu)數(shù)據(jù)轉(zhuǎn)化為動(dòng)態(tài)智能拓?fù)?,?shí)現(xiàn)設(shè)備、資源、鏈接、IP等實(shí)時(shí)更新、快速定位。

    2.1.1.2.5D機(jī)房可視化管理

    ? ? ? ? 以2.5D管理視圖對(duì)不同品牌、類型、版本的網(wǎng)絡(luò)設(shè)備、安全設(shè)備、存儲(chǔ)、主機(jī)、中間件、數(shù)據(jù)庫、虛擬化、應(yīng)用服務(wù)、視頻監(jiān)控、動(dòng)力設(shè)備、環(huán)境設(shè)備等進(jìn)行統(tǒng)一、全方位、多層次的綜合管理,實(shí)時(shí)分析資源當(dāng)前性能和運(yùn)行狀態(tài),直觀反映資源的動(dòng)態(tài)變化對(duì)支撐業(yè)務(wù)的影響。

    2.5D機(jī)房監(jiān)控示意圖

    ? ? ? ? 通過不同顏色、圖標(biāo)表示被管理對(duì)象的狀態(tài)信息,助力運(yùn)維人員實(shí)時(shí)了解網(wǎng)絡(luò)架構(gòu)及全網(wǎng)運(yùn)行狀態(tài),快速感知資源、鏈路、流量等異常信息。提供便捷的機(jī)房綜合信息展示方式,可對(duì)機(jī)房狀態(tài)、機(jī)房設(shè)備量、機(jī)房設(shè)備類型等進(jìn)行快速查看。

    2.5D機(jī)房網(wǎng)絡(luò)綜合信息示意圖

    2.1.2.自定義機(jī)房平面結(jié)構(gòu)拓?fù)?/strong>

    ? ? ? ? 方案支持自定義數(shù)據(jù)中心機(jī)房網(wǎng)絡(luò)背景,通過自定義背景、網(wǎng)絡(luò)、設(shè)備圖標(biāo),將機(jī)房中的節(jié)點(diǎn)按照實(shí)際情況進(jìn)行擺放,并可在拓?fù)渲兄苯硬榭礄C(jī)房監(jiān)控的詳細(xì)信息。

    機(jī)房平面結(jié)構(gòu)拓?fù)涫疽鈭D

    2.1.3.機(jī)房機(jī)柜拓?fù)?/strong>

    ? ? ? ? 根據(jù)設(shè)備在機(jī)房和機(jī)柜的實(shí)際位置生成拓?fù)鋱D,直觀、明了地展現(xiàn)與真實(shí)服務(wù)器外觀、服務(wù)狀態(tài)、空閑位置等信息相符的網(wǎng)絡(luò)拓?fù)鋱D。

    機(jī)房機(jī)柜拓?fù)涫疽鈭D

    2.2.數(shù)據(jù)中心資源統(tǒng)一監(jiān)控

    ? ? ? ? 本方案實(shí)現(xiàn)數(shù)據(jù)中心機(jī)房中網(wǎng)絡(luò)設(shè)備、動(dòng)力設(shè)備、環(huán)境設(shè)備、安防設(shè)備等的信息高頻采集,并結(jié)合智能算法,實(shí)現(xiàn)對(duì)數(shù)據(jù)中心機(jī)房的整體架構(gòu)、設(shè)備運(yùn)行狀態(tài)、業(yè)務(wù)可用狀態(tài)的實(shí)時(shí)信息采集和感知。通過對(duì)機(jī)房中海量設(shè)備的智能解析和關(guān)聯(lián)分析,助力運(yùn)維人員從多個(gè)維度實(shí)現(xiàn)對(duì)相應(yīng)告警的智能分析,解決傳統(tǒng)運(yùn)維監(jiān)控中關(guān)聯(lián)數(shù)據(jù)缺失,輔助排障信息不足的問題。

    2.2.1.網(wǎng)絡(luò)設(shè)備監(jiān)控

    ? ? ? ? 方案支持對(duì)機(jī)房內(nèi)網(wǎng)絡(luò)設(shè)備,如:交換機(jī)、防火墻、路由器、服務(wù)器等的性能、故障進(jìn)行監(jiān)測(cè),蔽廠商、型號(hào)差異,掌握機(jī)房整體運(yùn)行情況和運(yùn)行效能,能高效、快速、精準(zhǔn)進(jìn)行故障定位診斷。

    設(shè)備資源可視化顯示?

    2.2.2.動(dòng)力設(shè)備監(jiān)控

    ? ? ? ? 方案實(shí)現(xiàn)市電參數(shù)監(jiān)測(cè)、UPS參數(shù)監(jiān)測(cè)等功能,對(duì)機(jī)房動(dòng)力設(shè)備進(jìn)行實(shí)時(shí)監(jiān)控、集中管控,了解UPS的運(yùn)行狀況,及時(shí)地發(fā)現(xiàn)并解決UPS運(yùn)行中出現(xiàn)的各種問題,保障機(jī)房動(dòng)力系統(tǒng)安全穩(wěn)定。

    2.2.3.環(huán)境設(shè)備監(jiān)控

    ? ? ? ? 實(shí)現(xiàn)機(jī)房煙霧監(jiān)測(cè)、精密空調(diào)監(jiān)測(cè)、溫濕度監(jiān)測(cè)、漏水監(jiān)測(cè)等功能,并在監(jiān)控界面上以圖形形式直觀地表現(xiàn)出來,一旦監(jiān)測(cè)數(shù)據(jù)過安全范圍,系統(tǒng)即時(shí)發(fā)送報(bào)警,為機(jī)房打造安全無憂的運(yùn)維環(huán)境。

    2.2.4.安防設(shè)備監(jiān)控

    實(shí)現(xiàn)視頻監(jiān)控抓拍、門禁狀態(tài)監(jiān)測(cè)等功能,保障機(jī)房安全,降低機(jī)房安全風(fēng)險(xiǎn)。

    ? ? ? ? 本方案可對(duì)不同品牌、不同型號(hào)的攝像頭進(jìn)行統(tǒng)一運(yùn)維,融合網(wǎng)絡(luò)高清、智能分析、多級(jí)管控為一體。支持監(jiān)管視頻監(jiān)控體系涉及的視頻前端設(shè)備(攝像頭、卡口、編解碼器),傳輸設(shè)備(光纖收發(fā)器、EPON 等)內(nèi)場(chǎng)設(shè)備(網(wǎng)絡(luò)與安全設(shè)備、主機(jī)/虛擬機(jī)、存儲(chǔ)設(shè)備)、機(jī)房動(dòng)力環(huán)境等多種設(shè)備,等統(tǒng)一接入、集中管理。

    視頻監(jiān)控效果示意圖

    2.2.5.云資源監(jiān)控

    ? ? ? ? 對(duì)復(fù)雜的多云異構(gòu)環(huán)境、云上云下資源、信創(chuàng)云等進(jìn)行管理,實(shí)現(xiàn)云下服務(wù)器、網(wǎng)絡(luò)設(shè)備、安全設(shè)備、機(jī)房、機(jī)柜、專線、配件等設(shè)施,云上各類云服務(wù)器、云磁盤等云產(chǎn)品以及各類 1P、NAT、DNS 等資源的真正一站式運(yùn)維,并支持對(duì)納管資源的快速擴(kuò)展。

    ? ? ? ? 自動(dòng)監(jiān)測(cè)基礎(chǔ)設(shè)施及資源,其中包括云、混合云、容器、虛擬主機(jī)、網(wǎng)絡(luò)、服務(wù)器、存儲(chǔ)等。對(duì)進(jìn)程、資源利用率、網(wǎng)絡(luò)使用量、性能、日志、事件進(jìn)行監(jiān)測(cè)。基于對(duì)私有云中的系統(tǒng)資源、租戶資源的監(jiān)控,實(shí)現(xiàn)云資源的生命周期管理,通過可視化運(yùn)維編排,進(jìn)行云管理策略預(yù)設(shè)配置、云策略批量/定時(shí)執(zhí)行、智能監(jiān)控巡檢。

    2.2.6.全資源監(jiān)控

    ? ? ? ? 北京智和信通基于機(jī)器學(xué)習(xí)與數(shù)據(jù)分析的無人值守IDC機(jī)房運(yùn)維方案,對(duì)不同類型、不同型號(hào)、不同廠商的機(jī)房設(shè)施進(jìn)行統(tǒng)一監(jiān)控,并通過自動(dòng)發(fā)現(xiàn)技術(shù),生成機(jī)房立體拓?fù)鋱D,將機(jī)柜、設(shè)備、配電柜、溫感、濕感、煙感、空調(diào)、UPS、蓄電池及其他設(shè)備可視化呈現(xiàn)。

    • 對(duì)基礎(chǔ)環(huán)境,包括機(jī)柜位置、空調(diào)、消防、安防、弱電、UPS等,進(jìn)行運(yùn)行維護(hù),保障機(jī)房環(huán)境正常穩(wěn)定。
    • 對(duì)網(wǎng)絡(luò)環(huán)境,包括交換機(jī)、路由器等設(shè)備,以及由這些設(shè)備組成的所有網(wǎng)絡(luò),進(jìn)行網(wǎng)絡(luò)運(yùn)行狀態(tài)監(jiān)控,定期優(yōu)化網(wǎng)絡(luò)配置,提升網(wǎng)絡(luò)運(yùn)營效率。
    • 對(duì)于服務(wù)器和存儲(chǔ),包括小型機(jī)、服務(wù)器、存儲(chǔ)設(shè)備、SAN交換機(jī)等基礎(chǔ)硬件,監(jiān)控其實(shí)時(shí)運(yùn)行狀態(tài),快速對(duì)出現(xiàn)的問題和變更進(jìn)行處理。
    • 對(duì)基礎(chǔ)軟件,包括各種操作系統(tǒng)、數(shù)據(jù)庫、中間件、備份軟件等,進(jìn)行優(yōu)化配置,實(shí)時(shí)監(jiān)控,確??焖偬幚砉收希皶r(shí)進(jìn)行變更、升級(jí)等操作。
    • 對(duì)其他類型設(shè)備,通過自定義設(shè)備類型及其設(shè)備資源的方式,更大地提高了方案對(duì)不同設(shè)備類型的支持能力,真正實(shí)現(xiàn)了對(duì)設(shè)備及其資源的化管理,達(dá)到管控萬物的目標(biāo)。



    2.3.無人值守的異常告警與故障自愈

    2.3.1.實(shí)時(shí)故障預(yù)警,及時(shí)洞察異常信息

    ? ? ? ? 通過統(tǒng)一的故障管理平臺(tái),將各個(gè)模塊中的監(jiān)控信息統(tǒng)一采集、分析,實(shí)現(xiàn)整個(gè)機(jī)房運(yùn)維中各種事件信息、設(shè)備故障、網(wǎng)絡(luò)異常、流量異常等告警,采集數(shù)據(jù)中心機(jī)房內(nèi)所有聯(lián)網(wǎng)設(shè)備,如存儲(chǔ)、服務(wù)器、路由器、交換機(jī)、防火墻、虛擬化、云、UPS、煙感、溫度、漏水、空調(diào)等設(shè)備、資源、應(yīng)用、服務(wù)等的狀態(tài)信息,通過對(duì)告警機(jī)制以及閾值的設(shè)置,即時(shí)獲取準(zhǔn)確的告警信息,快速定位告警設(shè)備,提升告警處理效率,降低因設(shè)備故障帶來的損失。


    2.3.2.異常事件管理

    ? ? ? ? 將事件和告警分離管理,接收設(shè)備/服務(wù)器主動(dòng)發(fā)送的消息,集中處理后,及時(shí)地通知用戶,并可以通過集中的管理界面進(jìn)行管理。接收設(shè)備/服務(wù)器主動(dòng)發(fā)送的消息,更大地提高了管理的主動(dòng)性,通過統(tǒng)一界面集中管理事件,降低了管理的難度。


    2.3.3.無人值守的故障自愈

    ? ? ? ? 以網(wǎng)絡(luò)狀態(tài)監(jiān)控、設(shè)備性能監(jiān)測(cè)為基礎(chǔ),結(jié)合網(wǎng)絡(luò)流量偵測(cè)功能,動(dòng)態(tài)發(fā)現(xiàn)網(wǎng)絡(luò)故障。智能判斷告警類型及級(jí)別,自動(dòng)觸發(fā)預(yù)設(shè)的故障處置流程,復(fù)雜告警指派工單專人處理,常規(guī)告警觸發(fā)安全策略全自動(dòng)處理。


    2.4.無人值守的機(jī)房資源巡檢

    ? ? ? ? 傳統(tǒng)的人工巡檢,尤其是應(yīng)用巡檢,缺乏統(tǒng)一的規(guī)范、標(biāo)準(zhǔn),導(dǎo)致巡檢的范圍和深度都存在一定的局限性,并且是基于人工的手工統(tǒng)計(jì),工作效率比較低,同時(shí)耗費(fèi)較大的人力資源。

    本方案依托平臺(tái)對(duì)機(jī)房設(shè)備、應(yīng)用、系統(tǒng)等預(yù)設(shè)巡檢策略,收集信息數(shù)據(jù)并對(duì)其健康情況進(jìn)行分析。將以前依賴手工進(jìn)行的日常巡檢轉(zhuǎn)換為自動(dòng)化、定時(shí)執(zhí)行的巡檢策略。


    2.5.無人值守的設(shè)備遠(yuǎn)程配置

    ? ? ? ? 網(wǎng)絡(luò)承載的業(yè)務(wù)經(jīng)常發(fā)生變更,面對(duì)業(yè)務(wù)的變更運(yùn)維工程師往往要對(duì)大量設(shè)備進(jìn)行操作,此時(shí)如果依靠工程師逐一登錄設(shè)備進(jìn)行命令下發(fā)、策略配置,將產(chǎn)生大量重復(fù)性的工作,不但導(dǎo)致運(yùn)維效率低下,也不可避免地產(chǎn)生人為配置錯(cuò)誤。

    ? ? ? ? 用戶可通過網(wǎng)頁對(duì)智和網(wǎng)管平臺(tái)進(jìn)行訪問,通過對(duì)納入監(jiān)控的設(shè)備進(jìn)行單獨(dú)、批量的配置操作,設(shè)備策略遠(yuǎn)程配置管理,可以自動(dòng)批量進(jìn)行設(shè)備配置修改,并可對(duì)設(shè)備配置進(jìn)行備份、對(duì)比、恢復(fù),宕機(jī)后設(shè)備配置可快速復(fù)原,保障設(shè)備及時(shí)恢復(fù)運(yùn)行,提升配置效率、質(zhì)量和安全性。


    2.5.1.多類型多廠商設(shè)備支持

    ? ? ? ? 針對(duì)不同類型的設(shè)備,支持進(jìn)行各種控制、配置操作。

    • 對(duì)服務(wù)器/主機(jī)/虛擬化,支持一鍵開關(guān)機(jī)、進(jìn)程管理、應(yīng)用管理、容量管理等
    • 對(duì)交換機(jī)/路由器,支持ACL、QoS、流量策略、端口策略等
    • 對(duì)安全設(shè)備,支持防護(hù)管理、認(rèn)證管理、NAT管理、VPN管理、內(nèi)容控制等
    • 對(duì)數(shù)據(jù)庫/中間件,支持空間管理、池管理、會(huì)話管理、連接控制等
    • 對(duì)傳輸設(shè)備,支持終端管理、鏈路管理、信號(hào)控制、功率配置等
    • 對(duì)其他設(shè)備,支持結(jié)合用戶實(shí)際場(chǎng)景,通過拖拽流程的方式實(shí)現(xiàn)自定義管控策略

    ? ? ? ? 對(duì)不同廠商,如Cisco、HP、Nortel、Juniper、3Com、D-link、Foundry、Dell、Proxim、NetScreen、華為、H3C、銳捷、中興等多家廠商的網(wǎng)絡(luò)設(shè)備。

    2.5.2.設(shè)備策略備份對(duì)比

    ? ? ? ? 方案通過配置文件批量備份、下載、周期性備份、查看等功能,為用戶管理網(wǎng)絡(luò)做出合理的建議提供數(shù)據(jù)支撐。


    2.6.全場(chǎng)景自動(dòng)化運(yùn)維

    ? ? ? ? 隨著數(shù)據(jù)中心建設(shè)規(guī)模和復(fù)雜度的增加,運(yùn)維的工作變得更加繁瑣。在運(yùn)維的工作中,有相當(dāng)大部分工作都是重復(fù)性的指令進(jìn)行操作。將一些重復(fù)性的、邏輯關(guān)系明確的操作工作,如:變更、擴(kuò)容、業(yè)務(wù)部署、監(jiān)控、故障恢復(fù)等以組件、策略的形式托管至平臺(tái)中進(jìn)行維護(hù)和管理,用戶根據(jù)需求從策略庫中選取對(duì)應(yīng)的策略,并采取可視化拖拽的編排方式裝配成運(yùn)維業(yè)務(wù)流程,最后觸發(fā)執(zhí)行即可完成期望的運(yùn)維變更任務(wù),從而實(shí)現(xiàn)高效、穩(wěn)定、安全的智能運(yùn)維。


    2.6.1.全場(chǎng)景實(shí)現(xiàn)自動(dòng)災(zāi)備切換

    ? ? ? ? 通過一鍵啟停的應(yīng)用控制和場(chǎng)景觸發(fā),簡化人工操作,實(shí)現(xiàn)快速災(zāi)備切換。保障在遇到系統(tǒng)故障、業(yè)務(wù)崩潰等災(zāi)難時(shí),自動(dòng)將源端業(yè)務(wù)切換到備端數(shù)據(jù)中心,從而保障業(yè)務(wù)的連續(xù)性,實(shí)現(xiàn)業(yè)務(wù)的高可用。

    2.6.2.靈活編排,多運(yùn)維場(chǎng)景支持

    ? ? ? ? 自動(dòng)化運(yùn)維編排,可實(shí)現(xiàn)完全根據(jù)用戶場(chǎng)景,定制化設(shè)計(jì)運(yùn)維劇本,真正將運(yùn)維任務(wù)托管至平臺(tái),解放人力。

    • 開發(fā)環(huán)境自動(dòng)化,如軟件代碼自動(dòng)化更新、自動(dòng)化編譯、自動(dòng)化打包、自動(dòng)化發(fā)布預(yù)警生產(chǎn)環(huán)境。
    • 應(yīng)用發(fā)布自動(dòng)化,如服務(wù)自動(dòng)化升級(jí)、軟件自動(dòng)化部署等。
    • 故障自愈能力,如網(wǎng)口異常自動(dòng)關(guān)閉、磁盤爆滿自動(dòng)清理、非法設(shè)備入侵阻斷、CPU空間不足自動(dòng)重啟等。
    • 定時(shí)服務(wù)重啟,如在工作日每天晚上定時(shí)關(guān)閉應(yīng)用,每天早上自動(dòng)重啟應(yīng)用等。
    • 智能批量設(shè)備管控,如批量設(shè)備策略執(zhí)行,當(dāng)設(shè)備的配置狀態(tài)不一時(shí),能夠基于當(dāng)前設(shè)備自身的狀態(tài)自動(dòng)決策適合于本設(shè)備的管控操作等。
    • 定期設(shè)備健康狀況自檢,如定期設(shè)備健康狀態(tài)自檢、服務(wù)運(yùn)行狀態(tài)自檢等。
    • 基于HTTP接口自動(dòng)化,如基于HTTP接口的工單自動(dòng)化、審批自動(dòng)化、業(yè)務(wù)自動(dòng)化等。
    • 高可用服務(wù)自動(dòng)切換,如主備數(shù)據(jù)庫運(yùn)行狀況自檢異常自動(dòng)切換,服務(wù)運(yùn)行狀態(tài)檢查主備切換等。
    • 虛擬化、云服務(wù)資源自動(dòng)化擴(kuò)容,如在虛擬化環(huán)境資源不足時(shí)自動(dòng)化根據(jù)實(shí)際情況進(jìn)行擴(kuò)容。
    • 日常運(yùn)維自動(dòng)化,如自動(dòng)化定期執(zhí)行批處理cmd\sh腳本、自動(dòng)化定期數(shù)據(jù)清洗、自動(dòng)化定期環(huán)境檢查并導(dǎo)出報(bào)表等。

    2.6.3.積累形成運(yùn)維知識(shí)庫

    ? ? ? ? 在數(shù)據(jù)中心日常網(wǎng)絡(luò)運(yùn)維服務(wù)中,重復(fù)的故障和請(qǐng)求約占到70%,只有30%的故障真正需要專業(yè)人員來解決,知識(shí)經(jīng)驗(yàn)對(duì)提升重復(fù)工作的效率起到了至關(guān)重要的作用。

    ? ? ? ? 通過智和網(wǎng)管平臺(tái)自動(dòng)化運(yùn)維的能力,將只能有專家處理的各類操作和判斷轉(zhuǎn)化為可存在于平臺(tái)內(nèi)的流程,形成可保留可復(fù)用的運(yùn)維知識(shí),減少因誤操作帶來的損失,保障運(yùn)維效率。以規(guī)范的流程進(jìn)行運(yùn)維作業(yè),保障關(guān)鍵數(shù)據(jù)的完整合規(guī)。

    2.7.全網(wǎng)帶寬、流量監(jiān)控與回溯分析

    ? ? ? ? 方案基于海量流量數(shù)據(jù)的存儲(chǔ)挖掘,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)流量的偵測(cè)分析。通過網(wǎng)絡(luò)流量分析技術(shù),采集、分析、存儲(chǔ)所有網(wǎng)絡(luò)流量,回溯分析數(shù)據(jù)包特征、異常網(wǎng)絡(luò)行為,以多維數(shù)據(jù)分析和深度挖掘?yàn)槭侄危瑢?shí)現(xiàn)數(shù)據(jù)包層面的流量追蹤,發(fā)現(xiàn)潛伏于網(wǎng)絡(luò)中的未知攻擊。


    ? ? ? ? 方案支持大容量、長時(shí)間存儲(chǔ)流量數(shù)據(jù),長期實(shí)時(shí)保存原始數(shù)據(jù)包。通過高效的數(shù)據(jù)檢索,實(shí)現(xiàn)流量數(shù)據(jù)的快速回溯。對(duì)已發(fā)生的流量行為進(jìn)行回溯分析,迅速定位異常流量,對(duì)其進(jìn)行挖掘、分析、取證,實(shí)現(xiàn)多維根因追溯,為迅速定位問題發(fā)生原因提供更分析依據(jù),同時(shí)為網(wǎng)絡(luò)安全提供強(qiáng)有力的數(shù)據(jù)分析保障。

    2.8.業(yè)務(wù)可用性管理

    ? ? ? ? 本方案以保障業(yè)務(wù)可用性為基礎(chǔ),通過對(duì)承載業(yè)務(wù)的IT基礎(chǔ)設(shè)施構(gòu)建真實(shí)的業(yè)務(wù)模型。

    ? ? ? ? 方案通過構(gòu)建業(yè)務(wù)系統(tǒng)與部門、IT資源及關(guān)鍵指標(biāo)的關(guān)聯(lián)關(guān)系,整合前端、應(yīng)用、后臺(tái)任務(wù)、外部服務(wù)、數(shù)據(jù)庫及基礎(chǔ)設(shè)施,直觀呈現(xiàn)面向服務(wù)的業(yè)務(wù)系統(tǒng)體系架構(gòu);通過影響傳遞,準(zhǔn)確反映設(shè)備異常對(duì)核心業(yè)務(wù)、用戶造成的影響和威脅,并對(duì)造成業(yè)務(wù)影響的故障進(jìn)行實(shí)時(shí)告警,快速查明導(dǎo)致業(yè)務(wù)中斷的故障源,幫助運(yùn)維人員做出及時(shí)響應(yīng),保障業(yè)務(wù)連續(xù)性。

    業(yè)務(wù)系統(tǒng)示意圖

    2.8.1.業(yè)務(wù)可用性撥測(cè)分析

    ? ? ? ? 針對(duì)業(yè)務(wù)應(yīng)用性能與用戶體驗(yàn)進(jìn)行檢測(cè)分析,直觀、便捷地幫助運(yùn)維人員對(duì)數(shù)據(jù)中心涉及的辦公系統(tǒng)、交易系統(tǒng)、支付系統(tǒng)、官網(wǎng)、手機(jī)APP系統(tǒng)等進(jìn)行監(jiān)控,掌握業(yè)務(wù)的運(yùn)行狀態(tài)和健康水平,了解業(yè)務(wù)動(dòng)態(tài)變化趨勢(shì),快速定位故障源,降低運(yùn)營風(fēng)險(xiǎn)。

    業(yè)務(wù)看板示意圖

    2.8.2.業(yè)務(wù)瓶頸根因定位

    ? ? ? ? 方案實(shí)現(xiàn)完整全鏈路調(diào)用鏈追蹤,包含詳細(xì)的調(diào)用鏈訪問路徑和性能等訪問信息,以及相關(guān)的各類請(qǐng)求參數(shù)等業(yè)務(wù)數(shù)據(jù)指標(biāo),為故障定位、根因分析提供詳盡的參考數(shù)據(jù)。

    業(yè)務(wù)拓?fù)涫疽鈭D

    ? ? ? ? 通過業(yè)務(wù)數(shù)據(jù)可視化能力,既可集中呈現(xiàn)業(yè)務(wù)數(shù)據(jù)的用戶體驗(yàn)狀態(tài),也可以基于應(yīng)用、設(shè)備實(shí)時(shí)監(jiān)控、呈現(xiàn)業(yè)務(wù)各節(jié)點(diǎn)的實(shí)時(shí)運(yùn)行狀態(tài),包括用戶體驗(yàn)、節(jié)點(diǎn)可用性、節(jié)點(diǎn)負(fù)載等狀態(tài)信息。基于自定義閾值自動(dòng)監(jiān)測(cè),異常指標(biāo)自動(dòng)觸發(fā)告警,快速定位業(yè)務(wù)瓶頸根因,并可根據(jù)用戶自愈策略,觸發(fā)自動(dòng)運(yùn)維實(shí)現(xiàn)故障自愈。

    2.9.可視化數(shù)據(jù)分析

    ? ? ? ? 利用圖形、圖表、圖表等易于理解的形式,提取和分析大量復(fù)雜的數(shù)據(jù)中心網(wǎng)絡(luò)中各類運(yùn)維數(shù)據(jù),呈現(xiàn)分析結(jié)果,從而幫助運(yùn)維人員在短時(shí)間內(nèi)更好地理解和獲得更多的信息,幫助運(yùn)維部門能夠?qū)崟r(shí)了解業(yè)務(wù)和其所依賴IT資源的運(yùn)行狀況,以及提供系統(tǒng)運(yùn)維和優(yōu)化的指示和依據(jù)。

    數(shù)據(jù)中心大屏示意圖

    2.9.1.多設(shè)備性能對(duì)比分析

    ? ? ? ? 方案支持選擇多個(gè)設(shè)備進(jìn)行同維度性能數(shù)據(jù)分析,提供可視化性能對(duì)比視圖。如用戶獲知宿主機(jī)的CPU利用率逐漸增加,即可對(duì)其中的虛擬機(jī)性能進(jìn)行對(duì)比分析,以定位高消耗的虛擬機(jī),快速找到性能瓶頸節(jié)點(diǎn)。


    2.10.資產(chǎn)全生命周期監(jiān)管

    ? ? ? ? 對(duì)于數(shù)據(jù)中心的網(wǎng)絡(luò)資產(chǎn)管理,采取統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn),對(duì)整體網(wǎng)絡(luò)資產(chǎn)進(jìn)行梳理和調(diào)用,避免資產(chǎn)信息在運(yùn)維系統(tǒng)和實(shí)物間的差異,減少網(wǎng)絡(luò)運(yùn)維過程中信息不一致、數(shù)據(jù)不統(tǒng)一等問題通過平臺(tái)將資產(chǎn)實(shí)物與運(yùn)維數(shù)據(jù)庫一一對(duì)應(yīng),解決網(wǎng)絡(luò)設(shè)備在日常運(yùn)維過程中出現(xiàn)“脫管”或“半脫管”的問題,實(shí)現(xiàn)對(duì)整體數(shù)據(jù)中心網(wǎng)絡(luò)內(nèi)IP、ARP、MAC接口數(shù)據(jù),訪問控制信息,應(yīng)用系統(tǒng)信息,網(wǎng)絡(luò)地址及性能容量、設(shè)備資產(chǎn)配置容量、機(jī)房布線容量信息的集中管理。


    2.11.定制化運(yùn)維工單體系

    ? ? ? ? 通過方案實(shí)現(xiàn)運(yùn)維工單“無紙化”,支持于設(shè)備和故障管理頁面快速創(chuàng)建工單,把控故障處理進(jìn)度,通過工單平臺(tái)簡化故障處理流程,形成自動(dòng)化故障處理機(jī)制,并在每個(gè)處理流程的節(jié)點(diǎn)上責(zé)任到人,實(shí)現(xiàn)在快速響應(yīng)故障的同時(shí),實(shí)現(xiàn)兼顧運(yùn)維流程管控。

    ?

    第3章 自主研發(fā)安全可控 適配國產(chǎn)信創(chuàng)環(huán)境

    ? ? ? ? 信創(chuàng)產(chǎn)業(yè)包含了從IT底層的基礎(chǔ)軟硬件到上層應(yīng)用軟件的全產(chǎn)業(yè)鏈的安全可控,涵蓋了應(yīng)用軟件、信息安全、IT基礎(chǔ)設(shè)施、基礎(chǔ)軟件四個(gè)領(lǐng)域。其中,基礎(chǔ)軟件是信息系統(tǒng)更核心的部件,是保障信息系統(tǒng)安全的重要陣地和防線,其創(chuàng)新應(yīng)用與自主可控關(guān)系到國家安全和利益,也是產(chǎn)業(yè)自主發(fā)展的基礎(chǔ)。


    ? ? ? ? 本方案支持部署運(yùn)行在中標(biāo)麒麟、銀河麒麟、紅旗Linux等國產(chǎn)操作系統(tǒng),支持在達(dá)夢(mèng)、金倉、神州等國產(chǎn)數(shù)據(jù)庫進(jìn)行數(shù)據(jù)存儲(chǔ),通過東方通等國產(chǎn)中間件提供對(duì)外服務(wù)[8],支持龍芯、申威等國產(chǎn)CPU架構(gòu),并實(shí)現(xiàn)對(duì)國產(chǎn)化CPU、服務(wù)器、數(shù)據(jù)庫、中間件等IT軟硬件設(shè)備的綜合監(jiān)控與運(yùn)維管理。

    第4章 雙機(jī)熱備,保障災(zāi)備恢復(fù)

    ? ? ? ? 方案支持雙機(jī)熱備功能,平臺(tái)使用兩臺(tái)服務(wù)器,互相備份,共同執(zhí)行同一服務(wù)。當(dāng)一臺(tái)服務(wù)器出現(xiàn)故障時(shí),可以由另一臺(tái)服務(wù)器承擔(dān)服務(wù)任務(wù),在不需要人工干預(yù)的情況下,自動(dòng)保證系統(tǒng)能持續(xù)提供服務(wù),在發(fā)生服務(wù)器故障時(shí),可以保持系統(tǒng)的可用性。


    第5章 方案應(yīng)用價(jià)值

    ? ? ? ? 通過部署智和信通無人值守的數(shù)據(jù)中心機(jī)房運(yùn)維方案,對(duì)機(jī)房中的網(wǎng)絡(luò)設(shè)備、UPS電源、機(jī)房環(huán)境系統(tǒng)、供配電系統(tǒng)、空調(diào)系統(tǒng)、門禁系統(tǒng)、視頻監(jiān)控系統(tǒng)等進(jìn)行監(jiān)管。將機(jī)房場(chǎng)景和虛擬數(shù)據(jù)進(jìn)行結(jié)合,提高機(jī)房設(shè)備的管理、設(shè)施數(shù)據(jù)的直觀可視化。

    ? ? ? ? 通過簡明易懂操作界面,讓用戶能更輕松地掌握全局,高效地處理突發(fā)事件,從故障根源解決問題,做到數(shù)據(jù)中心機(jī)房管理的實(shí)時(shí)化,智能化、網(wǎng)絡(luò)化;使用戶實(shí)現(xiàn)方便,安全,可靠,準(zhǔn)確,無人值守的數(shù)據(jù)中心機(jī)房管理。