智和信通助力某大型服飾集團(tuán)建設(shè)綜合監(jiān)控運(yùn)維

智和信通助力某大型服飾集團(tuán)建設(shè)綜合監(jiān)控運(yùn)維

? ? ? ? 某大型服飾集團(tuán)成立于90年代,是廣受認(rèn)可的國民生活時(shí)尚品牌,近年來隨著集團(tuán)公司業(yè)務(wù)規(guī)模的不斷擴(kuò)大,信息化作為支撐集團(tuán)公司業(yè)務(wù)發(fā)展的重要技術(shù)手段,信息系統(tǒng)無論在規(guī)模上還是在復(fù)雜程度上均有了很大程度的增加。

項(xiàng)目現(xiàn)狀

? ? ? ? 當(dāng)前信息系統(tǒng)龐大規(guī)模與復(fù)雜的結(jié)構(gòu),為數(shù)字中心的運(yùn)維管理能力帶來極大挑戰(zhàn)。由于數(shù)字中心還是以分散的工具化產(chǎn)品、結(jié)合手工為主的運(yùn)維模式,導(dǎo)致目前運(yùn)維工作多是局部的、分散的,各項(xiàng)運(yùn)維工作之間缺乏聯(lián)動,沒有形成整體的運(yùn)維管理體系。

? ? ? ? 設(shè)備類型:交換機(jī)、防火墻、負(fù)載均衡、AC、無線AP、上網(wǎng)行為管理等。

? ? ? ? 設(shè)備品牌:華為、華三、思科、銳捷、戴爾、飛塔、F5、網(wǎng)康、深信服、優(yōu)特普、極進(jìn)extreme、iKuai、博科brocade、山石網(wǎng)科、Radware、TP-LINK等

? ? ? ? 設(shè)備數(shù)量:2500臺

項(xiàng)目期望

? ? ? ? 面對運(yùn)維現(xiàn)狀,數(shù)據(jù)中心期望有一整套完整的監(jiān)控運(yùn)維平臺,實(shí)現(xiàn)對整個(gè)集團(tuán)公司的IT基礎(chǔ)設(shè)施進(jìn)行全面、集中管理。有效地從根本上解決運(yùn)維工作中存在的基礎(chǔ)資源臺賬管理不統(tǒng)一、數(shù)據(jù)不準(zhǔn)確,監(jiān)控手段有限、系統(tǒng)故障發(fā)現(xiàn)不及時(shí),問題定位難、解決慢等突出問題。

  • IT設(shè)備分布在多個(gè)城市的不同園區(qū),急需解決網(wǎng)絡(luò)架構(gòu)、設(shè)備間鏈接關(guān)系無法可視化呈現(xiàn)的難題,清晰定位設(shè)備節(jié)點(diǎn)位置;
  • 現(xiàn)有設(shè)備類型繁多,且隨著信息化的建設(shè),設(shè)備類型和數(shù)量在不斷增長,更需要一款可擴(kuò)展、可兼容不斷變化的設(shè)備的監(jiān)控運(yùn)維產(chǎn)品;
  • 實(shí)時(shí)監(jiān)測網(wǎng)絡(luò)流量,尤其是每個(gè)園區(qū)與互聯(lián)網(wǎng)連接的出口流量;
  • 運(yùn)維人員長期處于“救火”狀態(tài),出現(xiàn)問題往往耗時(shí)耗力地需要從頭排查,極易造成服務(wù)性能下降或業(yè)務(wù)停機(jī)時(shí)間偏長;
  • 改善依靠部分運(yùn)維管理工具和人工日常巡檢相結(jié)合的管理方式,釋放因IT資產(chǎn)增加而逐漸增大的運(yùn)維壓力;
  • 提升對網(wǎng)絡(luò)資源實(shí)際使用情況的實(shí)時(shí)感知能力,減少因性能瓶頸造成的業(yè)務(wù)緩慢、死機(jī)等被動響應(yīng)的情況;
  • 實(shí)現(xiàn)對業(yè)務(wù)系統(tǒng)從基礎(chǔ)硬件到上層服務(wù)的體系化監(jiān)控,定位業(yè)務(wù)異常根因。


智和信通方案

? ? ? ? 考慮到用戶復(fù)雜的網(wǎng)絡(luò)場景,智和信通確定采用分布式部署的方案進(jìn)行平臺部署,在每個(gè)園區(qū)分別部署一臺采集服務(wù)器采集本園區(qū)內(nèi)設(shè)備的各類性能、故障信息;在IDC機(jī)房部署智和網(wǎng)管平臺進(jìn)行全量集中管理。

跨地域多園區(qū)網(wǎng)絡(luò)集中管理、可視化展示

? ? ? ? 通過智能發(fā)現(xiàn)技術(shù),將跨地域多園區(qū)中的IT設(shè)備自動發(fā)現(xiàn)出來,并以圖形化、具象化的拓?fù)湫问秸宫F(xiàn)設(shè)備間的聯(lián)動關(guān)系與實(shí)時(shí)狀態(tài)信息,幫助運(yùn)維人員實(shí)時(shí)了解網(wǎng)絡(luò)架構(gòu)及全網(wǎng)運(yùn)行狀態(tài),快速感知資源、鏈路、流量等異常信息。


多品牌型號設(shè)備統(tǒng)一納管、差異監(jiān)控

? ? ? ? 在拓?fù)鋱D的基礎(chǔ)上,進(jìn)一步展示設(shè)備的細(xì)節(jié),將用戶網(wǎng)絡(luò)內(nèi)不同類型、不同品牌、不同型號的設(shè)備統(tǒng)一納管,并根據(jù)用戶需求差異化配置監(jiān)控指標(biāo),指標(biāo)包括但不限于以下內(nèi)容。

  • 交換機(jī)狀態(tài)、響應(yīng)時(shí)間、運(yùn)行時(shí)間、電源狀態(tài)、CPU使用率、內(nèi)存使用率、網(wǎng)口狀態(tài)、接收/發(fā)送流量、發(fā)送/丟包率、接收/發(fā)送帶寬使用率等;
  • 防火墻:響應(yīng)時(shí)間、CPU使用率、內(nèi)存使用率、溫度網(wǎng)口狀態(tài)、接收/發(fā)送流量、發(fā)送/丟包率、接收/發(fā)送帶寬使用率等;
  • 無線AC狀態(tài)、響應(yīng)時(shí)間、運(yùn)行時(shí)間、電源狀態(tài)、CPU使用率、內(nèi)存使用率、網(wǎng)口狀態(tài)、接收/發(fā)送流量、發(fā)送/丟包率、接收/發(fā)送帶寬使用率、AP指標(biāo)等;
  • 無線AP:狀態(tài)、響應(yīng)時(shí)間、IP地址、設(shè)備名稱、接口數(shù)量、內(nèi)存大小、SSID、接收/發(fā)送流量、接收/發(fā)送帶寬、射頻傳輸重傳幀比率、射頻傳輸錯(cuò)誤幀比率、射頻傳輸總幀數(shù)、關(guān)聯(lián)的站點(diǎn)總數(shù)、關(guān)聯(lián)失敗的站點(diǎn)總數(shù)、當(dāng)前連接用戶數(shù)、當(dāng)前斷開連接用戶數(shù)、成功驗(yàn)證的用戶的在線時(shí)間等;
  • 負(fù)載均衡狀態(tài)、響應(yīng)時(shí)間、運(yùn)行時(shí)間、CPU使用率、內(nèi)存使用率等;
  • 行為管理:狀態(tài)、響應(yīng)時(shí)間、cpu使用率、內(nèi)存使用率、硬盤使用率、活躍用戶數(shù)、上線用戶數(shù)、高速緩存狀態(tài)、日志中心服務(wù)狀態(tài)


統(tǒng)一告警管理和故障自愈

? ? ? ? 方案通過統(tǒng)一的故障中心,將各個(gè)模塊中的監(jiān)控信息統(tǒng)一采集、分析,實(shí)現(xiàn)整個(gè)網(wǎng)絡(luò)中各種事件信息、設(shè)備故障、業(yè)務(wù)異常、流量異常等告警,以智能化手段進(jìn)行標(biāo)準(zhǔn)化的分析、壓縮、并歸關(guān)聯(lián)等,通過站內(nèi)消息、郵件、釘釘?shù)姆绞綄?shí)時(shí)傳達(dá)告警信息,保證落實(shí)到指定人員進(jìn)行處理。

? ? ? ? 與此同時(shí),結(jié)合平臺的運(yùn)維編排功能,通過拖拽編排的形式將用戶對常規(guī)告警的處置方式轉(zhuǎn)化為依托平臺的自定義工作流,在發(fā)生告警時(shí),自動觸發(fā)處置流程,從而實(shí)現(xiàn)故障自愈。

IT設(shè)備全自動化巡檢

? ? ? ? 結(jié)合用戶真實(shí)的巡檢工作要求,自定義配置巡檢策略,細(xì)化巡檢范圍,自動執(zhí)行巡檢操作,并將巡檢結(jié)果通過郵件的形式推送給任務(wù)負(fù)責(zé)人,實(shí)現(xiàn)對設(shè)備的定期檢查。

設(shè)備異常trap和syslog轉(zhuǎn)告警

? ? ? ? 接收設(shè)備主動發(fā)送的各類事件與日志消息,集中存儲、解析處理后,將錯(cuò)誤、告警、攻擊行為等異常信息轉(zhuǎn)化為告警,及時(shí)地通知用戶進(jìn)行處置。通過統(tǒng)一界面集中管理事件與日志,提高其完整性和可追溯性,幫助用戶快速定位問題并采取相應(yīng)的解決措施。

運(yùn)營業(yè)務(wù)撥測與分析

? ? ? ? 通過構(gòu)建業(yè)務(wù)分析模型,將集團(tuán)內(nèi)部的供應(yīng)鏈系統(tǒng)、郵件系統(tǒng)、物流系統(tǒng)、直播分析系統(tǒng)、OA系統(tǒng)等納入平臺進(jìn)行撥測分析。部署可視化業(yè)務(wù)拓?fù)?,將業(yè)務(wù)相關(guān)的基礎(chǔ)設(shè)施和應(yīng)用可視化顯示并有效量化,將其狀態(tài)映射到他們所支持的業(yè)務(wù)上,直觀反映IT基礎(chǔ)設(shè)施的動態(tài)變化對業(yè)務(wù)造成的影響和威脅。

出口流量透視分析

? ? ? ? 將出口設(shè)備納入流量透視平臺,通過sFlow協(xié)議從設(shè)備、接口、IP、服務(wù)、應(yīng)用、會話、協(xié)議層級進(jìn)行實(shí)時(shí)監(jiān)測與回溯分析識別帶寬消耗較大的應(yīng)用程序、服務(wù)、協(xié)議或 IP 地址,避免網(wǎng)絡(luò)容量過載,并提升最終用戶網(wǎng)絡(luò)體驗(yàn)。

運(yùn)維數(shù)據(jù)可視化和領(lǐng)導(dǎo)視圖

? ? ? ? 利用圖形、圖表、圖表等形式,直觀呈現(xiàn)網(wǎng)絡(luò)中運(yùn)維數(shù)據(jù)分析、處理的結(jié)果,尤其是網(wǎng)絡(luò)專線大屏,動圖呈現(xiàn)專線線路的流入/流出速率、丟包率、延時(shí)、抖動等核心指標(biāo),為用戶提供網(wǎng)絡(luò)優(yōu)化的方向和依據(jù)。

應(yīng)用價(jià)值

? ? ? ? 在部署智和網(wǎng)管平臺后,數(shù)據(jù)中心將集團(tuán)內(nèi)交換機(jī)、防火墻、負(fù)載均衡、AC、無線AP、上網(wǎng)行為管理等IT設(shè)備進(jìn)行集中管理,保障這些IT基礎(chǔ)設(shè)施及其支撐的各類業(yè)務(wù)系統(tǒng)長期穩(wěn)定運(yùn)行。同時(shí)得益于智和網(wǎng)管平臺強(qiáng)大的模型庫擴(kuò)展能力,數(shù)據(jù)中心實(shí)現(xiàn)了對不同品牌、型號設(shè)備在不同應(yīng)用場景下的差異化監(jiān)控,不僅能夠?qū)崟r(shí)對每臺設(shè)備的運(yùn)行狀態(tài)進(jìn)行關(guān)鍵指標(biāo)的監(jiān)測,還可以通過預(yù)設(shè)告警閾值,及時(shí)捕捉并處理潛在性能瓶頸和故障風(fēng)險(xiǎn),有效預(yù)防業(yè)務(wù)中斷。

? ? ? ? 在對用戶運(yùn)維場景進(jìn)行充分調(diào)研后,通過平臺內(nèi)自動化運(yùn)維編排功能,通過編寫運(yùn)維工作流,實(shí)現(xiàn)了日常巡檢、故障自愈、軟件升級、設(shè)備配置備份與恢復(fù)等日常運(yùn)維任務(wù),在極大地減輕運(yùn)維人員負(fù)擔(dān)的同時(shí),提高了工作效率,保障操作的一致性和準(zhǔn)確性。

? ? ? ? 在保障監(jiān)控準(zhǔn)確性的同時(shí),智和信通也兼顧了用戶體驗(yàn),通過大量的數(shù)據(jù)分析和可視化功能,運(yùn)維人員可以直觀地查看IT設(shè)備的性能趨勢、故障分布、業(yè)務(wù)系統(tǒng)健康度等關(guān)鍵數(shù)據(jù),為決策提供有力數(shù)據(jù)支撐。

? ? ? ? 展望未來,隨著集團(tuán)信息化建設(shè)的不斷擴(kuò)展和數(shù)字化轉(zhuǎn)型的逐步深入,數(shù)據(jù)中心也將面臨更多元化的挑戰(zhàn)。北京智和信通作為數(shù)據(jù)中心的一體化監(jiān)控平臺,也將持續(xù)引入更先進(jìn)的智能技術(shù),以更智能的方式預(yù)測并應(yīng)對數(shù)據(jù)中心未來可能存在的風(fēng)險(xiǎn),助力集團(tuán)的IT基礎(chǔ)設(shè)施成為支撐業(yè)務(wù)持續(xù)發(fā)展的堅(jiān)定基石。