了解最新公司動態(tài)及行業(yè)資訊
隨著網(wǎng)絡(luò)的快速發(fā)展,各大運營商由于業(yè)務(wù)的多樣性,部署了數(shù)以萬計的IT設(shè)備。 設(shè)備的種類、制造商和型號很多。 現(xiàn)場運維團隊人工巡檢無法滿足業(yè)務(wù)需求,也增加了人力成本,因此需要一套成熟的小型數(shù)據(jù)中心IT監(jiān)控系統(tǒng)來支撐日常運維。
一、什么是IT運維監(jiān)控
一般我們把IT設(shè)備分為:主機、數(shù)通、存儲、系統(tǒng)、數(shù)據(jù)庫、中間件等,還包括虛擬化、云化、物聯(lián)網(wǎng)的一些設(shè)備,而IT運維監(jiān)控是指一種技術(shù)手段采集IT設(shè)備指標,保證系統(tǒng)和業(yè)務(wù)管理軟件的正常運行。
2、運維監(jiān)控分類
1、基于監(jiān)控指標的描述對象可分為硬件級監(jiān)控和系統(tǒng)級監(jiān)控:
(1)硬件級監(jiān)控:主要采集設(shè)備的一些固件信息(廠商、大小、序列號等)和工作狀態(tài)指標(溫度、速度、電壓、到位狀態(tài)等)。
(2)系統(tǒng)級監(jiān)控:主要采集操作系統(tǒng)、中間件、應(yīng)用程序的一些運行信息(CPU、內(nèi)存、磁盤使用率等)。
2. 基于監(jiān)控指標的采集方式分為帶外指標監(jiān)控和帶內(nèi)指標監(jiān)控:
(1)帶外指標監(jiān)控:通過專用的硬件管理收集帶外監(jiān)控指標。
(2) 帶內(nèi)指標監(jiān)控:通過在監(jiān)控對象上部署插件或網(wǎng)絡(luò)合約來采集帶內(nèi)監(jiān)控指標。
三、常用監(jiān)控技術(shù)
1. 帶外采集
(1)IPMI監(jiān)控
一套獨立于操作系統(tǒng)運行的管理系統(tǒng)依賴于特殊的硬件模塊。 雖然業(yè)務(wù)操作系統(tǒng)沒有加載或關(guān)閉,但它仍然可以工作。 由于IPMI合約的制定比較簡單,各個廠商在標準中擴展了很多實用的功能,而擴展的功能缺乏統(tǒng)一的標準,而且大部分的采集命令和解析規(guī)則不具有通用性,降低了采集難度對于監(jiān)控方。
一些常用的命令包括:??...fru,...sdr,,show等。據(jù)悉,還可以通過SSH合約登錄IPMI管理操作系統(tǒng)執(zhí)行采集命令。
(2)
由于IPMI擴展性差,自身存在安全隱患,IPMI也在2015年公布了2.0v1.1標準,將不再更新,將永久替代。 英特爾也宣布不再維護它。 它是一種基于HTTPs服務(wù)的管理標準。 它具有安全性、高度可擴展的管理()、人類可讀的數(shù)據(jù)接口()等特點,可以基于現(xiàn)有硬件實現(xiàn)。
2.帶內(nèi)采集
(1)代理監(jiān)控
Agent監(jiān)控就是通過在被監(jiān)控對象上部署一套插件來監(jiān)控系統(tǒng)的各項指標。 Agent可以獨立完成指標采集和簡單分析,然后將結(jié)果傳輸給端,增加了數(shù)據(jù)處理的工作量和對服務(wù)器的性能要求。 主要用于收集虛擬機和數(shù)據(jù)庫。 通過代理采集中心的任務(wù)分發(fā)和節(jié)點控制,通過分布式架構(gòu),實現(xiàn)采集能力的便捷垂直擴展。
(2)SNMP合約
SNMP合約主要是一種網(wǎng)絡(luò)設(shè)備的集合技術(shù)。 和IPMI一樣,各廠商型號的設(shè)備對MIB庫的支持和擴展差異較大it運維技術(shù),指標定義不同也會增加監(jiān)控的難度。
(3) SSH/合約
通過SSH/連接被監(jiān)控設(shè)備,然后執(zhí)行采集命令或運行腳本并將運行結(jié)果傳輸?shù)奖O(jiān)控終端實現(xiàn)監(jiān)控。 這些方式較為靈活,但存在一定的操作安全風險。
四。 概括
IT運維監(jiān)控技術(shù)有效緩解了IT系統(tǒng)數(shù)量多、系統(tǒng)復(fù)雜度高的問題,大大提高了運維人員的工作效率。 未來,IT運維監(jiān)控技術(shù)必然與AI技術(shù)相結(jié)合it運維技術(shù),利用AI技術(shù)實現(xiàn)運維智能化、高效化、高質(zhì)量發(fā)展。