了解最新公司動態(tài)及行業(yè)資訊
近年來,軟件世界發(fā)生了巨大變化。從操作系統(tǒng)、數(shù)據(jù)庫等底層基礎設施,到分布式系統(tǒng)、大數(shù)據(jù)、云計算、機器學習等基礎領域,從單體應用、MVC、基于服務,到基于微服務等應用開發(fā)模式從IaaS、PaaS等從CaaS到FaaS,運維技術(尤其是大型復雜分布式系統(tǒng)的運維)越來越重要,成為IT企業(yè)提高生產(chǎn)力的核心.
隨著運維越來越受到重視,運維體系逐漸豐富,出現(xiàn)了研發(fā)、測試、運維等概念。容器技術從底層重構運維,打通開發(fā)、測試、部署、運維全流程,進一步推動運維系統(tǒng)從工具化向平臺化、自動化的逐步遷移和聰明。本文將從下到上對運維技術進行一次徹底的梳理和盤點。
微服務
微服務是近年來提出的概念。它通過將應用解耦成多個服務來提高模塊化程度,更容易理解、開發(fā)、測試和部署服務器運維技術,更適合小團隊快速迭代協(xié)同開發(fā)。同時,每個服務也可以使用不同的技術來促進持續(xù)演進。業(yè)界領先的互聯(lián)網(wǎng)公司已經(jīng)構建了微服務框架(例如基于Boot/Cloud等開源項目),以應對其在快速迭代過程中的業(yè)務復雜性和效率。最近,微服務配置管理、容器化部署、自動化測試、微服務治理、微服務監(jiān)控、安全、容錯等領域也越來越受到關注。
SRE
SRE (Site, ) 是谷歌的最佳實踐,用于服務的容量規(guī)劃和實施,保證服務的可靠性和性能,在軟件基礎設施層面構建自動化工具來代替人工操作,從而以更好地應對其業(yè)務復雜且不斷變化的需求。
& CI/CD
容器逐漸成為軟件開發(fā)的主流,近兩年迅速成長為核心,在持續(xù)集成、持續(xù)部署、持續(xù)發(fā)布等方面受到越來越多的關注。隨著新的自動化工具的不斷涌現(xiàn),容器及其相關生態(tài)系統(tǒng)(尤其是容器編排工具及其對有狀態(tài)服務的支持)的成熟,以及微服務的廣泛應用,越來越多的相關工具將在不斷的集成中在集成過程中,自動化持續(xù)測試也將變得更加流行,以更有效地控制質量、確保安全、降低成本、控制風險、提高效率,并更有效地支持復雜的大規(guī)模分布式應用程序。
容器優(yōu)化與實踐
在過去的幾年中,核心容器技術不斷發(fā)展,以其易于構建、分發(fā)和部署的特性成為 IT 基礎設施中的關鍵技術。容器技術通過標準化運行環(huán)境,連接應用開發(fā)、測試和運維。它簡單、輕量、高度可移植,可以更有效地利用資源,并能有效解決軟件依賴問題,提高研發(fā)效率,降低研發(fā)成本。因此,業(yè)界不斷通過容器優(yōu)化其軟件發(fā)布。將現(xiàn)有應用程序容器化的過程。
然而,容器技術本身也面臨著諸多挑戰(zhàn)。未來在容器標準化、容器安全、容器網(wǎng)絡、容器存儲方面還有很大的提升空間,特別是對數(shù)據(jù)庫等有狀態(tài)服務的支持。容器的可管理性和易用性也有待進一步提高。
容器編排和管理
隨著其他容器技術的廣泛應用,容器編排和管理也越來越受到重視,涌現(xiàn)出Yu、Mesos、Swarm Mode等優(yōu)秀的開源生態(tài)和解決方案。他們試圖將當前以資源為中心的管理方式轉變?yōu)橐詰贸绦驗橹行牡墓芾矸绞?,并嘗試將應用程序的基礎組件(如配置、服務、負載均衡等)標準化,以實現(xiàn)更好的可管理性。隨著CaaS的發(fā)展,私有或公有容器云越來越多,越來越成熟,用戶體驗也越來越好,從而顯著降低遷移成本。
但在大規(guī)模實踐中,灰度發(fā)布、資源調度、隔離、運維監(jiān)控、日志記錄等仍需進一步成熟和規(guī)范??鐢?shù)據(jù)中心應用管理、支持混合云環(huán)境、跨云服務 遷移、安全等方面仍存在困難和挑戰(zhàn)。
自動化運維
隨著虛擬化、容器化等技術的出現(xiàn),運維管理的復雜度和難度大大增加。因此,必須通過專業(yè)化、標準化、流程化的方式來實現(xiàn)運維的自動化。行業(yè)內提升效率的自動化工具有很多,如、Chef等。各大主流互聯(lián)網(wǎng)公司也在逐步從工具自動化向一站式自動化運維管理平臺演進,實現(xiàn)部署的一站式處理,配置、監(jiān)控、告警等,實現(xiàn)資源和流程的標準化統(tǒng)一,應用運行狀態(tài)可視化管理,提高運維質量,降低運維成本。
智能運維
隨著監(jiān)控范圍的不斷擴大,其產(chǎn)生的數(shù)據(jù)具有多樣性、多維性、非結構化的特點,并可能與業(yè)務數(shù)據(jù)相關。傳統(tǒng)的人工分析處理方法效率低、成本高。隨著大數(shù)據(jù)和人工智能的興起,越來越多的智能分析算法也被應用到運維領域。智能報警和故障自動恢復發(fā)揮更大作用,從而進一步降低運維成本。
運維基礎設施
運維基礎設施涵蓋網(wǎng)絡、機器、機房、機架、存儲等管理,涉及基礎資源、機架設計與交付、網(wǎng)絡架構設計、數(shù)據(jù)架構規(guī)劃、操作系統(tǒng)、系統(tǒng)軟件、環(huán)境交付、機器報廢更換等方向。
業(yè)界已經(jīng)構建了CMDB來支持服務交付流程和相應的管理流程,也構建了相應的初始化、部署、運行、監(jiān)控、日志等工具。隨著虛擬化、容器化、云計算的發(fā)展,運維基礎設施也從提供資源轉變?yōu)樘峁┠芰?,從而提高了基礎設施對上層應用的透明性,從而提高了基礎設施的靈活性。
數(shù)據(jù)庫運維
數(shù)據(jù)庫運維涉及數(shù)據(jù)庫部署架構、容量規(guī)劃、性能調優(yōu)、數(shù)據(jù)備份與恢復、數(shù)據(jù)遷移、數(shù)據(jù)庫監(jiān)控與審計、數(shù)據(jù)庫運維管理、故障排除等一系列服務。
隨著互聯(lián)網(wǎng)的廣泛使用,數(shù)據(jù)庫運維也呈現(xiàn)出新的形式。近年來,在遠程多活、在線表模式變更、海量數(shù)據(jù)遷移、故障排查等部署方式中,通過一系列工具盡可能減少數(shù)據(jù)庫整體不可用時間,從而盡可能減少對用戶的影響。影響。同時,為了簡化數(shù)據(jù)庫的部署和管理,以容器化的方式管理和調度數(shù)據(jù)庫逐漸成為熱點之一。最后,通過對數(shù)據(jù)庫中各項指標的分析挖掘,提供智能診斷解決方案,提前預測和控制風險,提高處理效率,提高系統(tǒng)整體穩(wěn)定性。
大數(shù)據(jù)運維
隨著數(shù)據(jù)的快速增長服務器運維技術,底層生態(tài)系統(tǒng)也發(fā)揮著越來越重要的作用。涵蓋離線計算、流式計算、即席查詢等使用方式。Spark、Kafka、Hbase、Storm等也應運而生。等優(yōu)秀的開源項目。在大數(shù)據(jù)平臺的運維中,由于分布式架構、多源異構數(shù)據(jù)存儲、數(shù)據(jù)處理框架更加多樣化和復雜等問題,大數(shù)據(jù)的運維也變得異常復雜。
大數(shù)據(jù)運維的主要目標是提高資源利用率,降低大數(shù)據(jù)系統(tǒng)運維的復雜度,提高用戶友好度。其中,計算資源的統(tǒng)一管理和調度能力、基于容器的各類大數(shù)據(jù)系統(tǒng)的混合部署能力、快速彈性伸縮能力、跨數(shù)據(jù)中心容災能力、大數(shù)據(jù)應用監(jiān)控能力,以及快速靈活的故障定位能力也變得越來越重要。
運維監(jiān)控
監(jiān)控是IT系統(tǒng)運維中保證核心服務穩(wěn)定性和可用性的重要環(huán)節(jié)。涵蓋網(wǎng)絡、主機、業(yè)務、應用、性能等方面,涉及故障快速通知、故障準確定位、性能分析診斷等。目前業(yè)界比較流行和廣泛使用的開源監(jiān)控軟件有Cacti、Cacti等。
隨著應用規(guī)模的迅速擴大和微服務、容器等技術的快速發(fā)展,新的監(jiān)控形式應運而生。監(jiān)控方式也從類式演變?yōu)榱魇?,基于監(jiān)控指標對海量數(shù)據(jù)進行流式傳輸,并通過可視化平臺實時展示這些監(jiān)控指標。此外,隨著基礎設施變得更加動態(tài)化,監(jiān)控不僅關心單個節(jié)點的運行狀態(tài),還關心整個應用程序的健康狀況。全鏈路跟蹤等技術也應運而生并得到廣泛應用。
運維安全
在互聯(lián)網(wǎng)化、移動化的背景下,應用逐漸上云,傳統(tǒng)邊界越來越模糊,安全也有了新的發(fā)展趨勢。過去,安全技術主要是防御,使用傳統(tǒng)的防火墻和入侵防御系統(tǒng)?,F(xiàn)在,除了加強傳統(tǒng)的安全措施外,還將威脅建模、自動安全掃描、安全功能測試等安全實踐引入開發(fā)過程,從而降低安全風險,縮短安全問題的反饋周期。同時,安全也從提前預防轉向持續(xù)檢測和快速響應。通過對攻擊行為的持續(xù)檢測,可以對安全事件進行快速響應,
游戲開發(fā)與運維
近年來,網(wǎng)絡游戲的發(fā)展非常迅速,使用通用框架和引擎進行游戲開發(fā)的趨勢越來越明顯。在游戲運維方面,除了常規(guī)的運維方式外,游戲也有自己的特點。首先,由于端游、網(wǎng)頁游戲和手游的形式不同,在組網(wǎng)方式、發(fā)行渠道、生命周期長短等方面存在差異。因此,網(wǎng)絡接入、多通道分布、容量規(guī)劃、網(wǎng)絡時延、文件數(shù)據(jù)高可靠接入的運維等方面都帶來了挑戰(zhàn)。
其次,由于用戶增長的不可預測性,游戲運維必須具備快速擴容和縮容能力,且多采用混合云或公有云技術架構,最大限度地發(fā)揮其橫向擴展能力。最后,在發(fā)生大規(guī)模DDOS異常流量攻擊時,游戲運維應具備多級流量清洗保護機制和服務降級能力,盡可能保證可用性。
互聯(lián)網(wǎng)金融與運維
近年來,互聯(lián)網(wǎng)金融出現(xiàn)井噴式發(fā)展,也為其注入了科技創(chuàng)新基因。微服務、容器化、大數(shù)據(jù)、云計算等技術為互聯(lián)網(wǎng)金融的快速迭代提供了基礎。但是,與現(xiàn)在的應用運維相比,互聯(lián)網(wǎng)金融行業(yè)有自己的特點。在數(shù)據(jù)留存、安全合規(guī)、抗攻擊能力、支付結算、金融監(jiān)管、數(shù)據(jù)安全、大數(shù)據(jù)風控、高級別安全防護等方面有自己的特色。其他方面也有強烈的需求甚至是強制性的金融監(jiān)管規(guī)范,這也對互聯(lián)網(wǎng)金融的運維提出了更高的挑戰(zhàn)。
極客時尚黑科技
有趣且易于理解的云計算