不卡av在线播放_欧美成人AU在线看_亚洲一区二区 视频_五月天亚洲无码伊人

Article / 文章中心

阿里云田濤濤:高效智能的云,CloudOps讓運(yùn)維更簡單

發(fā)布時(shí)間:2022-01-07 點(diǎn)擊數(shù):932

12月21日,在阿里云彈性計(jì)算年度峰會(huì)上,阿里云彈性計(jì)算體驗(yàn)與控制系統(tǒng)負(fù)責(zé)人田濤濤發(fā)表了主題為《高效智能的云,CloudOps讓運(yùn)維更簡單》的演講,深度解讀了云上運(yùn)維新趨勢CloudOps,并詳細(xì)介紹了阿里云CloudOps自動(dòng)化運(yùn)維套件的新產(chǎn)品。

正文3.JPG

阿里云彈性計(jì)算體驗(yàn)與控制系統(tǒng)負(fù)責(zé)人田濤濤

 

本文主要根據(jù)田濤濤的演講整理成文,內(nèi)容分為三部分:

  1. 從Ops in Cloud 到CloudOps;
  2. 以應(yīng)用為中心的自動(dòng)化運(yùn)維;
  3. CloudOps(云上自動(dòng)化運(yùn)維)白皮書發(fā)布。

 

01  從Ops in Cloud 到CloudOps


1、DevOps落地實(shí)踐的痛點(diǎn)

1-痛點(diǎn).jpg


DevOps從提出到現(xiàn)在已經(jīng)有12年了,很多企業(yè)已經(jīng)開始踐行DevOps,并且取得了非常好的成功。但是,企業(yè)在DevOps落地實(shí)踐過程中遇到了不同的挑戰(zhàn):

? DevOps轉(zhuǎn)型前:很多企業(yè)會(huì)發(fā)現(xiàn)缺乏DevOps專家;DevOps的投入初期非常重,需要組織變革與調(diào)整;內(nèi)部工具能力弱,隨著業(yè)務(wù)發(fā)展,很多DevOps工具已經(jīng)不能夠滿足企業(yè)的需求。


? DevOps實(shí)踐過程中,關(guān)注點(diǎn)會(huì)發(fā)生轉(zhuǎn)移:組織效能方面,更加關(guān)注如何實(shí)現(xiàn)高效敏捷地交付;在架構(gòu)設(shè)計(jì)方面,關(guān)注如何理清架構(gòu)之間的依賴關(guān)系,快速地交付應(yīng)用,做異地或者多活遷移;自助服務(wù)方面,越來越多的企業(yè)選擇使用自助服務(wù),根據(jù)Gartner《中國DevOps調(diào)查研究報(bào)告(2021年)》,到2025年會(huì)有75%大企業(yè)將自助服務(wù)看作DevOps應(yīng)用最重要的趨勢。


? DevOps演進(jìn)趨勢上,越來越多的DevOps企業(yè)都選擇了使用智能化的決策能力,包括評估DevOps能力成熟度。


2、DevOps in Cloud 趨勢

2-趨勢.jpg


結(jié)合企業(yè)上云的趨勢,越來越多的企業(yè)已經(jīng)開始在公共云上使用DevOps,這個(gè)過程中需要做應(yīng)用的云化改造和適配,同時(shí)結(jié)合云原生的工具和任務(wù)流程編排,提升交付的效率。


在進(jìn)行云上DevOps的實(shí)踐過程中,很多的企業(yè)完成了微服務(wù)架構(gòu)的改造和分布式應(yīng)用的升級,同時(shí)服務(wù)治理也越來越成熟,但這個(gè)構(gòu)成帶來的應(yīng)用激增和依賴復(fù)雜度提升也為企業(yè)應(yīng)用的可觀察性和系統(tǒng)的穩(wěn)定性帶來極大的挑戰(zhàn)。


在DevOps的云上轉(zhuǎn)型過程中,很多企業(yè)也給自己的巨石應(yīng)用做了服務(wù)化的改造。并且?guī)缀跛械钠髽I(yè)都認(rèn)為,開放的API和As-Service是企業(yè)開放和服務(wù)化的核心競爭力。


3、云上運(yùn)維新趨勢CloudOps

3-cloudops.jpg


基于以上這些DevOps在云上的趨勢,阿里云彈性計(jì)算定義了CloudOps的模型,結(jié)合DevOps和云的雙重優(yōu)勢可以從成本、交付速度、靈活性和系統(tǒng)可靠性四個(gè)維度來看:

? 降低成本:DevOps通過組織效能的變革、數(shù)字化工具的建設(shè),可以大大降低成本,而云可以通過按需資源彈性以及多種資源選型和付費(fèi)方式來降低資源和人力的成本。


? 交付效率:DevOps可以實(shí)現(xiàn)CI/CD,而云可以實(shí)現(xiàn)秒級或者分鐘級的資源交付。


? 靈活性上:用戶對于應(yīng)用的研發(fā)上線周期提出了更高的要求,比如7天交付一個(gè)APP,從0到上線至應(yīng)用商店;而云同樣可以幫助客戶完成多種多樣的基礎(chǔ)設(shè)施的資源快速交付。


? 可靠性上:DevOps踐行了自動(dòng)化的理念,而云天然提供了基礎(chǔ)設(shè)施的高可用。

從應(yīng)用高可用,到技術(shù)資源高可用,以及系統(tǒng)的監(jiān)控和洞察能力,DevOps和云是一個(gè)非常好的組合,因此在云上提出了一個(gè)新概念CloudOps,充分結(jié)合云和DevOps的優(yōu)點(diǎn),實(shí)現(xiàn)1+1>2的效果。


02  以應(yīng)用為中心的自動(dòng)化運(yùn)維


image.gif

4-生命周期.jpg

CloudOps的核心理念是以應(yīng)用為中心,因?yàn)橹挥袘?yīng)用才是客戶最關(guān)注的


一個(gè)應(yīng)用從構(gòu)建到交付的整個(gè)生命周期中,客戶的關(guān)注點(diǎn)會(huì)發(fā)生變化:首先是應(yīng)用的構(gòu)建交付,如何實(shí)現(xiàn)自動(dòng)敏捷交付;交付完成后,客戶會(huì)關(guān)注系統(tǒng)的可靠性;一個(gè)可以快速提升可用性的策略就是彈性,結(jié)合彈性以及高可用方案來完成系統(tǒng)架構(gòu)的升級;隨著應(yīng)用的在線,客戶也逐漸關(guān)注應(yīng)用發(fā)布后的安全合規(guī)和審計(jì)工作;而當(dāng)應(yīng)用的規(guī)模變得更大時(shí),客戶就會(huì)關(guān)注成本,完成一個(gè)持續(xù)的迭代和升級完善的循環(huán)過程。


1、應(yīng)用自動(dòng)化三部曲

5-應(yīng)用自動(dòng)化三部曲.jpg


自動(dòng)化是系統(tǒng)升級改造的基礎(chǔ),應(yīng)用實(shí)現(xiàn)自動(dòng)化包括幾個(gè)大的部分,其中最主要的是:基礎(chǔ)設(shè)施的自動(dòng)化、運(yùn)維自動(dòng)化、服務(wù)自動(dòng)化。

1. 基礎(chǔ)設(shè)施自動(dòng)化:在過去一年時(shí)間里,阿里云發(fā)布了非常多的產(chǎn)品來簡化基礎(chǔ)設(shè)施自動(dòng)化。很多公司和企業(yè)開始實(shí)現(xiàn)自動(dòng)化,但是它的問題是自動(dòng)化模板基于客戶完成運(yùn)行的,今天阿里云可以讓這些模板不做任何修改,直接交給我們的引擎就可以執(zhí)行。同時(shí),越來越多的企業(yè)不太愿意使用JSON或者YAML來定義自己的基礎(chǔ)設(shè)施,而我們今天發(fā)布的新產(chǎn)品ROS CDK可以很好地解決這個(gè)問題。


此外,為了簡化自動(dòng)化的交付,還提供了資源遷移工具、鏡像的自動(dòng)化構(gòu)建功能,客戶可以像構(gòu)建一個(gè)容器鏡像一樣構(gòu)建一個(gè)ECS的鏡像。同時(shí),我們會(huì)定義鏡像族系,讓用戶永遠(yuǎn)像使用容器鏡像一樣可以自動(dòng)選擇最新的版本,而不需要更新配置文件。


2. 運(yùn)維自動(dòng)化方面:我們的運(yùn)維編排OOS開放了任務(wù)市場,把積累的非常多的最佳實(shí)踐和工具免費(fèi)發(fā)布在任務(wù)市場中,用戶可以去集成使用;同時(shí),為了構(gòu)建方便的關(guān)聯(lián)多種應(yīng)用,我們也發(fā)布了應(yīng)用管理。


3. 服務(wù)自動(dòng)化方面:我們始終把客戶能夠自助發(fā)現(xiàn)問題、排查問題、解決問題作為我們最主要的努力方向。


2、新產(chǎn)品:ROS Resource Migration

6-migration.jpg

 

先介紹第一個(gè)產(chǎn)品——ROS  Resource  Migration,很多人都覺得,IaC(Infrastructure as Code)非常好,但在實(shí)踐過程中挑戰(zhàn)非常大。首先寫出IaC的模板非常難,它需要非常多、非常復(fù)雜的領(lǐng)域知識(shí)和對腳本語言的理解;另一方面,模板寫完后,隨著應(yīng)用架構(gòu)升級,需要持續(xù)的更新模板來反映最新的基礎(chǔ)架構(gòu)。


為了解決這個(gè)問題,阿里云提供了新的方案,用戶可以通過阿里云的標(biāo)簽功能,在打完標(biāo)簽后,我們的ROS系統(tǒng)會(huì)自動(dòng)分析標(biāo)簽的依賴關(guān)系,幫用戶構(gòu)建一套IaC的模板。也就是說,用戶完全可以不了解IaC,也不用去寫JSON和YAML,阿里云會(huì)自動(dòng)化地生成模板。模板生成后,用戶可以非常方便地完成在多可用區(qū)、甚至多賬號(hào)、多地域的部署,會(huì)大大降低之前構(gòu)建一套基礎(chǔ)設(shè)施模板的復(fù)雜度。同時(shí),當(dāng)用戶寫完模板后,還可以通過智能化的模板配置和定義,保證用戶模板的部署成功率。


3、新能力:ROS的云開發(fā)套件ROS CDK

7-云開發(fā)套件.jpg


最近幾年,我們發(fā)現(xiàn)很多企業(yè)都非常希望能夠擁抱CloudOps,但是他們不喜歡JSON和YAML,為此阿里云今年也發(fā)布了新能力——ROS的云開發(fā)套件ROS CDK(Cloud Development Toolkit)。

7-1.jpg


它可以使用高階的語言(如JAVA/Python等),像寫腳本一樣直接生成ROS模板,然后通過ROS模板再生成用戶的基礎(chǔ)資源設(shè)施??偨Y(jié)起來就是可以選擇自己的開發(fā)語言、自己熟悉的編程模型,高效的實(shí)現(xiàn)Infrastructure as Code。


4、新工具:應(yīng)用管理

8-應(yīng)用管理.jpg


為了簡化應(yīng)用的構(gòu)建,阿里云發(fā)布了應(yīng)用管理。應(yīng)用管理非常簡單,只需要選擇一個(gè)標(biāo)簽或者導(dǎo)入已有資源,可以快速構(gòu)建一套應(yīng)用。有了應(yīng)用視角之后,它可以是跨多產(chǎn)品的,幫用戶去做自動(dòng)化的運(yùn)維、監(jiān)控、發(fā)布和CI/CD,大大簡化了整個(gè)運(yùn)維過程、降低了成本。


另外,應(yīng)用里最大挑戰(zhàn)是應(yīng)用升級,包括補(bǔ)丁管理、操作系統(tǒng)配置管理等,基于應(yīng)用視角,我們幫用戶做應(yīng)用視角的分組,極大降低使用應(yīng)用的門檻。

9-應(yīng)用可靠性能力.jpg

? 應(yīng)用可靠性能力上:在應(yīng)用構(gòu)建完成之后,其實(shí)最大的挑戰(zhàn)就是可靠性能力。阿里云在基礎(chǔ)設(shè)施上提供了強(qiáng)大的應(yīng)用可靠性能力,比如說多地域部署、多可用區(qū)部署。


? 彈性容錯(cuò)能力方面:我們構(gòu)建了智能預(yù)測,它可以根據(jù)用戶過去對這些資源的使用率和操作,動(dòng)態(tài)推薦需要的資源;為了透明性,我們也開放了ECS事件體系,可以模擬一臺(tái)物理機(jī)宕機(jī)或者磁盤I/O hang機(jī)型基礎(chǔ)設(shè)施的容錯(cuò)演練;同時(shí)提供了應(yīng)用高可用服務(wù),可以模擬流量防護(hù)、故障演練等,大大提升系統(tǒng)之間的容錯(cuò)能力。


? 可觀測能力構(gòu)建上:我們有包括云監(jiān)控、SLS、ARMS、Xtrace等產(chǎn)品,可以提供從基礎(chǔ)資源到應(yīng)用再到日志的全鏈路觀測,以保障系統(tǒng)的可靠性。


? 數(shù)據(jù)的備份和恢復(fù):我們提供了極速快照能力,可以秒級的完成快照創(chuàng)建。它使得用戶進(jìn)行操作變更的時(shí)候非常安全,不用像以前一樣,需要等很長時(shí)間才能做成一個(gè)快照。由于使用快照有一定成本,我們做了一個(gè)新的服務(wù),叫做快照保留周期,用戶可以將不用的快照自動(dòng)地歸檔或刪除,降低使用快照的成本。


5、安全與合規(guī)能力建設(shè)

10-安全合規(guī).jpg


安全&合規(guī)能力也是阿里云和彈性計(jì)算基礎(chǔ)能力,在基礎(chǔ)平臺(tái)(如網(wǎng)絡(luò)安全和系統(tǒng)審計(jì)能力)和應(yīng)用安全兩個(gè)方面之外,我們今天提供了更多的能力。


當(dāng)用戶操作安全組,有不合規(guī)的端口變更之后,系統(tǒng)會(huì)自動(dòng)向用戶發(fā)出警告,幫助監(jiān)控這些不合理的變更,避免系統(tǒng)風(fēng)險(xiǎn);應(yīng)用安全里面,除了云安全中心以外,操作系統(tǒng)的管控通道安全,也是我們一直關(guān)注的重點(diǎn)。

11-增強(qiáng).jpg


很多人運(yùn)維ECS的時(shí)候,喜歡用SSH/RDP來登錄服務(wù)器進(jìn)行操作,阿里云提供的云助手,我們開放了基本的API,像一個(gè)瀏覽器請求一樣,用戶可以直接在客戶端進(jìn)行主機(jī)端的操作。不少用戶反饋說,這個(gè)操作不像SSH一樣便捷、不友好,所以我們發(fā)布了新功能——Session Manager


通過Session Manager,不需要用戶名密碼可以直接實(shí)現(xiàn)對主機(jī)的管控,同時(shí)可以將它集成到已有的系統(tǒng)里,從而完成無密鑰的登錄、鑒權(quán)、操作和審計(jì)等操作。


此外,今年我們還發(fā)布了新功能——高危命令攔截,當(dāng)用戶執(zhí)行高危命令,都可以攔截到,同時(shí)把用戶的操作加入到回放日志。當(dāng)用戶執(zhí)行高危操作的時(shí)候,通過Workbench進(jìn)行錄屏,錄屏傳到OSS上,從而可以大大提升我們的安全性及可審計(jì)通道的可靠性。


應(yīng)用視角里,用戶非常頭疼就是判斷兩個(gè)ECS之間的配置到底有什么差異,為什么有的機(jī)器有問題、有的機(jī)器沒有問題。之前用戶想分析這個(gè)問題是非常難的,通過ECS的實(shí)例配置清單,我們會(huì)把諸如Windows的注冊表、配置等信息,幫用戶對配置信息進(jìn)行快照,快照完成之后自動(dòng)分析,分析兩臺(tái)機(jī)器之間的差異,這樣的話用戶可以快速地找到這兩臺(tái)機(jī)器的差異,大大降低排查問題的時(shí)間。


我們一直在追求配置管理的集約化,我們發(fā)布了ECS的密鑰參數(shù)管理,客戶可以把應(yīng)用的參數(shù)統(tǒng)一到Parameter Store進(jìn)行管理,它原生支持了資源編排、云助手、運(yùn)維編排等多個(gè)產(chǎn)品,這樣就可以避免參數(shù)配置時(shí)沒有進(jìn)行集約化管理產(chǎn)生的問題。同時(shí),使用Parameter Store,也支持用戶做參數(shù)審計(jì)。


通過以上新能力,可以大大簡化ECS操作方面的運(yùn)維復(fù)雜度、提供安全的通道以及實(shí)現(xiàn)配置集約化管理。

 

03  CloudOps(云上自動(dòng)化運(yùn)維)白皮書發(fā)布


1、DevOps in Cloud ≠ CloudOps

12-VS.jpg


在云上用DevOps是不是就是CloudOps呢?可能不是的。根據(jù)最新的2021年的DevOps報(bào)告,其實(shí)只有20%的企業(yè)在云上充分發(fā)揮了DevOps的優(yōu)勢,這是因?yàn)樵粕显葡掠蟹浅4蟮牟町悺?/span>

? 首先,操作方式有差異。云上提供了非常多的免費(fèi)自動(dòng)化運(yùn)維工具和集成工具,可以大大地降低用戶的成本,但需要用戶和已有工具做集成。


? 第二,從資產(chǎn)到資源有差異。進(jìn)行管理資源的時(shí)候,在云上可能認(rèn)為它是資源,在云下的話可能是資產(chǎn)。例如,云上管理資源的時(shí)候,更多是把原機(jī)器釋放、重新拉起一臺(tái)機(jī)器,這樣就完成配置升級、應(yīng)用升級,而不需要關(guān)心資產(chǎn)形態(tài),這就是云上云下操作形式之間的差異。


? 第三,統(tǒng)一化和規(guī)?;牟町?/span>。云上規(guī)?;浅}嫶螅梢噪S時(shí)開啟或者釋放非常多的機(jī)器,如果有誤操作,可能會(huì)給企業(yè)帶來比較大的成本或技術(shù)風(fēng)險(xiǎn)。


? 最后,云上對于安全和審計(jì)的實(shí)時(shí)性要求非常高。


2、CloudOps主要成熟度模型與白皮書

13-五個(gè)衡量維度.jpg


我們認(rèn)為,CloudOps不僅僅是在云上用DevOps,更多的是要求用戶關(guān)注云的特點(diǎn)。這些特點(diǎn)歸納為5個(gè)維度,即自動(dòng)化能力、彈性能力、可靠性能力、安全合規(guī)能力以及成本和資源量化。我們詳細(xì)劃分了云上DevOps的5大領(lǐng)域,同時(shí)我們也把每個(gè)領(lǐng)域定義并劃分了級別,形成了CloudOps主要成熟度模型。

14-成熟度模型.jpg


以自動(dòng)化為例,現(xiàn)在比較流行的看法是希望能做到無人值守,這些都定義在CloudOps主要成熟度模型里。我們希望通過這個(gè)成熟度模型,幫助客戶衡量目前在云上DevOps是否已經(jīng)足夠成熟,以及如何能夠提升自己的成熟度。  

15-白皮書發(fā)布.jpg


為了更好地幫助客戶理解我們的CloudOps成熟度模型,我們發(fā)布了CloudOps白皮書,阿里云彈性計(jì)算的10余位技術(shù)專家共同撰寫的CARES模型,從成本管理、自動(dòng)化、可靠性、彈性容量管理以及安全合規(guī)五個(gè)方面,展示了如何能夠在云上找到合適的運(yùn)維方式和運(yùn)維工具。


3、阿里云CloudOps產(chǎn)品族全展示


很多人說,云計(jì)算的本質(zhì)就是運(yùn)維能力的自動(dòng)化。過去十多年,阿里云彈性計(jì)算一直在簡化運(yùn)維方面做了非常多的工具和努力,旨在全方位提升云上DevOps效能,也形成了完整的CloudOps產(chǎn)品家族。

16-cloudops產(chǎn)品族.jpg

? 成本管理方面,成本優(yōu)化方案和成本付費(fèi)模式方案,可以大大降低用戶成本。


? 自動(dòng)化服務(wù)上,提供了免托管運(yùn)維,包括運(yùn)維編排、補(bǔ)丁管理、配置清單、參數(shù)倉庫等。


? 批量交付方面,提供有OpenAPI和彈性伸縮這些工具,可以大大降低自動(dòng)化交付的復(fù)雜度。


? 實(shí)例運(yùn)維通道,提供了非常多的方式,用戶可以通過我們的web版,也可以通過云助手和最新發(fā)布的工具做集成,從而大大降低使用自動(dòng)化運(yùn)維的門檻。


? 可靠性服務(wù)上,是所有云上用戶追求的重點(diǎn),我們發(fā)布了應(yīng)用管理能力。


? 在可觀測能力、自助故障排查以及事件服務(wù)上,也發(fā)布了完整套件,并且大部分服務(wù)都是免費(fèi)的。


? 安全合規(guī)方面,包括應(yīng)用環(huán)境的安全和合規(guī)審計(jì)的便捷。我們集成了很多產(chǎn)品,來提升整體的安全合規(guī)能力,幫助客戶及時(shí)地發(fā)現(xiàn)并排除安全合規(guī)的風(fēng)險(xiǎn)。

從最初的上云到今天用好云、管好云的時(shí)代,阿里云彈性計(jì)算一直在致力于為客戶提供豐富、安全、便捷的云上運(yùn)維產(chǎn)品與能力,未來我們也希望與大家攜手共同構(gòu)建更高效、更智能的云上運(yùn)維。


點(diǎn)擊大會(huì)官網(wǎng),觀看田濤濤的精彩演講視頻。