不卡av在线播放_欧美成人AU在线看_亚洲一区二区 视频_五月天亚洲无码伊人

Article / 文章中心

云原生趨勢(shì)下的遷移與災(zāi)備思考

發(fā)布時(shí)間:2022-05-09 點(diǎn)擊數(shù):680

由于成本的降低和業(yè)務(wù)的便捷性,越來(lái)越多的企業(yè)將自己的IT系統(tǒng)遷移到云端,但在遷移的過(guò)程中,面對(duì)一個(gè)新的環(huán)境,從基礎(chǔ)設(shè)施的部署到云平臺(tái)的挑戰(zhàn)都十分的具有挑戰(zhàn)性,如何保證云遷移的安全?如何減少遷移風(fēng)險(xiǎn)?如何權(quán)衡線上穩(wěn)定性和敏態(tài)交付?成為了企業(yè)IT管理者十分關(guān)注的問(wèn)題。

編輯搜圖


今天為我們解答以上問(wèn)題的嘉賓,是來(lái)自浙江移動(dòng)的云智能平臺(tái)運(yùn)維架構(gòu)師史軍艇老師。希望通過(guò)匯集史軍艇老師的研究成果和實(shí)踐經(jīng)驗(yàn),帶大家了解云原生環(huán)境下存在的安全問(wèn)題,規(guī)避云上可能會(huì)遇到的問(wèn)題,保障云原生應(yīng)用的運(yùn)行穩(wěn)定性。



史軍艇

浙江移動(dòng) 云智能中心運(yùn)維架構(gòu)師 


  • 8年應(yīng)用優(yōu)化及SRE經(jīng)驗(yàn),2013年起從事應(yīng)用運(yùn)維、穩(wěn)定性提升、架構(gòu)優(yōu)化等工作;專注于穩(wěn)定性體系建設(shè)及分布式系統(tǒng)架構(gòu)治理。樂(lè)于研究新解決方案及新技術(shù)。目前負(fù)責(zé)浙江移動(dòng)線上系統(tǒng)應(yīng)用架構(gòu)治理和穩(wěn)定性體系建設(shè)工作,并作為浙江移動(dòng)混沌工程負(fù)責(zé)人,推動(dòng)中國(guó)移動(dòng)集團(tuán)內(nèi)演練方案實(shí)施。 



主要觀點(diǎn)

個(gè)人認(rèn)為,要解決這些問(wèn)題,需要從企業(yè)層面建設(shè)一套的穩(wěn)定性體系,包括架構(gòu)設(shè)計(jì)、上線變更、故障抵御、線上治理,貫穿整個(gè)過(guò)程。而這其中表達(dá)的意思,穩(wěn)定性不至于故障抵御,更要往前看,從架構(gòu)設(shè)計(jì)開(kāi)端,去做高價(jià)值交付。實(shí)踐過(guò)程中,我們衍化出一些有效的工程,比如流量回放、灰度發(fā)布、混沌工程、平面逃生等,保障了每一個(gè)過(guò)程的平穩(wěn)鏈接,確保上云風(fēng)險(xiǎn)降到最低。 


Q1云原生下,如何權(quán)衡線上穩(wěn)定性和敏態(tài)交付?

穩(wěn)態(tài)(穩(wěn)定性)和敏態(tài),就是我們說(shuō)的雙態(tài)模式。我理解應(yīng)該是敏態(tài)催生了云原生,而后云原生又推動(dòng)了穩(wěn)定性。正如我們所說(shuō),云原生是從傳統(tǒng)“原子時(shí)代”跨越到“比特時(shí)代”的,它的具體表現(xiàn)形式是容器化支撐+微服務(wù)體系,配套而生的就是DevOps和持續(xù)交付,而這一切確實(shí)都是為了核心業(yè)務(wù)的快速迭代為出發(fā)點(diǎn)的。


因此,我們需要穩(wěn)定性體系/SRE體系來(lái)給予運(yùn)營(yíng)端足夠的信心,浙江移動(dòng)在穩(wěn)定性方面確實(shí)也摸索了很多年,我們算是傳統(tǒng)行業(yè)中運(yùn)維轉(zhuǎn)型走得比較早的。研發(fā)眼中是DevOps,我們眼中就是OpsDev,這兩者并不沖突。在整個(gè)穩(wěn)定性體系中,除了基本的故障抵御體系外,Ops必須要把步子往前邁,邁過(guò)上線發(fā)布,邁到架構(gòu)管控及設(shè)計(jì),這樣和線上治理組合起來(lái)才是一整套交付護(hù)航體系。其中涉及到的工程實(shí)踐,就會(huì)用到灰度發(fā)布、混沌工程、多可用區(qū)之上的自智網(wǎng)絡(luò)能力等,用此去保證交付質(zhì)量、上線質(zhì)量和運(yùn)行質(zhì)量。


Q2云環(huán)境下的災(zāi)備如何進(jìn)行設(shè)計(jì)?

我這里主要聊一下應(yīng)用服務(wù)的災(zāi)備設(shè)計(jì),相信數(shù)據(jù)庫(kù)的變化會(huì)相對(duì)小一點(diǎn)。對(duì)于應(yīng)用架構(gòu),云環(huán)境下會(huì)涉及到復(fù)雜的微服務(wù)調(diào)用,以及容器云平臺(tái)的計(jì)算資源控制管控,另外還有公用依賴的一些公共組件。我們會(huì)建議企業(yè)做雙平面/雙可用區(qū)設(shè)計(jì),這里的平面縱深會(huì)比較深,從容器云的管理(mesos、marathon、k8s),還是公共組件、配置中心、注冊(cè)中心、緩存平臺(tái)等,當(dāng)然還包括上層應(yīng)用,都需要進(jìn)行雙活雙平面改造。這樣才能在保證流量的前提下,可以在兩套不同的環(huán)境下精確倒換、逃生。


像資源相對(duì)富足的公司,或者說(shuō)針對(duì)核心業(yè)務(wù),愿意再多投入一點(diǎn)點(diǎn)資源的,可以再適配一個(gè)10%-20%的小平面,用于形成更為完善的逃生能力、發(fā)布能力、演練能力。


Q3相比于傳統(tǒng)災(zāi)備架構(gòu),云環(huán)境的災(zāi)備架構(gòu)規(guī)劃會(huì)有哪些異同點(diǎn)?

個(gè)人覺(jué)得傳統(tǒng)的災(zāi)備主要考慮的是高可用,我們只要關(guān)注雙機(jī)房、實(shí)例冗余負(fù)載等,相對(duì)簡(jiǎn)單清晰。而如上個(gè)問(wèn)題提到的,云環(huán)境下的災(zāi)備架構(gòu)考慮的層次會(huì)更深,在傳統(tǒng)架構(gòu)災(zāi)備要求的前提下,需要貫通每一層的平面級(jí)拆分。另外,因?yàn)樵骗h(huán)境從實(shí)例調(diào)用層面的可閱讀性會(huì)大大降低,所以導(dǎo)致普通的高可用,可能在故障處置上會(huì)有一定劣勢(shì)。建議采用單元化的設(shè)計(jì),從流量入口就具備調(diào)度能力,做好準(zhǔn)確自動(dòng)的平面逃生,當(dāng)然該有的觀測(cè)性等配套要求也會(huì)更高。


Q4企業(yè)原先生產(chǎn)環(huán)境復(fù)雜,導(dǎo)致上云遷移和業(yè)務(wù)重構(gòu)難度大。對(duì)此,有什么可參考的落地步驟和技術(shù)路線嗎?

研發(fā)和SRE兩條腿走路,并且要步調(diào)一致,一起走。因?yàn)榇笮拖到y(tǒng)的上云其實(shí)是一個(gè)非常大的工程,或者是有較大風(fēng)險(xiǎn)的工程。從研發(fā)層面,原有的復(fù)雜調(diào)用,該拆就拆,從設(shè)計(jì)方案中,去考慮拆分的可行性,而這個(gè)時(shí)候,SRE就需要一起參與,通過(guò)非功能的視角,去進(jìn)行紙牌推演、沙盤(pán)推演,可以和研發(fā)互相pk。從工程保障角度,我們要確保割接方案的快速回退,老的環(huán)境并行保存等注意事項(xiàng)。新環(huán)境在通過(guò)紙牌推演后,進(jìn)入到上線前的實(shí)戰(zhàn)演練驗(yàn)收,這個(gè)時(shí)候可以通過(guò)回放的流量去模擬驗(yàn)證。在發(fā)布工程中,用灰度的滾動(dòng)發(fā)布模式,確保平滑割接過(guò)渡。