災難還原 - 實戰演練
Using AWS for Disaster Recovery 整理 AWS 針對災難還原的實踐原則,而去年 (2019) 我在公司真實執行災難演練,這是第二次的經驗。這段過程,在年初 (2020/01/08) 的 AWS reInvent reCAP 2019 跟大家分享整個執行過程。
簡報以及錄音
底下是當時的簡報與錄音:
錄音檔,可以搭著 Slide 看:
底下是一些內容摘要:
心得
做好 DR 這件事情,大部分會集中火力在談工程面,討論什麼技術快速達到。實際上執行面除了工程面,越大的組織,越是有歷史的系統,面對的更多的卻是團隊協作的問題、目標、最後如何驗收、成本、成效。這兩次難得的經驗,讓我總結出類似於 AWS Well-Architected Framework 的心法,也就是
- 高效能
- 高可靠
- 低成本
- 安全
- 可維運
- 可測試
- 低耦合
七個架構原則,基於這原則,可以完整的滿足軟體開發過程的各項考慮,這個坑以後再來寫專文。。。我為啥一直在推自己坑?
這個原則的概念在:2018 DevOpsDays 演講:從緊急事件 談 SRE 應變能力的培養 有提到,雛形是 2017 年九月我在內部整理架構總圖時起草的。
當天照片
底下是當天活動的照片,感謝 AWS 提供。這場分享要感謝 AWS 的邀請,Kim Kao 的促成讓我有機會分享~會場也遇到很多許久不見的老朋友,還有剛認識 (慕名而來?) 的新朋友 ~
延伸閱讀
站內資料
- Whitepaper - Using AWS for Disaster Recovery
- Artifacts Management
- Service Catalog
- Chaos Engineering (混沌工程)
- 怎樣的 CI/CD 才夠 Quality?
- 軟體交付的四大支柱 (Four Pillars of Software Delivery)
- Resource Provisioning and DevOps
- 演講:從緊急事件 談 SRE 應變能力的培養
- Whitepaper - AWS Well-Architected Framework