災難還原 - 實戰演練


Using AWS for Disaster Recovery 整理 AWS 針對災難還原的實踐原則,而去年 (2019) 我在公司真實執行災難演練,這是第二次的經驗。這段過程,在年初 (2020/01/08) 的 AWS reInvent reCAP 2019 跟大家分享整個執行過程。


簡報以及錄音

底下是當時的簡報與錄音:

錄音檔,可以搭著 Slide 看:

底下是一些內容摘要:





心得

做好 DR 這件事情,大部分會集中火力在談工程面,討論什麼技術快速達到。實際上執行面除了工程面,越大的組織,越是有歷史的系統,面對的更多的卻是團隊協作的問題、目標、最後如何驗收、成本、成效。這兩次難得的經驗,讓我總結出類似於 AWS Well-Architected Framework 的心法,也就是

  1. 高效能
  2. 高可靠
  3. 低成本
  4. 安全
  5. 可維運
  6. 可測試
  7. 低耦合

七個架構原則,基於這原則,可以完整的滿足軟體開發過程的各項考慮,這個坑以後再來寫專文。。。我為啥一直在推自己坑?

這個原則的概念在:2018 DevOpsDays 演講:從緊急事件 談 SRE 應變能力的培養 有提到,雛形是 2017 年九月我在內部整理架構總圖時起草的。


當天照片

底下是當天活動的照片,感謝 AWS 提供。這場分享要感謝 AWS 的邀請,Kim Kao 的促成讓我有機會分享~會場也遇到很多許久不見的老朋友,還有剛認識 (慕名而來?) 的新朋友 ~



延伸閱讀

站內資料




Comments