系統維運的精神
這 Slide 簡單整理我對於系統上線後,面對異常處理的態度以及心法。
這其實是我兩年前 (201510) 想對公司內說明的,後來不知道什麼原因,沒有說,也不想說,不過我把那樣的精神與意念轉化成另一種行動。
201510 系統維運的精神 from Rick Hwang
這段心得,基本上跟 SRE CH13 - Emergency Response 提到得很像,只是我很嚴肅看待這件事情罷了。
SRE CH33 - Lessons Learned from Other Industries 有其他行業的實踐經驗,其中一位是維護 911 警急呼叫系統的人,後來擔任 SRE。對這樣的人來說,911 警急系統出問題,不是生意受影響而已,而是會出人命的,所以他會用同樣的心態看待 SRE。
換成是我,我除了是工程師,也是音樂人,對我來說,SRE 之於樂手,就是 現場 (Live)
,就是表演、就是生活。底下是以前寫的相關文章:
這些都是很嚴肅,卻很真實的問題。
延伸閱讀 (站內)
- Study Notes - SRE Opening and Chapter 1
- Resource Provisioning and DevOps
- 淺談系統監控與 CloudWatch 的應用 - AWS User Group Taiwan
- What is Ops?
- Emergency Response
- Go Live
- Ops as Code using Serverless
參考資料
- SRE CH13 - Emergency Response
- SRE CH33 - Lessons Learned from Other Industries
- 有頭無尾:超商年丟70億食物? 300超商加盟店聯手抗議