Conclusion SRE
SRE 這本書並不是很容易入門的,書中有不少東西是滿技術性的,但也很多屬於觀念、原則、經驗方法。所以如果非技術背景或者管理階層的朋友,想要閱讀 SRE,推薦閱讀以下章節,可以了解一些原則與概念。
太技術性的章節我先過濾掉,以下是原文的 Link (英文)。
- Part I Introduction
- Part II Principles (指導原則)
- Part III Practices 具體實踐
- Part VI Management 管理
- Part V Conclusions 總結
如果只能挑一章來讀,我推薦 CH15 事後檢討:從失敗中學習
,建立良好的回饋與循環,讓團隊漸進式地變好。這也是 “DevOps” 的精神之一。
如果可以選擇一段主題,我推薦 CH11-16
,都在討論 上線後
要面對的問題還有平常的訓練。
Slogan
SRE 有些章節開頭有些很經典、令人省思的句子,做過的人聽到會很有感觸、或者會心一笑,像是:
- 不能將運氣當作戰略
- 如果系統正常運轉中需要人工干預,應該將此視為一種 Bug。
- 值得警惕的是,理解一個系統應該如何工作並不能使人成為專家。只有靠調查系統為何不能正常工作才行。
- Things break; that’s life. (東西早晚要壞的,這就是生活。)
- If you haven’t tried it, assume it’s broken. (如果你還沒開始親自測試過某件東西,那麼就假設他是壞的。)
這些都整理在:Slogan in SRE
Study Notes in Slideshare
底下放在 Slideshare 的是我在公司,或者 SRE Taiwan 分享的 Slide.
SRE Opening and CH1
SRE CH2,3,4
SRE CH12 - Effective Troubleshooting
SRE CH13 - Emergency Response
SRE CH25 - Data Processing Pipelines
SRE CH27 - Reliable Product Launches at Scale
SRE CH28 - Accelerating SREs to On-Call and Beyond
SRE CH33/CH34 - Lessons Learned from Other Industries/Conclusion
在公司 SRE 讀書會最後的章節,這是原稿,不是實際分享的版本。我引用一些緊急事件處理的想法,來強調 SRE 的觀念,特別是『地震』、『核災』有關的。
另外也用『音樂』的角度來看待這件事情,夠跳痛的 XD
總結
底下摘錄分享 CH34 的時候,很有感觸的頁面,特別剪出來當作總結:
class SRE implements DevOps
最近 (2018/05/09) 有人在問 SRE 跟 DevOps 的差別,剛好 Google 官方也出了一系列 SRE 介紹的影片,然後在官方 Blog 寫了一篇文章介紹這些影片和 SRE,標題為: SRE vs. DevOps: competing standards or close friends? ,摘錄文中的一些段落重點如下:
class SRE implements DevOps
SLIs, SLOs, and SLAs
Risk and error budgets
Toil and toil budgets
Customer Reliability Engineering (#CRE)
其中最為傳神的還是這段 code: class SRE implements DevOps
有讓人豁然開朗的感覺。
跟 SRE 主題聯想
底下這段是我在 Facebook 社群 Site Reliability Engineering Taiwan 分享的 聯想 ~
最近在整理筆記,慢慢的把這幾件事情都連在一起了:
SRE
: 這裡的主軸,自動化、用軟體工程做 Ops、救火隊兼架構顧問ChaosEngineering
: 到處放🔥給上面的救 XDDistributedSystem
: 現代架構趨勢,有我才有上面的問題Microservices
: 潮!講到上面怎麼會沒想到我!ServiceMesh
: 我是樓上的 Mircoservice ,裡面對打找我,要面對外面的找 #APIGatewayKubernetes
: 樓上都依賴我DevOps
: 樓上不要吵了,大家不能傷了皇城內的和氣,給些 Feedback 吧Agile
: 嗯,我笑了。大家把想法寫在 #postit 吧 ~PM/PO/Boss: 可以講中文嗎?
Sales/Marketing: 東西可以上線了嗎?
還滿有趣的~
其中 Chaos Engineering
相關的科學基礎與聯想,有 混沌理論、蝴蝶效應、三體問題、量子力學
相關文章 (站內)
- 警急事件 (Emergency Response)
- Slogan in SRE
- Study Notes - SRE Opening and Chapter 1
- What is Ops?
- Go Live
- 系統維運的精神