演講:淺談系統監控與 CloudWatch 的應用
今天 (2017/06/21) 有機會到 AWS User Group Taiwan 分享心得。主題:淺談系統監控與 CloudWatch 的應用。
主軸
題目主軸的構思是從這篇: Study Notes - CloudWatch 開始,但這篇前半段純粹是讀書筆記,把讀過的東西整理過,後半段則是心得。
單純講技術沒有靈魂,直接切入經驗的心得又似乎沒頭沒尾,所以又從這篇: AWS Certified SysOps Administrator - Associate 準備心得 整理一些累積已久的想法。刪減整理後,用自問自答的方式,做出主要的架構,然後再用 CloudWatch 和 Lambda 穿插。
只講樂理,不找歌曲當例子,很無感;只教歌曲,不講樂理,學生會一直問。。。所以技術和故事都要講 XD
整個 Slide 主軸圍繞在底下的問題:
- 服務的SLA 是多少?
- 如何知道服務是正常的?
- 如何知道服務現在的狀況?
- 要監控哪一些指標? (SLI)
- 異常的通報方式?
其實技術含量不高 (約 AWS Level 200),大多是想法、經驗、純分享 XDD
以下是當天的 Slide 與活動照片。
投影片 Recap
底下摘錄一些重點 Slide 給需要的朋友快速瀏覽:
活動照片
最後感謝 AWS User Group Taiwan 以及 Sebastian Hsu 的熱情邀請,讓我有機會分享心得跟想法,也謝謝來參加的朋友。
後記:
我在 Slide 最後的許願實踐了,AWS 07/05 發表了新功能: New – API & CloudFormation Support for Amazon CloudWatch Dashboards。雖然有點晚,但還是實踐了,表示 CloudWatch 還是有在持續改進的!希望其他的許願也會慢慢實現 XD
補充
這份 Slide 有部份重點畫面沒有顯示出來,後來重新整理成底下課題:
- What is Monitoring: 深度分析
監
、控
的差異 - Monitoring vs Observability : 聊聊這兩者的差異與任務別,包含 AWS CloudWatch 的應用實務。
CloudWatch 系列文章
- Study Notes - CloudWatch
- Study Notes - CloudWatch Core Functions
- Study Notes - CloudWatch FAQ
- CloudWatch for Monitoring and Alarm Systems
- CloudWatch for Log Analysis
- CloudWatch for Performance Testing
- 2017/06/21: 淺談系統監控與 CloudWatch 的應用 - AWS User Group Taiwan
延伸閱讀
- AWS Certified SysOps Administrator - Associate 準備心得
- Monitoring vs Observability
- 淺談軟體測試的階段與策略
- Study Notes - SRE Opening and Chapter 1
- What is Monitoring
- Ops as Code using Serverless