◼️ 初めに.
この記事は SRE Advent Calendar 2023の 21 日目のエントリーとなります。2023 年も残すところ 10日です。アドベントカレンダーも終盤に差し掛かってきました!このまま最後まで走り切りましょう。わたしはアドカレ積読が溜まってきてしまっているので、正月休暇のお供にしようとおもっています。
今回は、2023/10 にあった ゆるSRE勉強会 #2 で LT 登壇した内容をゆるく振り返りつつ、楽しいイベントに参加できた感想を綴っていきます。登壇記にしてはやや遅すぎないか?という感はありますが、年末、振り返りの良い機会なのでやっていきます。ゆるSRE勉強会については、connpass のページを見てみてください。「ゆるい雰囲気で肩肘張らずにSRE関連のトピックについて話す勉強会」です!
◼️ 楽しそうだったので LT 申し込んだ.
この勉強会の存在は、ゆるSRE勉強会 #1 の際に某 X のタイムラインで流れてきた WaiWai ポストを観測して知りました。興味深かったので、「行きたかった...」と呟いたところ、 @taxin さんに ゆるSRE勉強会 #2 も参加者募集してるよと教えてもらったのが参加のきっかけでした。LT 登壇枠の募集もしており、応募段階ではネタ考えられてなかったですが、ノリで LT に申し込みました。俗にいう、登壇ドリブン開発(TDD)です。
◼️ K8s 運用 / アップデートの話を LT した.
当日は何話そうかな〜と色々迷った挙句、ちょうど当時個人的ホットトピックであった Kubernetes のアップデートに関する話をさせていただきました。Kubernetes を運用していると定期的にアップデートのタイミングがあり、それに対して SRE チームとして取り組んでいる話です。
内容を簡単に振り返ると、LT では Kubernetes v1.24 -> v1.25 への更新について話しました。このアップデートではいくつか廃止される API が存在していたため、それらの API を使用しているアプリケーションの調査と、使用している場合は API の更新依頼を各チームにする必要がありました。更新自体は至って簡単なのですが、大規模な場合たくさんのサービス・チームが存在していてそれらをハンドリングしつつ安全にアップデートを遂行する必要があります。※ 参考:Deprecated API Migration Guide
これらの泥臭い作業(マニフェスト確認 & API 更新依頼 & それに対する質問捌くマン)を経て、API の更新、v1.25 へのアップデートが無事完了しました。と、思ったのですが、いくつかのチームから「廃止された API を使っている」とのエラーでアプリケーションデプロイに失敗すると問い合わせがくるという想定外の事象が起こりました。
調査をすると、helmfile コマンドを使ってデプロイする際に、前回のデプロイ時の履歴を参照しており、その履歴の中に廃止になった API の痕跡が残ってしまっているのが原因であるとわかりました。これについてはちゃんと Helm の公式ブログ でも対応策が詳らかに解説されています。(知らなかった。。。)helmfile を使ってデプロイしている場合は、"アップデート前に更新した API でデプロイをしておく" または、"更新した API のデプロイ前にアップデートをしてしまった場合、履歴(Release Resource)に記載されている廃止 API バージョンの記述を削除してから再度デプロイを行う" 必要がありました。
今回の事象は沼りかけはしましたが試験環境での出来事だったので、商用環境では事なきを得ました。という、ほとんどの人にとってはほぼ役に立たない内容を、泥くさ作業交えツラミ全開でツラツラと LT させていただきました。スライドは以下にあるのでもし興味のある方は見てみてくださいですが、あまり役立たないかもしれません。
◼️ ゆるSRE勉強会に LT 登壇して.
登壇の際には、ちっちゃくても何かしら一つくらいは聴者の方に持ち帰っていただけるような情報を提供できれば良いなという思いでスライドを作るようにしていた(できているかは…)ので、今回の全く helpful ではない内容の登壇は、これで良いのかと若干不安がありました。しかし、ゆるSRE勉強会はそんな発表でも受け入れてくれる素敵な勉強会です。
ツラミを話して、それに対して共感をいただけることは今後の糧になりますし、表明することで似たような境遇の方と話す機会になり、次のアクションのヒントを得られるきっかけにもなります。なのでそのような場、空気を提供してくれるゆるSRE勉強会には感謝です。ほんとうにゆるいし、良い意味で何も持ち帰ってもらわなくていい登壇ができるので、本音で泥くささを話せたりもします(私の泥くささレベルはまだ Lv.3 とかですが...)。LT 初挑戦の SRE 方にもおすすめの勉強会だなと感じます。
ポストモーテムの知識や、各社 SRE 事例、リスク受容の事例など学びのあるセッションたくさんあり、参加するだけで得られるものも多くあります。わたしもどこかで登壇駆動で SRE 活動行い、セッション参加してみたいなぁと思います。そのときはツラミでない発表できたら良いです 😌
最後に.
ゆるSRE勉強会の登壇振り返りと、イチ参加者としての感想を書きました。明日は、@yjszk666 さんの「クラウド移行における設計共有の重要性」です!それではみなさん、良いお年を!