先日、Platform Engineering Kaigi 2025に登壇させていただきました。
CfPを出した時は「やり始めの話って需要あるのかな?」と試しに出してみましたが、まさか通ると思っていなかったので慌てて色々とどういう構成にするか?とか考えてました。
なんとか資料作りが間に合って良かったです。
当日も「本当に需要あるのかな・・・」と不安を抱えつつ登壇しましたが、登壇後様々な方にお声がけいただいて嬉しかったです。登壇時間のため、泣く泣く削ってる部分が多く、ちょうどそのあたりを質問されたりしまして、色々と答えさせていただきました。
特に「Platform Engineeringを進めるうえで、チームの協力体制が出来ていたというお話でしたが、その要因となっているのはどのようなところですか?」という概ねそんな感じの質問をいただきまして、「たしかにそこ語るべきだったな〜〜〜」と気付きを得ました。
お答えさせていただいた内容としては「チームに現状のシステムがどうなっているか?というメトリクスなど数値という分かりやすい指標を初期に提示することで、実施→結果に納得感を持たせていたのが一つあったのかなと思います」というものでした。ただ、これも後から振り返ってみると根底の"信頼貯金"の話をするのをすっかり忘れていて、補遺として「どんな施策も信頼貯金がないとコラボレーションモードに移行できないと考えているので、ストリームアラインドチームとの信頼づくりのために積極的な対話をするのが良いと思います」というのを付け足しておきます。
さて、Platfrom Engineering Kaigiについては非常に楽しいカンファレンスでした!
SRE Kaigiでも利用させていただいた中野セントラルパーク カンファレンスでの開催ということで、半年ちょっとぶりにお伺いできて懐かしさを感じました。(また半年経たないうちに来るんですけどね)
やはり、自分としては一番心に刺さったセッションはキーノートですね。Nicki Wattさんによるキーノートだったのですが、ちょうど自分もAI × Platform Engineeringに非常に興味を持って、セルフサービスを実装したりしていたのでタイミング的にもバッチリな内容でした。
ポリシーシフトなど、まさに取り掛かっていたことでそこにAIをかけ合わせることは合ってるよねという答え合わせのような感覚でした。
あとは、株式会社MonotaROの伊藤さんによる「アーキテクチャの境界を越えて」も面白かったのですが、時間が足りずでスキップされたスコアリングの話とかが非常に気になったので、どこかでこのあたりの内容を講演していただけると非常に嬉しいです🙏(資料も読みます)
最後にLINEヤフー株式会社のmaruさんによる「ワークロードを処理しないプラットフォームに専念する」も刺さるセッションでした。
ちょうどこの中で語られていた状況に自分もなっていたりして、「これって最初から狙ってこの形になったんですか?」とご質問させていただいたところ「自然とこういう形に落ち着いて、後から振り返ってみたら良い感じの流れになっていたという感じなんですよね」とお答えいただき、自然とそうなったって理想的なフローだよなーと後から咀嚼して色々と思いに耽っていました。
去年はオンライン参加でしたが、今年オフライン参加して本当に良かったと思います。自分も本当にちょっとだけお手伝いさせていただいたコンテンツ類や、あとは運営スタッフの方の練度も高く、参加者の方の熱も非常に高いというオフラインで参加してみないと体験できないことばかりで、特にあるセッションでのQ&Aの質問内容が少し分かりづらく登壇者の方が困っているところを、司会をやってらっしゃる方が「〇〇ということかな?と思ったのですがいかがでしょう?」と質問内容を上手く噛み砕いて登壇者の方へ渡すという素晴らしいムーブをされていてお見事でした。
運営に関わられた方、スポンサー・登壇者の方、また有り難いことに私に声をかけていただいた方、皆様ありがとうございました!!🙏
[2025/09/25:追記]
Platform Engineering Kaigi様よりSlidoでのご質問が共有されましたので、個別に回答させていただきます。
Q:スクラムプロセスの自動化は具体的にどのような自動化があったのですか?
A:会場にてお答えさせていただきましたが、こちらでしっかり回答させていただきます。 スクラムでは主にGitHub Projectsを利用しておりまして、そちらの自動化が主なものになります。例えば、タスク種別に対しての総ポイント数の表示を行うブラウザ拡張機能や、スプリント終了時の定型処理(管理用に利用している差し込みタスクラベルの削除など)、PBIの総ポイントを管理スプレッドシートに転記などなど様々な自動化処理を行っています。
Q:セルフサービス実現で、「利用管理」というのが出てましたが、具体的にどういうことが出来るものですか?
A:こちらは開発環境の利用状況についてのお話でして、過去に記事化させていただきましたのでご参照いただけると幸いです。
Q: 既存インフラのIaC化をするときに効率的、確実に進める工夫をされていたら教えてください。
A: 個人的には「変更頻度の多いところを優先的にコード化する」といったことを指針としておりました。勿論、全ての既存リソースをガっとコード化するのが一番なのですが、リソースを多く割くことができない場合には優先順位を付けて徐々にやっていくことしかできません。 そのため、まずはコード化の恩恵を受けられる変更頻度の多いところ(例えばIAM周りとか)からコード化し、ストリームアラインドチームも「コード化してあるから触ることができた!」という体験を早めにしてもらうことで、IaC化の良い面を味わってもらうことを重視しました。
Q:そもそもの改善事項を洗い出し、その優先度を決める際にどのように進めましたか?優先順位の判断基準などありましたか?
A:優先度としてはやはり「ストリームアラインドチームが多く時間をかけてしまっているところ」を最優先としておりました。例えば、解決しても週1時間程度の業務効率化よりも週10時間の業務効率化の方がやる意味としては大きいですよね?そういった「課題を解決した際のインパクト」を中心に考えておりました。 また、改善のためのリソースが特に少ないもの(1時間で終わるタスク)などは別で管理しておいて、どうしてもやる気がわかない時などにササッと終わらせるなどしていました。
Q:権限付与にAI活用とのことですが、同程度の精度でされていたりしますか
A:どの程度の精度だったか?というご質問ですかね?(間違ってたらすいません)今のところは間違った付与はされていませんが、どうしても「大きい権限を持っているロールを付与」してしまうケースがチラホラ発生してしまっていて、なんとかしないとなという気持ちがあります。このあたりはVectorStoreで持たせている権限リストの調整や、Function Callingでのdescriptionでのプロンプト調整をやっていかなければいけないところかと思います。
Q:プラットフォームエンジニアリングの効果は測定しましたか?どのような方法で測定しましたか?
A:測定については適宜対話ベースで確認しているくらいですね...あとは社内で提供されている生産性管理ツールを参考にしているくらいです。本当はもう少しちゃんと測定するのが良いのでしょうが、測定範囲が小さいですので対話で済ませてしまっております。
Q:よりPlatform Engineeringを 意識した活動への視点の 面の課題解決 をされたとのことですが、ストリームアラインドチーム側から良かったよ、のようにFBはありましたか?
A:FBとしては「やりやすくなった」などの声は有り難いことに頂いております。
Q:IaC化をした後に、スキル差のためにうまく追加開発や運用で回らないことがありました。このような問題は発生しましたか?また、もし発生したとしたらどのように解決しますか?
A:小さいチームですので、問題は発生しても都度フォローに入ることで解決へ導く、といった流れでなんとかしている感じです。このやり方はもっと組織横断など大きい単位になると回らないとは思いますが、なんとなくの考えとしてはAI向けのドキュメントやMCPなどを用意して、AIエージェントを利用することでスキル差を埋めるといったことが最近だと可能なのでは?と思います。(実際に弊チームでも「AIエージェント使ってなんとかしました!」という事例が増えてきました)