🧑💻
AI時代におけるSRE、あるいはエンジニアの生存戦略 - Infra Study Returns #2
はじめに
2024年11月12日、「AI時代におけるSRE、あるいはエンジニアの生存戦略 - Infra Study Returns #2」というオンラインイベントが開催されました。本イベントは、かつて大きな盛り上がりを見せた「Infra Study」シリーズの復活編として企画されたものです。近年のインフラ技術の動向やエンジニアのキャリア論を、AI(特に生成系AI)の発展を踏まえて再考する場として、多くの視聴者が参加しました。
今回の登壇者は、GMOペパボ株式会社 シニア・プリンシパルエンジニアの P山 氏。さらにモデレーターとして、さくらインターネット研究所 主席研究員の 松本 亮介 氏が参加し、Q&Aセッションを通じて対話的にトピックを深掘りしました。
以下のレポートでは、イベント冒頭の背景や発表内容、そして視聴者から寄せられた質問と回答をまとめます。SRE(Site Reliability Engineering)の領域で、なぜAIの話が重要になるのか、そしてエンジニアはこれからどんな能力を磨いていけばよいのか――そんな問いを考える上で、多くの示唆を得られるセッションとなりました。
1. AIの発展とSREの関係
1.1 LLMの到来による衝撃
P山氏の冒頭では、2022年末以降に爆発的に注目を集めた生成系AI(特に大規模言語モデル:LLM)の進化が、エンジニアの仕事に与える影響を振り返りました。GitHub CopilotをはじめとするAIコーディングアシスタントの普及によって、従来エンジニアが時間を割いていたコード補完やテストコードの自動生成が一気に加速。さらに、問い合わせ対応や文章の要約、データ解析といった領域でも強力な支援が得られるようになったことが強調されました。
一方で、P山氏は「LLMが万能かというと、確率的な予測に基づいているため、間違いやハルシネーションが生じる」と指摘。ジュニアエンジニアが安易にLLMを信用しすぎると、かえってトラブルを引き起こすリスクがあるとのことです。今後も大規模言語モデルを活用するうえで、人間が出力結果を点検・判断する体制がしばらくは不可欠である、と見解を示しました。
1.2 SREにおけるAI活用
続いて、本イベントのメインテーマであるSRE(Site Reliability Engineering) の視点に立つと、AIの活用は以下のような場面で想定できるといいます。
アラート分析 インシデント発生時に吐き出されるエラーログやスタックトレースをそのままLLMに渡し、要因や対策のヒントを得る。もっとも、ハルシネーションを起こすと対処方針を誤る恐れもあるため、最終的な判断は人間の確認が大切。
オペレーションの補助 例として、クラウドインフラを構築するためのツール(Terraform等)をLLMが生成し、それを人間が最終チェックして適用するなどが挙げられました。コマンド自動生成を行うOSS(AFAなど)も登場しており、機械的な作業負荷を大幅に下げる余地があります。
インシデント管理の効率化 従来のSREが取り組んできたポストモーテム(障害後の振り返り)や課題抽出でも、AIが原因を推定してくれる可能性があります。ただし、学習データやシステム情報をどう安全に与えるかなど、新たな課題も残るようです。
2. AI活用によるエンジニアの仕事像
2.1 「知っているが、試したことがない」領域を切り開く
P山氏は、「自分が既に基礎知識として知ってはいたが、深く実装したことがなかった領域」でAIが大いに力を発揮すると述べました。たとえば、機械学習の理論自体はある程度学んでいたものの、自らモデルを組んでECサイトのアクセス解析に生かすアイデアは思い浮かばなかった。しかし、実際にLLMからコードの生成やアドバイスを得ると「ここなら自分でも実装できそうだ」と感じられ、すぐに試作が可能になったそうです。
この例から得られる学びとして、「浅く広く知識を押さえておく」ことの重要性を強調しました。ゼロから何も分からない状態では、AIの回答を評価することができません。一方で基礎理解さえあれば、未経験の領域にもチャレンジしやすくなるのが現在のAI環境ならでは、とまとめています。
2.2 プロンプトエンジニアリングへの冷静な眼差し
イベントでは「プロンプトエンジニアリング」という言葉にも話題が及びましたが、P山氏は「個人的にはあまり好きではない」と率直に語りました。理由は、あくまでAIの背後にある仕組みを理解しないまま「あなたは○○です」といった接頭辞を加えるだけで結果をコントロールしようとするのは、技術的に本質を捉えていない可能性があるからだそうです。
LLMは「確率的に次の単語を推定する技術」であり、正しい設定を書いても必ずしも完璧な結果が出るわけではありません。また、接頭辞でロールを付与したからといって、常に優れた出力になるとは限らない点も強調されました。
3. Q&Aハイライト
イベント後半では、モデレーターの松本氏が視聴者から寄せられた質問を取り上げ、対話形式で議論が展開されました。主な内容をピックアップします。
3.1 プログラミング学習のモチベーション
「23歳のインフラエンジニアだが、LLMによってコードを自動生成してくれるためプログラミングを学ぶモチベーションが下がっている」という質問がありました。これに対してP山氏は「基礎的なプログラミングや設計力は今後も極めて重要」と回答。LLMがうまくコードを出力してくれても、チームで長期間運用する視点で考えると、設計・保守面の本質は人間の把握が欠かせないと強調しました。
3.2 AI導入を嫌がる組織との向き合い
「AIは間違えるから」という理由を掲げ、LLM導入に積極的でない上司やチームメンバーをどう説得すればいいのかという質問もありました。これに対しては「小さなスコープで試し、リスクが低いところで成果を示すか、上位の権限を持つ人を巻き込んでトップダウンで進める」などのアプローチが提案されました。
3.3 AIと“面白い仕事”
AIの発展で「エンジニアとして面白い部分が奪われるのでは」という懸念に対しては、P山氏は「機械に任せられる作業はおそらく任せてしまって構わないし、自分の好きな面白さにフォーカスすることも可能になる」と見解を示しました。最初のアイデアやプロダクトの方向性を決めるなど、“人間が創造力を発揮できる”領域に注力するほうが有意義ではないかと話されました。
4. 全体を踏まえた感想 〜「何を知って、何を創るか」を再考する
「AIは間違える」「人間のほうがミスする」――こうした議論が飛び交うなか、SREやインフラエンジニアの視点からすると、本質的には“どちらが間違えたとき、どんな仕組みでカバーするか” が重要になると感じられました。生成系AIを活用したモニタリングや障害対応のヒントは大量に出てきますが、最終判断をどう下すかは、しばらく人間に委ねられそうです。
一方、AIの活用が進めば進むほど、技術者が面白いと思う部分を選び取り、深く追究することの価値はむしろ増すのではないでしょうか。面倒な単純作業を機械化してしまえば、自分の能力を「もっと創造的なテーマ」に振り向けられるからです。P山氏が言うように「ゼロから新たな発想を生む」とか「既存のテクノロジーを組み合わせてユニークな仕組みを作る」作業は、まだまだ人間の独壇場であり続けるでしょう。
最初から最後までLLMに丸投げするのはリスクもあるし、本当に面白い部分を経験できなくなるかもしれません。だからこそ、エンジニア個々人が「どこまでをAIに任せ、どこからを自分の頭で考えるか」というラインを引き直しながら、必要な基礎知識や設計力を鍛え続けることが大事になりそうです。SREという文脈でも、観測や自動化のツールがより高度化していく一方で、「サービスの信頼性を守るための最終判断」を下す責任は当面、人間が担うはずです。
このイベントを通じて浮き彫りになったのは、「広く浅く知っていること」と「じっくり腰を据えて深く取り組むこと」のバランス感覚をどう養うかです。LLMに質問するためにも一定の知識は要りますし、答えが返ってきても、それを見極める眼がなければ活用できません。AI時代のSREやエンジニアは、従来にも増して「自分が何を知っていて、何を知らないのか」を自覚し、賢くAIとコラボレーションする働き方を見つけていくことになるでしょう。
Yardでは、テック領域に特化したスポット相談サービスを提供しています。
興味がある方は、初回の無料スポット相談をお申し込みください。
また、資料請求やお問い合わせもお待ちしております。テック領域の知見を獲得し、事業成長を一緒に実現していきましょう。
Read next
Loading recommendations...