OpsJAWS Meetup33 AIOps イベントレポート

Insight

2025年3月4日、「AIOps」をテーマにした運用系コミュニティの勉強会 OpsJAWS Meetup33 がオンライン開催されました。

インフラ運用やクラウド管理の分野では、従来の監視・自動化だけでなく、機械学習や生成AIを使った改善が注目されています。今回のMeetupでは、AWSサービスをフル活用してAIOpsを実践している事例や、これからのAIOpsの可能性について、8名のスピーカーが知見を共有しました。

1. AI自体のOps 〜LLMアプリの運用、AWSサービスとOSSの使い分け〜

最初の発表では、みのるんさんが大規模言語モデル（LLM）を活用するアプリケーションの運用を支援する様々なツールを紹介しました。特に注目されたのが、LLM向けの監視・評価のフレームワークとして台頭しているLangSmithやLangfuse。これらを使うと、LLMアプリがどのような入出力をやり取りしているかをトレースしやすくなり、デバッグや改善の手がかりが得られるそうです。「LLMアプリが複雑化するほど、オブザーバビリティを確保するツールが重要になる」という指摘が印象的で、AIOpsの新しい監視領域として要注目と感じさせる内容でした。

2. Amazon CodeGuruをGitHubと統合してアプリケーションの品質管理を楽にする

続いて、戸塚翔太さんによるCodeGuruの解説。 CodeGuruはAIを使ってコードの脆弱性やリファクタリングポイントを検出してくれるサービスですが、GitHub Pull Requestのコメントに自動で指摘を書いてくれる機能を使うと、PRレビューが大幅に効率化するというデモを紹介。実際に試したところ、15分ほどでレビューを自動化できて、コード改善のヒントが続々提示されたそうです。発表後の質問でも「セキュリティレビューを早期に取り込めるメリットが大きい」という声があり、開発と運用での品質向上が期待されると感じました。

3. AIを先生に〜Slack × Bedrock で育成担当の人材不足解消を考える〜

3番手の藤本竜司さんは、テクニカルサポートエンジニア育成における「AIが先生役を少し担う」実験を披露。 Slackで質問すると、Amazon Bedrockに裏で問い合わせして**「まずこう書くべき」「文面はこれが不自然」「要約や5時脱字チェックもOK」**といったレビューを自動で返してくれるボットを開発したそうです。育成担当者のレビュー待ち時間を大幅に短縮し、本人もリアルタイムにセルフチェックできるメリットが大きいとのこと。ユーザーの投稿内容をある程度フィルタしてAIに渡す仕組みが要となり、安全に効率化を実現していたのが興味深い事例でした。

4. もしもマラソンランナーが operational investigations を有効化したら

4番手の田所隆之さんは、ややユーモア混じりに「オペレーショナルインベスティゲーション (Amazon Q Developer) を使うと、トラブル解析がどれだけ楽になるか」を紹介。マラソンを走る亀さんとウサギさんを比喩に、オペレーショナルインベスティゲーションでクラウドウォッチやトレースログを参照できる権限を与えているかどうかで、問題の原因を特定できるかが大きく変わるという実演をしていました。「オペレーショナルインベスティゲーションは情報がなければ動けない」という当たり前の教訓が、亀とウサギの楽しい寸劇を通じて印象に残るセッションでした。

5. Bedrockによるエラー通知のフィルタリング

後半に入り、大竹郁弥さんは「エラーログが多すぎる」問題をBedrockで解決できないかと試作した話を展開。クラウドウォッチLogsからLambdaでエラーログを受け取り、さらにBedrockで「通知が必要な本当のエラーだけ判別」してもらう仕組みを実装し、不要な通知を減らせたそうです。実験では各モデル（ノバやClaude）によって精度が若干異なるという興味深い結果が出たとのこと。まだ本格運用にはチューニングが要るが、「AIOpsにおけるログフィルタリングの可能性は十分感じた」とまとめられていました。

6. 元祖 AIOps！メトリクス異状検知からはじめよう〜さようなら Lookout for Metrics〜

続く**木村健人(AoTo)**さんは、クラウドウォッチのAnomaly DetectionやLookout for Metricsの歴史を振り返りながら、「AIOpsでまず試すべきはメトリクスの異常検知ではないか」と提言。 Lookout for Metricsが廃止の方向になり、代わりにクラウドウォッチや他の仕組みで異常検知が進化していることに触れ、「可視化やしきい値管理にAIが自然に溶け込んできた時代になった」とまとめました。 AIOps導入の第一歩として“クラウドウォッチアノマリーデテクション”を活用するのが手軽かつ効果が高いとの言葉が印象的です。

7. Amazon Bedrockガードレールで守る安全なAI運用

7番手は為藤アキラさんが、Bedrockのガードレール機能を活用して不適切コンテンツや個人情報漏洩を事前に遮断するアプローチを紹介。他のLLMサービスだと事後モデレーションが多いが、Bedrockならモデルの前後にフィルタリング層を置いて自動的にブロックできるため、「運用者がポリシーを徹底しやすい」というメリットがあると強調。具体的にはDenied TopicsやSensitive Information Filtersを組み合わせて使えば、企業として不適切なAI応答を防ぎつつ、運用負荷を減らす運用を実現できるとまとめていました。

8. Amazon Q Developerを用いたAWS運用改善〜自動化スクリプト生成〜

最後に山本晃平さんは、Amazon Q Developer CLIを使って運用スクリプト生成を行った実践を語りました。手動で行っていたバッチ実行監視やSSMパラメータのバックアップ処理などを、Q Developerに対して「クラウドフォーメーションをセットで生成して」「プロファイルも切り替えて」「メニュー画面で操作できるようにして」と指示するだけで数時間で完成。小規模とはいえ手戻りが激減し、手動作業の時間を大幅に削減できたとのこと。「余裕ができた分を根本改善に回せる」と述べ、AIOpsでも生成AIのコード自動生成は有力なアプローチと感じさせる内容でした。

全体を踏まえた感想：「AIOpsの未来が広がる、実践的なソリューションの数々」

今回のOpsJAWS Meetup33は「AIOps」をテーマに、AWSが提供するAI/ML系サービスの運用活用から、OSSやLLMエージェントを絡めた先端事例まで、非常に豊富な知見が披露されました。

特に印象的だったのは「AIOpsといえばログ分析や異常検知だけではない」という流れです。LTの中では、CodeGuruやQ Developer、Bedrockガードレールなどを使ったコードレビュー・マルチエージェント運用・不適切応答の遮断・運用スクリプト生成といった具体的な事例が多く、AIが運用者の作業をサポートし、さらには“事前対策”まで可能にしている姿がよく伝わってきました。

一方で、AIを使ううえでのガバナンスや安全性に関する話題もあり、Bedrockガードレールがその鍵を握るという指摘は説得力がありました。マネージドなフィルタリングが整いつつあるとはいえ、最終的に“どのような方針を敷くか”を運用担当者が継続的に設計・見直しすることが欠かせない、というメッセージが共通していました。

AIOpsの領域は進化が速く、今回のMeetupだけでも最新機能がいくつも紹介され、実際に動かしているエンジニアが増えてきた印象です。今後もOpsJAWSではAIOpsに関する知見共有が続くとのこと。ぜひ次回も参加して、新時代の運用に向けた技術ヒントを得てみてはいかがでしょうか。

Yardでは、AI・テック領域に特化したスポットコンサルサービスを提供しています。

興味がある方は、初回の無料スポットコンサルをお申し込みください。

また、資料請求やお問い合わせもお待ちしております。テック領域の知見を獲得し、事業成長を一緒に実現していきましょう。

Yardについてもっと知りたい方へ

詳細なご説明やご相談をご希望の場合は、以下フォームよりお気軽にお問い合わせください

Yard 編集部

Yardの編集部が、テック業界の最新トレンドや知見について発信します。

フォロー