🤝
「御社のDevin、何してる? 各社の事例に学ぶ!組織の一員としての付き合い方」イベントレポート
本レポートは、2025年5月12日に開催された「御社のDevin、何してる? 各社の事例に学ぶ!組織の一員としての付き合い方」の内容をまとめたものです。AIエージェント「Devin」が単なるツールにとどまらず、開発組織の一員としてどう馴染ませるかに焦点を当てたイベントで、導入と活用のリアルな事例がいくつも飛び出しました。
はじめに
ファインディが主催する本イベントは、「エンジニアがより挑戦しやすい世の中」を目指した取り組みの一環として行われました。登壇者は以下の3名です。
伊藤 のぞみ(コクヨ株式会社) ビジネスサプライ事業本部でテクリードを務める。2025年1月にDevinを導入し、実運用を開始。活用のきっかけと組織的な取り組みを紹介。
大沼 和也(株式会社グロービス) VPoEとしてオンライン学習サービスの開発をリード。Devinとその他AIツールを活用し、繰り返し生じる指摘をAIレビューに任せる工夫を共有。
r.kagaya(株式会社ログラス) LLM App Engineerとして生成AI/LLMチームの立ち上げや新規事業を担当。Devinの実セッションデータを元に、具体的な消費コストや導入効果を検証。
以下では、各登壇者の発表要旨とQ&Aをピックアップし、Devin導入・活用のポイントをまとめます。
1. コクヨ株式会社 伊藤 のぞみさん
「Why Devin? 期待感を持って踏み出した一歩、そして直面した課題たち」
内製開発組織の現状とDevin導入のきっかけ
コクヨのビジネスサプライ事業本部には、2024年7月に立ち上がった内製エンジニア組織(現在19名)がある。
以前から生成AIを活発に取り入れており、社内ガイドラインに従えば新しいAIツールを導入しやすい環境。
2025年1月にDevinを導入。VP of Engineeringから「AIエージェントを業務に取り入れよう」という呼びかけもあり、スムーズに採用が進んだ。
Devin導入で得られた効果
優先度が低いが放置されがちなタスク(ログ整理、既存コードのリファクタリングなど)を任せられる。チームが機能開発に集中できる。
ライブラリ更新作業のように半自動化しづらい箇所も、Devinが“自立的に”PRを上げてくれることで手放しでき、手数が増える。
スラックから直接タスクを依頼し、Devinがプルリクを出すワークフローは「もう1エンジニアが増えたような感覚」。
直面している課題
Devinが第一選択肢にならない
チャット形式の生成AIやGitHub Copilotへの慣れもあり、最初に「自分で書いちゃう」場面が多い。
メンバーには積極的に「Devinに依頼してみよう」と声掛けしながら、運用を徐々に定着させている。
プルリクの“完成度”が常に十分ではない
動作確認で問題が出たり、CEが何度も失敗し続けてDevinが諦めたりするケースがある。
依頼の仕方、Devinのマネジメント力なども含めて、“こちら”のスキルや指示の精度も問われる。
定量的評価の難しさ
組織として「Devinがもたらす生産性」を数字で示すのは難しい。導入効果をアピールするためのデータ取りが課題。
2. 株式会社グロービス 大沼 和也さん
「Devinにファーストレビューをさせ、コードレビューを効率化するには」
コードレビューが抱える課題とAIレビュー
冗長で繰り返し指摘が多いレビューは、エンジニアの認知負荷を高め、本質的な設計・議論に時間を割きにくい。
AIレビューアに定型的なチェックを任せることで、レビュー待ちPRが溜まる状況を緩和し、より高度な内容のレビューに集中したい。
運用ノウハウ
テスタブルな仕組みづくり
運用中もモデルの進化やナレッジの追加が発生するため、小さく責務を分け、フィードバックループを短くする。
ナレッジ管理
障害事例、過去の繰り返し指摘などをDevinに学習させる。コードベース・コーディング規約を参照しやすい形でインストールすると、AIレビューの精度が上がる。
ABテスト可能なオーケストレーション
別のモデルや別の設定を試して、その結果を比較検証できると改善サイクルが回しやすい。
事例:フレーキーテストの未然防止
フレーキーテストを多発させるような書き方のパターン(一定待ち時間での要素待ちなど)をナレッジ化し、Devinにレビューさせる。
人間がつい見落としがちな箇所にもしっかり気づいてくれるため、コードの安定度が上がる。
3. 株式会社ログラス r.kagayaさん
「データと事例で振り返るDevin導入の“リアル”」
具体的な運用データと分析
4月の約230セッションから実データを取得して分析。アクティブに使っていたチームの例では、Devinによるプルリクマージ率は約50%。
プルリクリードタイムは中心値3~4時間ほど。最終的な動作確認やローカル検証は人間がやるため、完全自動化とはいかない印象。
単純なドキュメント生成系はACU使用量が少なく、コスパが高い。中~大規模実装タスクはACUを大量に消費しがちで、うまくいかない場合は早めに“打ち切る”工夫が必要。
ナレッジ管理の悩み
既存の編集者向けルールやコーディング規約をDevinにも参照させようとすると、ルールが二重管理になるリスクがある。
生成AI関連ツールが複数ある中、どこまでDevin用に整備するかが悩ましい。
全体所感
小規模なマイクロタスク、POC目的のプロトタイプなどに強みを発揮。
既存リポジトリの本格実装も可能だが、完了まで人間の手直しが大きく入る場合はコストがかさむことも。
どの環境やチームかで効率が大きく変わり、自分たちのワークフローをいかにチューニングするかが鍵。
Q&Aまとめ
1. 「Devin導入で生産性はどの程度上がったか?」
香谷さん(ログラス) 新規検証段階でDevinのPR数が自分のPR数を上回った時期もあり、そこそこ大きく生産性が伸びたと実感。ただ厳密な数値化は難しい。
大沼さん(グロービス) 4キーメトリックス(4 Keys)で管理しているが、Devin運用を始めた月にPR数が300→650程度に増加し、リードタイムも100時間→80時間ほどに減少した。多少その他要因もあるが、一定の寄与が見られる。
伊藤さん(コクヨ) 6人のチームでDevinのプルリク本数がメンバー全員の合計を上回るなど、明らかに作業手数が増えたことを感じる。
2. 「導入してみて変わったマインドは?」
全員共通で、「細かいタスクや定型処理なら丸投げし、自分は別の作業に集中する」という意識にシフト。
手を広げすぎて雑になるリスクもあるので、人間がちゃんと最終レビューや方針確認をしておく大切さを再確認。
3. 「大きなタスクや複雑な要件で失敗しがち。タスクの切り方のコツは?」
まずは小さい責務に分割し、Devinが動きやすいように自ら段取りを整える。
計画段階で間違うと最後まで崩れてしまうケースが多いので、途中の進捗確認や設計レビューを人間がこまめに挟むと安定しやすい。
4. 「コード品質は上がった?下がった?」
大沼さん(グロービス):新たに気づく問題点も多く、網羅性が高まった感じ。
伊藤さん(コクヨ):ドキュメント作成など補助も増え、コード全体の可読性が向上。
香谷さん(ログラス):小~中規模タスクではメリット大きいが、大規模や複雑な実装で流れ作業的に受け入れていると“割れ窓”が増えるケースもあり、自分の「審美眼」も緩む恐れがある。
全体を踏まえた感想
Devinと“共存”するために
今回のイベントでは、Devinが単に「ソースコードを自動で書く」だけのツールではなく、組織のメンバー(=AIエージェント)として活躍できる可能性を感じさせる事例が多数共有されました。一方で、Devinが魔法のようにすべてを解決するわけではなく、「AIにタスクをどう切り出すか」「ナレッジをどの程度整備するか」「最終的な品質保証をどう行うか」といった人間側の工夫やチューニングが欠かせない、というリアルも明らかでした。
しかし、各社とも小規模な繰り返しタスクのオフロードやPOCの高速化で手応えを感じており、「手数が増える」「並列で複数タスクを同時進行できる」という点で大きな恩恵を得ています。導入当初は多少の試行錯誤やコストがかかってでも、Devin運用を軌道に乗せると、組織の新たな生産性や学習サイクルが生まれるという点が印象的でした。
今後、Devin自身のアップデートや周辺ツールの充実によって、さらに幅広い活用シーンが期待されます。最終的には、エンジニアが「本当に創造的・高度な作業」により時間を割けるような未来に近づくのではないでしょうか。
Yardでは、AI・テック領域に特化したスポットコンサル サービスを提供しています。
興味がある方は、初回の無料スポットコンサルをお申し込みください。
また、資料請求やお問い合わせもお待ちしております。テック領域の知見を獲得し、事業成長を一緒に実現していきましょう。
Read next
Loading recommendations...