🤖
SmartHR AI tech talk#1 ── 実サービスでの AI 利用のリアル レポート
2025 年 2 月 26 日、「SmartHR AI tech talk#1 ── 実サービスでの AI 利用のリアル」がオンラインで開催されました。ここでは、株式会社 SmartHR が新たに立ち上げた AI 専門チーム「AI インテグレーションユニット」の取り組みや、PharmaX 株式会社の上野様がどのように AI エージェントを実サービスで活用し、課題を乗り越えてきたかといった具体例が共有されました。
当日は、SmartHR からの最新の AI 導入事例「AI 履歴書読み取り機能」の紹介と、PharmaX における AI エージェント導入のリアルなお話、さらに両社によるパネルディスカッションも実施され、参加者から多数の Q&A が寄せられました。
オープニング
冒頭ではモデレーターの齋藤 諒一(株式会社 SmartHR VP of Engineering)氏より、イベントの趣旨やタイムテーブルが紹介されました。AI エージェントや LLM(Large Language Model)のビジネス導入は昨今注目を集めているものの、具体的な制約やリスクも多く、その一方で大きなインパクトを与える可能性も非常に高いという現状があります。
齋藤氏自身も、社内で多数の新機能導入に携わってきた経験から「今回は記念すべき第 1 回として、PharmaX 上野さんとともに“実際にどうやって AI を使うのか”を掘り下げていければと思います」と意気込みを語りました。
セッション 1:SmartHR「意外とやるぞ!マルチモーダル LLM のプロダクト適用」
AI インテグレーションユニットの役割
SmartHR の金岡 亮(Head of AI)氏は、まず 2024 年 8 月に組成された AI インテグレーションユニットの概要を紹介しました。同ユニットは、既存プロダクトへの AI 技術の導入だけでなく、新規 AI プロダクトの開発までを一貫して推進する組織とのことです。
AI と SmartHR の競争優位 SmartHR が扱う人事労務データは、日本国内でもトップクラスの規模です。この豊富でユニークなデータ資産と、確率的な AI 技術を組み合わせることで、さらなる業務効率化と新たなユーザー体験を生み出せる可能性があるという見通しが示されました。
AI 履歴書読み取り機能
次に、同社が 2025 年 2 月 13 日にリリースした「AI 履歴書読み取り機能」について詳細が語られました。従業員の入社時などに発生する履歴書の情報入力作業を大幅に効率化するために、マルチモーダル対応の LLM が活用されています。
マルチモーダル LLM 採用のポイント 従来の OCR とルールベースの仕組みでは、多種多様な履歴書フォーマットへの対応に限界がありました。一方、複数のモデルを組み合わせるとコスト面や処理速度の面でリスクがあったため、「1 本のマルチモーダル LLM でどこまでできるか」を試行した結果、十分実用的な精度が得られたとのことです。
コストと精度のバランス 金岡氏が「特に気をつけたのが API コストです。使われる頻度が高い機能ほど料金面のインパクトが大きくなるので、トークン課金体系を入念に検証しました」と語っていた通り、精度とコストの最適点を探し出すために、テストデータの作成とモデル比較を地道に行ったそうです。
Q&A(抜粋)
Q: 「評価用のデータセットはどのように作りましたか?」 A:(金岡氏) 「最初はチームメンバー総出でテスト用の正解データを地道に作りました。文字入力ミスのダブルチェックなど、アノテーション作業が意外と大変ですが、最終的にユーザーに提供する際の品質を担保するために必要なプロセスです」
Q: 「信頼性の確保はどのように?」 A:(金岡氏) 「最終的にはユーザーが本人情報を目視で確認するステップも存在します。氏名などが変換ミスされる可能性はゼロにはできませんが、そこを含めてもメリットが非常に大きいので導入を決めました」
セッション 2:PharmaX「AI エージェントの評価」
YOJO サービスでの AI 活用
PharmaX 株式会社 取締役 CTO の上野 彰大氏は、同社が提供するオンライン漢方相談・購入サービス「YOJO」での AI エージェント活用を紹介しました。薬剤師のサポートが必要な場面をすべてルールベースで自動化するのは難しく、LLM エージェントが人間に指示を出しつつ回答する仕組みを採用しているとのことです。
段階的なタスク分割 「フェーズ」という単位でワークフローを区切り、エージェントが自立的にメッセージを返す/薬剤師に確認を求める/購入を促す、などの判断を行います。一度にすべてを自動化せず、重要度の高い場面から AI 対応を広げる戦略が奏功しているそうです。
AI エージェントを評価する方法
上野氏によると、プロンプトの組み合わせが 100 近く存在するため、どこでミスが起きやすいのかを細かく評価する必要があります。その際には「アプリケーションの品質評価(出力テキストの正確性)」「ユーザー価値(利用率や満足度)」「ビジネス成果(購入率など)」の 3 つのレイヤーを意識しているとのことでした。
LLM-as-a-Judge の活用 AI が生成した回答を再度 LLM に評価させる「LLM-as-a-Judge」という手法を取り入れており、出力されたメッセージが想定ルールに従っているかをスコアリングさせるアプローチを導入しています。ただし、このスコアもまた LLM が生成した文字列であるため、人間によるアノテーションやファインチューニングで信頼性を補完しているとのことでした。
Q&A(抜粋)
Q: 「LLM が返す評価スコアの信頼性はどう担保していますか?」 A:(上野氏) 「人手による評価や、専門家(薬剤師)からのフィードバックとつき合わせを行い、LLM 評価用のプロンプトも継続的に改善しています。最終的にはファインチューニングを活用し、人間の基準と近い結果が得られるよう調整するやり方で精度を上げています」
Q: 「リリース前にどこまで検証するのですか?」 A:(上野氏) 「最初は“サジェスト”の形で薬剤師が確認して問題ないことを確認してから、段階的に自動化領域を広げています。安全策をとりつつ、本番データでのモニタリングも欠かしません」
パネルディスカッション:実サービス導入で得た知見
最後のパートでは、PharmaX の上野氏と SmartHR の金岡氏、そしてモデレーターの齋藤氏がディスカッションを行いました。主に以下のようなトピックで深堀りが進み、会場(オンラインチャット)からも多数の感想が寄せられました。
リリース判断のポイント
コストと精度、さらにはリスクのバランスを事前に明確化する
一気に全業務をカバーしようとせず、メリットを感じやすい領域から導入する
モデルやツールの選定
複数のマルチモーダル対応モデルやコーディング支援ツールを試してみる
個々のユースケースで「速度」「コスト」「使いやすさ」を比べる
ユーザーの受け入れを高める工夫
BtoB なら課題解決のインパクトを説得材料に
BtoC(または BtoE)なら「人間らしさ」や「寄り添い感」も重要
今後の展望
溜まったデータを活かし、さらに自律度の高いエージェントへ発展させる余地がある
一方で、細かいフロー制御や専門家の承認を組み合わせる現実路線も当面は有効
まとめと感想
今回の「SmartHR AI tech talk#1」では、AI を実サービスに導入する際に直面するリアルな課題が具体例とともに示されました。単に LLM を組み込めば良いというものではなく、コストと精度のバランシング、細かな検証プロセス、そして最終的に人間がフォローできる仕組みをどう実装するかが鍵になります。
PharmaX の上野氏が見せた「段階的に自動化領域を広げる戦略」や、SmartHR の金岡氏が強調した「課題選定と費用対効果の検証」は、どの業界にも通じる実践的なアプローチと言えるでしょう。技術とビジネスの両視点を兼ね備えた開発・評価体制を整え、ユーザーにとって本当に価値ある AI 活用を実現する── そんな未来図が、今回のセッションを通じて明確に感じられました。
次回以降も、SmartHR では AI に関する様々なテーマでイベントを開催予定とのこと。より高度なモデルの選定や運用、あるいは組織での導入ノウハウなど、いっそう深掘りが期待できます。リアルな知見の共有を通して「日本の業務効率や生産性を底上げしたい」という両社の想いが、多くの参加者にも伝わったのではないでしょうか。
新しい技術が台頭するときこそ、地道な評価と運用設計が欠かせない ── そんな当たり前のようでいて本質的な学びに満ちた、濃密な 90 分間でした。次回も、さらにリアルな事例を楽しみに待ちたいと思います。
Yardでは、テック領域に特化したスポット相談サービスを提供しています。
興味がある方は、初回の無料スポット相談をお申し込みください。
また、資料請求やお問い合わせもお待ちしております。テック領域の知見を獲得し、事業成長を一緒に実現していきましょう。
Read next
Loading recommendations...