🧑🔬
『SUUMO』の裏側!第2弾 ~機械学習エンジニアリング編:イベントレポート
公開
2025-02-20
更新
2025-02-21
文章量
約2828字

Yard 編集部
フォロー
Yardの編集部が、テック業界の最新トレンドや知見について発信します。
本記事は、2025年1月30日にオンライン開催された「『SUUMO』の裏側!第2弾 ~機械学習エンジニアリング編」のレポートです。
リクルートの住まい事業(SUUMO)において、機械学習エンジニアがどのようにデータを活用し、ユーザー体験を高める取り組みを行っているのか。
普段あまり語られることのない具体的な事例が多数紹介された、熱量満載の1時間半となりました。
イベント概要
- イベント名
- 『SUUMO』の裏側!第2弾 ~機械学習エンジニアリング編
- 開催日時
- 2025年1月30日 (木) 19:00~20:30 (オンライン開催)
- 主催
- 株式会社リクルート データ推進室
- こんな方におすすめ
- リクルート住まい事業における機械学習エンジニアの取り組みに興味がある方
- 機械学習エンジニア/データエンジニアが業務でどう協働しているかを知りたい方
- リクルートのデータ組織での働き方が気になる方
- 登壇者
- 町田 和哉 氏(機械学習エンジニア)
- 生川 亮太 氏・宮﨑 悠樹 氏(機械学習エンジニア&データエンジニア)
- 芹澤 恒誠 氏(機械学習エンジニア)
- ファシリテーター:データ推進室 友近 圭汰 氏
- イベント資料
全体の流れ
- オープニング (19:00〜19:10)
- データ推進室の紹介、SUUMO住まい事業領域の概要
- イベントの目的:「SUUMOの機械学習エンジニアが、どんなエンジニアリングを実践しているか」を具体的事例で紹介
- 事例LT①:ユーザーの住まい希望から生成する「テーマ別レコメンド」登壇:町田 和哉 氏
- 背景と課題:SUUMOアプリには、初回起動セッションで離脱してしまうユーザーが少なくなかった。
- 取り組み:「プロフィール回答 → テーマ別レコメンド」をリアルタイム生成
- 簡単な4項目(お家の種類、エリア、価格、住む人数)を回答してもらう
- ユーザー固有の「テーマ」を複数生成し、それぞれに合った物件をレコメンド
- 技術的ポイント:
- テーマ生成で「タグの組み合わせ×期待物件数」→ 期待値の低いテーマを先行除外
- リアルタイムにフィルタしきるにはコストが大きいため、確率的に事前スクリーニング
- 成果:
- コンバージョンレート10%改善、アプリ初回起動のセッション数増
- 離脱率の低下に成功し、新規ユーザーに「物件閲覧の最初の一歩」を提供
- 事例LT②:LLMを用いたフリーワードテキスト活用とリアルタイムパイプライン登壇:生川 亮太 氏・宮﨑 悠樹 氏
- 狙い:ユーザーが「住まいで重視するポイント」をフリーテキスト入力 → LLMでタグ抽出 → レコメンドや可視化に活用
- 技術的な構成:
- SUUMO側で入力されたテキストをリアルタイム取得
- OpenAI API(GPT系)を呼び出し、あらかじめ定義したタグにマッピング
- 得られたタグをRedisに格納 → レコメンドが呼び出す
- 課題と対策
- トークン消費問題:内容が無いテキストにはAPIを呼ばず、事前に除外
- レスポンス遅延:複数用途のレコメンドがあるため、LLMが必要なものと不要なものを分岐
- 不安定性:タイムアウト・異常フォーマットに備え、エラーフラグを立て再試行(デイリバッチで回復)
- 実装後の効果:
- フリーワードから多彩なタグを抽出し、ユーザー独自のこだわりをレコメンドへ反映
- 将来的にはテキストそのものを機械学習モデルに組み込む/追加のLLMモデル対応など拡張
- 事例LT③:ディープニューラルネットワーク(DNN)の活用の試行錯誤登壇:芹澤 恒誠 氏
- 現状のSUUMOレコメンド:
- 2段階(ファーストステージでルールベース or 2towerモデル → セカンドステージでLightGBM)
- スコアリング対象物件数が非常に多いため、ルールベースの除外が基本
- DNN導入の利点:
- 画像やテキスト等、非構造データを特徴量として取り込みやすい
- 物件側はオフラインでEmbeddingを前計算 → 推論時の高速化
- エンドツーエンドで学習させることで、さらなる精度向上が見込める
- 具体的検証:
- to-towerモデル × ANN検索で高速な候補生成
- ランキングロスを用いた学習など、LightGBMに引けを取らない精度を実現
- オンラインテスト成果:
- 資料請求率で4%改善
- 2ステージ → 1ステージへの移行でシステムがシンプルになり、運用コストも下げられる可能性
- 今後の展望:
- モデルの最適化や特徴量の拡充(画像・フリーテキスト等)
- 転移学習など横展開で、さらに高品質なレコメンド実装を目指す
ディスカッション・質疑応答のポイント
- テーマ別レコメンド
- 事前に計算する「期待物件数」のアイデアが新鮮:全ケースをフィルタする前にスクリーニングして実行コストを抑える
- マーケ視点でのABテストや振り返りを通じて、10%という大幅なCVR改善を達成
- LLM × リアルタイム処理
- 数秒程度の応答遅延やトークン上限といったLLM特有の課題に対する切り分けアーキテクチャ
- エラー時の自動リカバリによる商用運用実現
- DNNモデルへの期待感
- これまでリコメンドの主力だった決定木モデルとは異なる手法
- 非構造データ(画像・テキスト)との相性が良く、さらなる精度アップが見込める
- 全体を支えるデータ推進室
- 横断的なエンジニアリング組織があるからこそ、データサイエンティスト・機械学習エンジニア・データエンジニア等が協働しやすい
- 大量データを扱う環境、社内ノウハウの蓄積、QAや運用設計のナレッジが揃っている
まとめとクロージング
約1時間半にわたるセッションでは、「SUUMOの裏側」で活躍する機械学習エンジニアが実践する開発事例が惜しみなく共有されました。下記のようなポイントが印象的です。
- ユーザー体験最適化:
- 「初回起動時のテーマ別レコメンド」で離脱率を下げる
- フリーワード入力をLLMでタグ化し、本人の“言語化しきれないこだわり”を拾う
- リアルタイム処理とLLMの運用ノウハウ
- トークン上限やレスポンス遅延など、LLM特有の課題をどうマネジするか
- 再試行&バッチリカバリで商用運用に耐えうる仕組みを構築
- DNNによるレコメンド精度向上への挑戦
- 2ステージ → 1ステージ化の検証結果は大きな勝利
- 将来的には画像・テキストなど非構造データを活かし、よりパーソナライズされた物件提案が可能に
イベントを終えて
- 住まい領域特有の「莫大な物件数&多様なユーザーニーズ」を満たすため、機械学習エンジニアリングは欠かせない存在に
- 機械学習エンジニア/データエンジニア/データサイエンティストが連携し、運用や改善サイクルを高速に回すところにリクルート流の強みがある
- 「RECRUIT TECH CONFERENCE 2025」(2月19日〜20日)本編でも、更に深いテック事例が発表予定
Yardでは、テック領域に特化したスポット相談サービスを提供しています。
興味がある方は、初回の無料スポット相談をお申し込みください。
また、資料請求やお問い合わせもお待ちしております。テック領域の知見を獲得し、事業成長を一緒に実現していきましょう。