🌥️
75%の業務負担削減と連携強化を実現!PayPay流クラウドインフラ改善レポート
公開
2025-03-30
更新
2025-03-30
文章量
約3508字
2025年1月28日に開催された「75%の業務負担削減と連携強化を実現!限られたリソースで成果を出すPayPay流クラウドインフラ改善【PayPay Growth Tech vol.10】」は、限られた人員やリソースでどのようにインフラ運用を効率化し、チーム間のコミュニケーションを強化しているのかを深掘りするイベントでした。
PayPay社内のシステムやクラウドインフラを担う System Platform部 が、実際に行った「年間75%もの手作業削減」と「OSのEOL(End of Life)対応でのアプリケーションエンジニアとの連携成功」の事例を中心に、具体的なアプローチや成果が共有されたのが本イベントの大きな見どころです。
スピーカーたちのバックグラウンド
1. 齋藤 祐一郎 氏
システムプラットフォーム部の部長として、フルクラウドで運用するPayPayの社内インフラを統括。自らもAWSエンジニアとしての経験が豊富で、これまでにメガベンチャーでのIPOや大手クラウド事業者でのソリューションアーキテクトを務めるなど、多角的なキャリアを積んできた人物です。 今回のイベントでは、System Platform部のミッションや組織づくりの考え方(オーナーシップ/孤独にさせない体制)など、部全体がどう支え合いながら運用改善を進めているかを紹介してくれました。
2. 野田 万里江 氏
System Operationチームのリーダーとして、年間75%ものオペレーション作業を削減した本人。決済・金融系システム開発や運用マネジメントの経験が長く、2023年にPayPayへ入社後は「手運用による膨大なマニュアル作業をどうにかしたい」という課題と正面から向き合って、実際に実績を出してきたキーパーソンです。 イベント中には、どんなプロセスで運用改善を進め、内部チームを巻き込むためにどう説得材料を用意し、どのように自動化・効率化を具体化したのかを丁寧に語っていました。
3. 猪野 真大 氏
Cloud Engineering 2チームのメンバーとして、OSのEOL対応をアプリ開発チームと緊密に連携しながら成功させた事例を披露。若手ながら大規模なサーバー群の移行やTerraform/Ansibleによる構成管理を推進し、“しっかり準備して段取りを組めば、期日固定の移行でも安定運用はできる”というメッセージを届けてくれました。
System Platform部とは? 〜フルクラウド体制のメリットと組織づくり〜
イベント冒頭、部長の齋藤氏より、System Platform部の役割や組織運営の考え方が紹介されました。
フルクラウドの恩恵 PayPayでは社内向けシステムを含め、ほぼすべてをクラウド上で運用。その結果、設備投資をソフトウェア化できるので、システムの改修・拡張がしやすく、スピード感のある施策が取れるというメリットがあるとのこと。 一方で、クラウド特有の複雑さも伴うため、どのように組織として効率化を図るかが課題になると語られました。
オーナーシップとチームワーク System Platform部は5つのチーム(クラウドエンジニアリング・オペレーションなど)から成り、アプリ開発チームや業務部門と連携しながら車内システムを内製で手がけています。 この中で「誰がボールを持つのか曖昧」だと効率が下がるため、「まずは自分が拾って動く」 というオーナーシップを部のカルチャーとして推進し、組織全体が前進する仕組みをつくっているそうです。
孤独にしない仕組み 特にリモートワーク下では、属人化・コミュニケーションの滞りが大きなリスク。そこで部内では、タッグ体制(リーダーと現場エンジニアの2人体制)や、細やかな定例会・1on1を設けて「孤独にしない工夫」を徹底。 さらに、チーム全員で朝会に議題を出し合う、部全体で運用方針・進捗を可視化するなど、オンライン下での情報共有を強力に実施していると強調していました。
事例①:手作業の75%削減〜優先度付けと粘り強い自動化
続く登壇者は 野田万里江 氏。彼女が率いる System Operationチーム が「わずか1年半でマニュアル作業51種類→13種類への削減」を成し遂げた軌跡は、きわめて実践的な内容でした。
まず業務一覧を把握し、優先度を基準化
51種類のマニュアル作業を「年あたりにかかる人件費」で可視化
さらに「シフト制の廃止につながるか」「どのチームが依頼元か」などの要素も加味して「マスト」「トライ」「ロー」など優先度を整理
自動化だけでなく、そもそも要らない作業を廃止
ファイル連携の繰り返し手動作業をバッチ化やS3権限付与で廃止
既存アカウント管理のワンタイム化により、セキュリティ強化にも寄与
各チームを巻き込むための説得材料
「作業が年換算でいくらコストを生むか」を数値化して説明
コミュニケーションの場を対面で設け、関係者に“痛み”を共有
結果として、オペレーションチームはほとんど残業が発生しない環境へと改善し、シフト制も撤廃。野田氏は「華やかな高度自動化ツールを投入したわけではなく、地道な棚卸しと小さなステップの積み重ねが大きな削減につながった」と振り返っていました。
事例②:OSのEOL対応をアプリエンジニアと連携し成功
3人目の登壇者は 猪野真大 氏。Amazon Linux 2 のサポート終了(当時は2025年6月と想定)に向け、各システムの大量サーバー移行を限られた期間でやり遂げた話を紹介しました。
移行計画:まずファーストペンギンを設定
全サーバーリストを洗い出し、システムごとに「廃止できるか」「コンテナ化か」「OS更新か」を仕分け
最初に比較的移行規模の小さいシステムを「初期事例」に選定し、移行フローを固めてから横展開することで大幅な手戻りを防いだ
Terraform / Ansibleで構成管理を一本化
一部手動構築していたリソースをテラフォームでIAC化し、OS設定・サーバー構成をAnsibleで管理
要件定義・設計書やヒストリーコマンドなど、あらゆる資料を照らし合わせて手順漏れをつぶしていった
チーム連携:観点漏れを最小化
責任範囲を明確化する一方、他チームの進捗やタスクも“無関心”ではいられない
実装・テスト範囲を共有し合い、障害対応時のリカバリポイントも事前に洗い出しておく
こうした念入りな準備と段取りの結果、移行先での障害もほぼゼロに抑え、期限内にサーバー更新を完了。猪野氏は「自分たちの範囲だけでなく、アプリ側のテスト内容にも目を配り、将来的な運用まで想定したIAC化がカギ」と語っていました。
全体を踏まえた感想 〜どこまでも“人と仕組み”が大事
「75%の繰り返し手作業を削減」「OSのEOLに伴う大規模サーバー移行の成功」――どちらの事例も、単なるツール導入だけでなく、『ビジネス的優先度をどう定義するか』『組織をどう巻き込むか』 に注力していたのが印象的でした。
多忙な開発チームに協力してもらうには、定量的にコストを示し、実例を先に作って説得力を高める。その一方で、部内ではタッグ体制やこまめな定例を通じて「自分ごと化」を徹底し、属人化を避ける――こうした仕組みこそが、“フルクラウドでスピード感を求められるPayPay”らしさを支えているように感じます。
また、イベント中「華やかなツールをいきなり導入しなくても、地道に棚卸しして小さな自動化を積み上げた結果、社内文化や意識が変わった」という言葉が何度も聞かれました。ITインフラエンジニアとして日々抱える課題――限られたリソースでどれだけ改善を進められるか――を、まさに目の前で体現しているような内容に、共感した参加者も多かったのではないでしょうか。
明日へのヒントを得るために
PayPayのSystem Platform部は今後も新機能・新サービスの影で支える運用改善や、マルチクラウドを含むクラウド基盤の拡張などに挑戦していくとのこと。彼らの「どんな作業でも地道に洗い出し、協力を得るための材料を用意し、人と仕組みで回していく」姿勢は、組織や技術スタックが違えど、あらゆるエンジニアに通じる教訓かもしれません。
もし今回のイベントや事例に興味が湧いたなら、ぜひカジュアル面談などでさらに詳しい話を聞いてみてはいかがでしょうか。数々の困難を乗り越えてきたチームの手法やノウハウは、きっと自分の現場でも役立つヒントをもたらしてくれるはずです。
Yardでは、テック領域に特化したスポット相談サービスを提供しています。
興味がある方は、初回の無料スポット相談をお申し込みください。
また、資料請求やお問い合わせもお待ちしております。テック領域の知見を獲得し、事業成長を一緒に実現していきましょう。