💵
限られたリソースで成果を出すPayPay流クラウドインフラ改善【PayPay Growth Tech vol.10】 イベントレポート
公開
2025-04-03
更新
2025-04-03
文章量
約4439字

Yard 編集部
Yardの編集部が、テック業界の最新トレンドや知見について発信します。
近年、クラウドを活用した高速な開発・運用が当たり前になっている一方、「実際にはさまざまな手作業が残っている」「OSアップデートの度に疲弊する」「開発チームとの連携がうまくいかず膨大な時間を費やしている」といった声を耳にすることが少なくありません。 そんななか開催されたのが、PayPay株式会社 System Platform部 によるオンラインイベント「75%の業務負担削減と連携強化を実現!限られたリソースで成果を出すPayPay流クラウドインフラ改善【PayPay Growth Tech vol.10】」でした。
本イベントでは、PayPayの社内インフラやシステム運用を担うSystem Platform部が、いかに運用負担を大幅に削減しつつ、アプリケーションエンジニアとの協力体制を築いているのか。具体的なエピソードを交えて語られました。社内インフラをフルクラウドで構築しながらも、「人間くさい泥臭い作業と地道な交渉・説得にこそ本質がある」と明かす姿勢が大変印象的な回でした。
はじめに – System Platform部とは
最初に登壇したのは、System Platform部 部長の齋藤 祐一郎さん。同部は「PayPayの社内システムをフルクラウドで構築・運用し、社内利用を支える組織」と位置づけられており、AWSなどを活用したクラウドインフラの構築・保守、運用チームによる24/7の体制、開発チームや業務部門との連携が大きなミッションとなっています。
従来型のオンプレ中心のシステムと異なり、「フルクラウドゆえに設計・改善のスピードが速く、ソフトウェア的アプローチでの試行錯誤がしやすい」一方、日々大量の新規サービス開発の要望が飛び込んでくるため、「運用面での無駄や属人化をいかに省き、継続的に改善できるか」が大きなテーマになっているとのこと。
齋藤さんはさらに、System Platform部が大切にしている3つの価値観として、 「フルクラウドの利点を最大化する」「個々がオーナーシップを持つ」「孤独にさせない文化」 を挙げました。後続の事例発表は、この3つが見事に体現される形で進んでいきます。
事例1: オペレーション作業を75%削減した運用改善(野田 万里江)
続いて登壇したのは、System Platform部のシステムオペレーションチーム リーダーの野田 万里江さん。PayPayに入社して1年あまりで、運用チームの手作業を75%削減したという実績を語りました。
業務棚卸しと「金額換算」による優先度付け
まず野田さんが着手したのは、「オペレーターが行う全定期作業の棚卸しと、優先度の“数値化”」。 例えば、1日30分×2人×20日×12カ月という形で、作業の年間工数を金額で試算してみると「思いのほか大きな額になり、開発チームや上層部を説得しやすくなった」そうです。さらに、「朝晩などのシフトが発生する作業は優先度を上げて削減する」といった追加基準も導入し、“まずはこれを削減すべき”というマスト作業に絞り込む段階をクリアしていきました。
自動化だけでなく「不要作業の廃止」「作業手順の効率化」
続いて「どうやって削減するか」を検討した際、野田さんは3パターンに分けたとのこと。
そもそも廃止できる作業 過去の暫定対応や心配によるダブルチェックなど、実は不要だった作業が意外と多く、棚卸し時点で「これ要らないよね?」と洗い出すだけでいくつも廃止できた。
アプリ回収 or ツール開発 日時のデータ連携などは、バッチ化やWeb APIを通じた自動連携に切り替えることで短期間に効率化できる場合がある。開発チームに相談した結果、意外とすぐ対応できる項目も少なくなかった。
手順の最適化(半手動化/RPAなど) 「自動化は難しいが、人間がやる量を減らしたい」場合に、CLIコマンドなどで操作を一括化したり、最終手段としてRPAに任せるケースもあった。
野田さん曰く、「完全に自動化が難しいからといって諦めるのではなく、廃止・半手動化・RPAなど複数の切り口で少しずつ負担を減らしていくのが肝だ」と語りました。
具体的自動化の事例
いくつかの詳細事例も紹介。代表的には:
CSV/TSVの手動アップロード 毎日オペレーターがS3へアップロードする作業を、関係部門に権限付与&簡単なマニュアルを整備するだけで本人たちが直接実行できるように。改めて「実は自分たちでもできるよね」と相手を説得しただけで、オペレーションがごっそり削減された。
セールスフォース連携の自動化 1日2回ほどSalesforceからファイルをダウンロードし、S3にアップロードするという手間を、LambdaとAmazon AppFlowでバッチ化&自動実行。朝晩の手作業がなくなり、シフト要員まで減らせた。
RDSのログインアカウント運用 手運用でアカウントを発行・削除していたが、申請フォームとLambdaを組み合わせ、1回限りのワンタイムアカウントを自動生成・削除する流れを作成。セキュリティ強化にもつながった。
こうした成果事例の積み重ねにより、かつて50を超えていた繰り返し作業は13まで削減。「一つ一つは地味な試作だが、すべて合わせると運用体制が見違えるほどラクになり、シフト廃止まで実現できた」とのことです。
事例2: OSのEOL対応をアプリケーションエンジニアと連携して成功(猪野 真大)
後半パートでは、クラウドエンジニアリング2チームに所属する若手エンジニアの猪野 真大さんが、Amazon Linux 2のサポート終了(当初は2025年6月予定)に向けた大規模移行プロジェクトを事例として語りました。
1年半の期限を意識したプロジェクトマネジメント
Amazon Linux 2のサポート終了が迫るなか、EC2上で稼働する社内システムの多くが同OSを使っていた。猶予が1年半ほどしかないため、移行方法を迅速に決めなければならない状況です。
「まずは大まかな棚卸しをし、廃止できるもの・コンテナ移行すべきもの・OSをそのままマイグレーションするもの、の3パターンに分類。廃止やコンテナ化が難しいものは結局OS差し替えになる」とし、最初に小規模システムで試行し、得られた知見を横展開していく進め方を採用したそうです。
TerraformとAnsibleで手動構築を大幅効率化
いざOS更新を行うにあたって、旧来の手順書ベース・コンソール操作では多大な時間がかかる。そこで「インフラ構成はTerraformでコード生成、サーバー設定はAnsible化」をセットで実施。
TerraformではAWSリソース構成をコード化し、「インポートブロック」等の仕組みを用いて既存構成から柔軟にコード生成できるよう工夫。
AnsibleではサーバーOSやミドルウェア設定をスクリプト化し、CI/CDフローを用いて一貫管理。
「OS更新とは別軸ではあるが、EOLを機にIACを推進したおかげで、今後のメンテ時間が減り、認知負荷も軽くなるメリットが大きかった」と猪野さんは語りました。
開発チームとの連携 – ボールを落とさないための工夫
OS差し替えに当たり、各アプリケーションエンジニアにも調整が必要。例えば「どの日程でリリースし、どのようにテスト・ロールバックをするか」など、インフラとアプリの境界で相互依存が多いからこそ、責任分担を明確化したうえで「お互いの範囲を把握し合う」 ことを意識したと強調します。
初期事例を作る 最初に少数のシステムでOS切り替えを通しでやり、その中で発生した課題やテスト項目を一般化して、他システムへ展開。
他チームのタスクもなるべく把握 責任分担を押し付けるのではなく、「なぜこのチームが担当するのか」をお互い認識したうえで、タスク進捗がどこまで完了したか、常にコミュニケーションを絶やさないようにした。
リリース障害時のポイント整理 障害ポイントを事前に洗い出し、発生時には開発チーム・運用チームそれぞれがどう対応するかを明確にする。結果、移行完了後にシステム障害が0件で済んだのは、この調整力があってこそとのこと。
全体を通して – 組織で取り組む意味と文化醸成
野田さん・猪野さんの事例から共通して見えてきたのは、「一件ずつは小規模な運用改善やアプリ回収でも、関係部署や開発チームとの連携なしには成立しない」という点。あるいは、OS移行のように期限が決まっているタスクでも、結局はインフラとアプリが絡むため、スムーズに進めるにはお互い“どこまで面倒を見るか”を緻密に擦り合わせる必要があると示されました。
PayPay社内では、 「フルクラウドの利点を最大限に」「それぞれがオーナーシップをもち、近隣チームも巻き込む」「孤独にさせない文化」 が徹底されているため、運用チームが単独で苦しんだり、開発チームが無関心のまま突き放す事態を回避できているようです。これが結果的に大規模案件を成し遂げる基盤になっているのだと感じました。
今後に向けた感想 – 小さな試みの積み重ねが運用文化を変える
今回のイベントは、華やかな「最新クラウド技術で一発逆転!」というよりも、 「必要不可欠な地道な改善を、しっかり運用文化まで変えて大きな成果につなげた」 という視点が大変印象深いものでした。
運用作業を廃止する際には、必ず関係部門を説得し、必要に応じてリーダー層を巻き込む。
自動化するだけでなく、「この作業、そもそも要る?」の棚卸しが効果的。
OSやインフラ構成の移行でも、開発チームとの緊密な連携が不可欠。
インフラ構築のIAC化を同時に進めると、アプリチームも恩恵を受け、協力を得やすくなる。
一見すると遠回りのような泥臭いステップが、最終的には効率・品質・組織文化のすべてを上げる鍵になっているのです。「75%削減」という数値の大きさだけでなく、「保守運用する人員・時間を大幅に抑えた結果、よりクリエイティブな取り組みにリソースを割けるようになった」点こそ、本質的な収穫だといえるでしょう。
イベント終了間際、登壇者が一様に口にしていたのは、「もう少し時間があれば、さらに個別の小ネタや失敗談も共有したい」という言葉でした。小さな失敗を積み重ねても、「孤独にしない」「まず小規模システムで成功事例を作って横展開する」「価値やコストを金額換算して理解を得る」—こうしたアプローチを粘り強く続ければ、大規模運用でも大幅な削減が実現できるのだと、改めて示されたイベントでした。
もし同様の課題を抱えている方がいれば、 "一度やってみる" という姿勢で、小さな部分からでも改善に取りかかってほしい。その際に、今回のPayPay System Platform部の事例が、大いに参考になるはずです。
Yardでは、テック領域に特化したスポット相談サービスを提供しています。
興味がある方は、初回の無料スポット相談をお申し込みください。
また、資料請求やお問い合わせもお待ちしております。テック領域の知見を獲得し、事業成長を一緒に実現していきましょう。