🏛️
【イベントレポート】 Classmethod AI Talks (CATs) #15
公開
2025-03-29
更新
2025-03-29
文章量
約3299字

Yard 編集部
Yardの編集部が、テック業界の最新トレンドや知見について発信します。
AWSの生成AI情報を持ち寄ってディスカッションする人気企画「Classmethod AI Talks (CATs)」の第15回が、2025年2月6日に開催されました。
今回のテーマは「AWS Generative AI Catch Up Talks 〜AWSの生成AI最新情報共有〜 vol.006」。本レポートでは、イベントの具体的なトピックやディスカッションの模様を人間味を交えてご紹介します。
AI最新動向の共有とディスカッション
オープニングでは、まず本シリーズの概要が改めておさらいされました。AWSにおけるGenerative AI(生成系AI)は日々進化しており、毎週のように新サービスや新機能が発表されます。そこで複数のメンバーが持ち寄った最新トピックを短いスパンで共有しあうことで、ホットな情報をいち早く取り込みたいという趣旨です。
「AWSと生成AI」を軸に、プレスリリースや新機能のドキュメントなどを各参加者がウォッチ。今回も4つのテーマに分けて解説+雑談を行う運びとなりました。
Luma Ray2について
最初に取り上げられたのは、Amazon Bedrockに追加された新モデル「Luma Ray2」。 Ray2は動画生成を得意とするモデルで、テキストから滑らかな5〜9秒程度のビデオを作ることが可能です。いわゆる3Dレンダリング的な映像も生成できるため、「撮影では現実的に難しい視点や幻想的なシーン」を表現するにも向いているとのこと。
Bedrock対応 2024年リインベントからアナウンスされていたものが、ついに最近サポート開始。今のところオレゴンリージョンのみ使用可。
動画生成の解像度 720pと540pを選べる。5秒 or 9秒までなら対応。
料金イメージ 720pで9秒の動画を生成すると1ドル弱かかる(1秒1.5ドル計算)。大量生成や試行錯誤にはそれなりにコストが必要。
発表者は実際にRay2を試し、「雪まつりの映像」というテキスト指示で風景動画を生成した結果を紹介。まるで本当に札幌の雪景色を空撮したかのようなクオリティで、思わず感嘆が漏れます。
「費用はかかるが、短尺ムービーを簡単に生成できるのは画期的。今後もっと長い動画や多機能に対応すれば、プロモ動画やSNS向け映像制作のハードルが激減するのでは」といった意見で盛り上がりました。
Amazon Q Businessへの画像ファイルアップロードサポート
次のトピックは、生成AIによる業務支援ツールとして注目を集めるAmazon Q Businessに関するアップデート。これまではPDFやTXTファイルなどのアップロードが中心だったところ、画像ファイルのアップロード機能が新たにサポートされたとのことです。
対象プラン Proサブスクリプション向けの機能。ライトプランでは利用不可
ファイルサイズ 3.75MBまで
画像認識精度 日本語の文字列を含む画像も意外なほど正しく読み取ってくれる例がデモされ、「これはOCRどころか生成AIで文脈も把握しているのでは?」という印象
発表者のデモでは、イベントのタイトル文字や簡単な図表が入ったサムネ画像をAmazon Q Businessにアップロードし、「この画像の内容を説明して」と指示。すると見事にタイトルやテーマを抽出し、追加情報まで交えた自然言語での回答を返してくれました。
画像からテキストを起こすOCR的な処理はもちろん、テキストの意図をAIがくみ取っている点も興味深いです。「営業資料やカタログのビジュアルを元に簡単な概要を得る」などの使い道が広がりそうだと好評でした。
私が考える DeepSeek 推論サーバーホスティング選手権
(1)森田さん編
3つ目のパートは、OSSの大規模言語モデル「DeepSeek」をどうホスティングするか? というユニークなテーマ。まずは森田さんが、AWS Bedrockを活用するアプローチを2種類紹介しました。
Marketplaceで直接デプロイ
Bedrock MarketplaceにはすでにDeepSeekがサードパーティー提供モデルとして掲載されている
数クリックでエンドポイントを立ち上げられ、運用コストも抑えめ
ただし細かなチューニングやファインチューニングは不可
Bedrockカスタムモデルインポート
自分でモデルの重みをダウンロードし、S3にアップロードしたうえで、Bedrockのカスタムモデルとして登録
コンバースAPIに対応可能だが、インポート可能なモデルアーキテクチャはラマ系など一部制約あり
料金もストレージ料+カスタムモデルユニット料、という特殊な課金方式
森田さん曰く、「Marketplaceでポチるだけは最速だが自由度は低め」「インポートの方はファインチューニングや独自Prompt/Chat Templateに応用できるが、まだ3.3系ラマには対応不完全」とのこと。
「それでも、サーバー管理ゼロでDeepSeekを試せるメリットは絶大」というまとめに共感の声が上がりました。
(2)たかくにさん編
続いて、たかくにさんの「そもそもマネージド使わずEKS(Kubernetes)でDeepSeekホスティングしたい派」のお話。
とはいえ完全手動は大変なので、EKS Auto Mode という新機能を駆使すれば、ある程度サーバレス風にGPUノードを自動管理してくれるそうです。
「クラスター構築・ノードアップグレード・パッチ適用・オートスケーリングを丸投げでき、けれどクーバネティスの『ロマン』は失わない」というのが推しポイント。 さらにDeepSeekのコンテナイメージサイズが大きくても、EKS上ならイメージキャッシュが効いてスケールが速い利点もあるとか。
発表者が実際に試したところ、GPUノード上でDeepSeekがしっかり動き、ALB経由で外部から問い合わせを受け付ける構成を素早く作れたとのこと。
「運用のしがい」や「K8Sを活用した幅広い拡張」を重視するなら、このEKS Auto Modeも選択肢になる、と熱っぽく語られました。
全体を踏まえた感想
生成AIやモデルホスティングは、AWSでも驚くほど多彩な選択肢が増えています。今回だけでもベッドロック・EKS・Amazon Qなど話題は盛りだくさん。 特にDeepSeek水論サーバーを作るには、どんな運用スタンスをとるかで大きく変わってくるとわかりました。
ほぼノー運用で済ませる
Marketplaceでワンクリック、あるいはBedrockカスタムインポート
運用負荷が少なくスケール自在だが自由度は限られる
自力感・拡張性を重視
EKS Auto Modeならロマンと効率を両立
HPCや特殊要件、アーキテクチャ全般を自分でカスタマイズしたいなら選択肢に
また、映像生成モデルであるLuma Ray2、そしてAmazon Qの画像ファイルアップロードといった「生成AIの守備範囲拡大」も見逃せません。文字中心の世界から、映像・画像へと急激に広がりを見せることが実感されます。
もう一歩先の世界へ
今回のCATsは、AWSの生成AIまわりのホットトピックが勢ぞろいでした。動くものを見てこそ初めて分かる「意外な精度の高さ」や「運用方針の分岐」など、極めて具体的な視点が共有されるのがこのイベントの醍醐味。
さらに映像や画像といったメディア領域への適用事例も増え、「LLM活用=テキスト中心」から確実に広い次元に拡がっていることを痛感させられます。 AWSにおいてもBedrock、EKS、そしてサービス個々の最新アップデートがめまぐるしく登場するため、まさにこうした「定期的にキャッチアップする機会」が欠かせません。
来月以降もCATsでは新しいトピックが飛び出すはず。生成AIの最前線をウォッチしながら、自分のユースケースに合う選択肢を見極め、いつでもプロジェクトを次のステージに持っていける準備をしておきたいですね。
Yardでは、テック領域に特化したスポット相談サービスを提供しています。
興味がある方は、初回の無料スポット相談をお申し込みください。
また、資料請求やお問い合わせもお待ちしております。テック領域の知見を獲得し、事業成長を一緒に実現していきましょう。