GPU(Graphics Processing Unit) はもともと映像処理用に開発されたプロセッサですが、現在では AI 学習やシミュレーション、3D レンダリングなど「大量のデータを一気に並列処理する」分野で欠かせない存在になっています。
ただし GPU は高価で、占有利用が前提となるため「高い!」「もったいない!」「運用が難しい!」という“三重苦”を抱えています。
このような背景から生まれたのが GPU as a Service (GPUaaS) です。クラウドベースで GPU をサービスとして提供することで、ユーザーはサブスクリプション形式や時間単位での支払いを通じて、必要な時に必要なだけ GPU を利用できます。科学シミュレーション、深層学習、動画レンダリング、金融リスク分析など、多岐にわたる用途で広く使われ始めています。いまや GPU は AI・メタバース・3D レンダリングに欠かせない計算資源であり、その需要は爆発的に拡大中。まさに世は「大GPU戦国時代」のまっただ中です。
本セッションでは、この大GPU戦国時代を クラウドネイティブ技術の掛け算(Kubernetes × GPU Operator × Knative) で突破する構想をご紹介します。さらに、NTTドコモが開発するメタバースアプリケーション「MetaMe」 を GPUaaS のユースケースとし、実際の Kubernetes 実装に向けた PoC をご紹介します。
このような方におすすめ
GPU を効率的に利用したい インフラエンジニア/サービス企画者
Kubernetes 上で AI・メタバースワークロードを運用する エンジニア
GPU をクラウドネイティブに「サービス化」したい すべての人
Kubernetes や Docker の複雑さを意識せず GPU アプリを開発したいアプリ開発者
この講演によって得られる情報
クラウドネイティブなGPUaaS アーキテクチャ:クラウドネイティブ基盤上で GPU を柔軟に提供する設計手法
運用効率化のヒント:GPUオペレータ による GPU リソースの効率的活用
ユースケースから学ぶ実践知:メタバース「MetaMe」を題材にした GPUaaS の実用的 PoC
主な技術スタック
kubernetes
Docker
NVIDIA GPU Operator
Knative
WebRTC
Unreal Engine (unreal containers)
Metame(高効率クラウドレンダリング技術:URL https://official.metame.ne.jp/#about_new_02)
2023年度、NTTドコモビジネス(NTTコミュニケーションズ)に入社。
現在はイノベーションセンターテクノロジー部門 エッジコンピューティングP」に所属。
クラウドネイティブ技術を軸に、次世代エッジ基盤の開発や GPU as a Service (GPUaas)のPoC・CoEを推進中。
日々触れている技術は、Kubernetes / OpenShift /Knative/AWS など。
2019年度~2022年度:L2/L3スイッチやサーバを含むネットワーク機器の運用・保守・監視を担当。
2022年度~現在:Kubernetesを用いて小型デバイス向けエッジコンピューティングプラットフォームの開発や検証を担当。エッジデバイスの管理やアプリケーションのデプロイ最適化に注力。生成AIを活用したオンプレミスでのAI推論を推進し、リソース制約のある環境でのエッジAI実装の最適化に取り組んでいる。
Fumina Teng has approximately 10-year experience in the telecommunications and IT Infrastructure industry and currently serves as a Solution Architect in NTT Communications. In this role, she is involved in NTT Communications' edge strategy and taking charge of development of Smart Data Platform Edge, which is a commercial edge computing platform.
She has also provided critical support for proof of concept, pilot, and production acceptance of market-changing technologies like Server Virtualization, Software-defined Network, and Unified Endpoint Management for a large number of enterprise companies in Japan. In the meantime, she is a self-motivating engineer, contributing to discover startups with cutting-edge technologies and constantly achieving her own goals in the technical field such as Metaverse, Web3, AI on Edge Computing PF and driving business efficiency.