フィジカルAIのための新たな基盤モデル
NVIDIAは、台湾で開催された「NVIDIA GTC Taipei」において、フィジカルAI(物理的な環境で認識・判断・行動するAI)のための新しい世界基盤モデル「NVIDIA Cosmos 3」を発表しました。同モデルは、視覚的な推論、ワールドシミュレーション、アクション予測を単一のシステムに統合したmixture-of-transformersアーキテクチャを基盤としています。

このモデルは、テキストや画像だけでなく、動画、環境音、アクションをネイティブに理解・生成できるオムニモデルとなっています。従来、フィジカルAIのトレーニングや評価に数カ月を要していたプロセスを、数日にまで短縮できる可能性があるとのことです。
Ms.ガジェット3種類のラインナップと用途
Cosmos 3は、開発ニーズに合わせて以下の3つのラインナップが展開されています。

- Cosmos 3 Super:物理精度と生成品質を重視するロボティクスや自動運転のポストトレーニングに最適
- Cosmos 3 Nano:わずか数分の1秒で高品質な動画生成とアクション推論を実現
- Cosmos 3 Edge:エッジデバイスでのリアルタイム推論向け(近日公開予定)
開発者は、視覚言語モデルとしての活用や、物理環境をシミュレートするワールドモデル、ロボットの動作学習を支援するバックボーンなど、多様な用途に利用できるとしています。
Ms.ガジェットエコシステム「Cosmos Coalition」の設立
NVIDIAは、次世代の世界モデル発展を目指すエコシステム「Cosmos Coalition」の立ち上げも発表しました。Agile Robots、Black Forest Labs、Generalist、LTX、Runway、Skild AIといった主要なAIラボやロボティクス企業が設立メンバーとして名を連ねています。
この取り組みにより、モデルや研究成果、評価手法を共有し、フィジカルAI分野における相互運用性とイノベーションの加速を目指すとのことです。また、開発者はNVIDIAのインフラやツールを活用し、効率的なモデル開発が可能となっています。
Ms.ガジェット利用方法と提供形態
現在、Cosmos 3 SuperおよびCosmos 3 Nanoは利用可能となっています。開発者は「build.nvidia.com」上でモデルを試すことができるほか、Hugging Faceからオープンモデルをダウンロードしてカスタマイズや合成データの生成に活用可能です。
また、NVIDIA NIMマイクロサービスとしての展開にも対応しており、クラウドインフラパートナーを通じて、リーズニング(推論)サービスや合成データ生成ワークロードへのアクセスが可能となっています。
Ms.ガジェット
NVIDIA Cosmos 3
最後までお読みいただきありがとうございました!
- 本記事の評価は当サイト独自のものです。
- 特段の表示が無い限り、商品の価格や情報などは記事執筆時点での情報です。
- この情報が誤っていても当サイトでは一切の責任を負いかねますのでご了承ください。
- 当サイトに記載された商品・サービス名は各社の商標です。
- 本記事で使用している画像は、メディアユーザーとしてPR TIMESより提供されたプレスリリース素材を利用しています。
