NVIDIA、ロボティクス、視覚AIエージェント、自動運転開発を加速する「Physical AI Data Factory Blueprint」を発表

テクノロジー

Physical AI Data Factory Blueprintの概要

NVIDIA Physical AI Data Factory Blueprintは、オープンなNVIDIA Cosmos™世界基盤モデルと主要なコーディングエージェントを活用し、限られたトレーニングデータを大規模で多様なデータセットに変換します。これにより、実環境での収集が困難な希少なエッジケースやロングテールシナリオのデータも効率的に生成できるようになります。

このブループリントは、以下の主要な機能モジュールで構成されています。

  • キュレーションと検索: NVIDIA Cosmos Curatorは、大規模な実世界データセットや合成データセットを処理、改良、アノテーションします。

  • 拡張と増幅: Cosmos Transferは、キュレーションされたデータを指数関数的に拡張し、多様化させます。実データとシミュレーションによる入力の両方を増殖させ、環境や照明条件を問わず、稀なシナリオやロングテールシナリオをより適切に捉えることを可能にします。

  • 評価と検証: GitHubで公開されているNVIDIA Cosmos Evaluatorは、生成データを自動的に採点、検証、フィルタリングし、物理的精度とトレーニング適性を確保します。

NVIDIAは、このブループリントを活用し、ロングテール自動運転向けのオープンなリーズニングベースの視覚言語行動モデル群であるNVIDIA Alpamayoのトレーニングと評価を行っています。また、Skild AIは汎用ロボット基盤モデルの推進に、Uberは自動運転車開発にこのブループリントを適用しています。

大規模なエージェントドリブンオーケストレーション

多くのロボティクス開発者は、大規模なデータ生成に必要な複雑なAIインフラを立ち上げ、管理するための体制が整っていない場合があります。NVIDIA OSMOは、オープンソースのオーケストレーションフレームワークとして、コンピューティング環境全体でこれらのワークフローを統合および管理し、手動タスクを削減することで、開発者がモデルの構築に集中できるように支援します。OSMOは現在、Claude Code、OpenAI Codex、Cursorなどの主要なコーディングエージェントと統合されており、リソースのプロアクティブな管理、ボトルネックの解消、大規模なモデルデリバリーの加速を実現するAIネイティブな運用を提供します。

グローバルなエコシステムとの連携

NVIDIAは、Microsoft AzureやNebiusなどのクラウドサービスプロバイダーと連携し、このオープンなブループリントを各社のクラウドインフラおよびサービスと統合しています。これにより、開発者はアクセラレーテッドコンピューティングのパワーを大量のトレーニングデータに変換できるようになります。

フィジカルAIの主要な開発企業であるFieldAI、Hexagon Robotics、Linker Vision、Milestone Systems、Robo Force、Skild AI、Teradyne Robotics、Uberなども、このブループリントを活用して、ロボティクス、視覚AIエージェント、自動運転車開発を加速させています。

NVIDIA Physical AI Data Factory Blueprintは、2026年4月にGitHubで公開される予定です。

NVIDIAの最新情報については、GTC基調講演のリプレイやセッションをご視聴ください。

NVIDIAに関する詳細はこちら: https://www.nvidia.com/ja-jp/

コメント