FastLabel、次世代AIデータキュレーション技術をNVIDIA「GTC 2026」で展示 – フィジカルAI開発を加速

テクノロジー

AIデータキュレーションの課題とFastLabelの解決策

AI開発、特に画像データを用いた学習においては、重複する画像を効率的に排除することが重要です。しかし、従来の画像埋め込みベースの重複排除では、「歩行者の有無」といったドメイン固有の重要な差異を見逃してしまうという課題がありました。これは、自動運転などのミッションクリティカルな領域において、安全性に直結する「稀なシーン」がデータセットから失われるリスクを意味します。

FastLabelは、この課題に対し、VLM(Vision-Language Model)による高度なキャプショニングとNVIDIA NeMo Curatorを組み合わせることで解決策を提案しています。これにより、ドメイン知識に基づいた「意味のある差異」を識別しながら、効率的にデータセットを軽量化する先駆的なパイプラインの構築が可能となります。

この技術に関する詳細は、NVIDIAのケーススタディでも紹介されています。詳細はこちらをご覧ください。

ポスター発表の主な内容

今回のポスター発表では、以下の3つの主要な内容が紹介されました。

高品質なデータ選別

従来の画一的な類似度判定とは異なり、この技術はドメイン知識に基づいて「意味のある差異」を識別します。これにより、AIモデルの汎化性能と安全性を劇的に向上させることが期待されます。

コストと時間の最適化

Deduplication(重複排除)工程において、10,000枚の画像をわずか4分で処理できる圧倒的なスケーラビリティを実現しています。これは、膨大な学習コストとアノテーション費用の削減に大きく寄与します。

モデル性能の最大化

「ありふれたシーン」を減らし、「クリティカルなシーン」を高密度化することで、学習効率と実環境での汎用性能を向上させます。これにより、AIモデルがより重要な情報から効率的に学習できるようになります。

今後の展望:ロボティクス・VLAモデルへの応用

FastLabelは、今回発表した技術のコアである「埋め込みベクトルによる異常・希少性の検知」を、今後ロボティクスおよびVLA(Vision-Language-Action)モデルの構築に応用展開していく予定です。

  • 動画データの最適化: ロボットの作業動画から、タスクの開始・終了状態の異常値を「重複排除の残差」として自動検知し、質の高い学習データを抽出します。

  • 姿勢・関節データの解析: 画像データだけでなく、アームの関節角度などの時系列データをベクトル化して扱うことで、ロボットの「異常姿勢」や「未知の動作パターン」を特定することが可能になります。

FastLabelは、「Data-centric AI」の潮流の中で、データの質がAIの性能を決定するという考えに基づき、自動運転から複雑な物理環境で動くロボティクスまで、あらゆる最先端領域の進化を加速させることを目指しています。

FastLabel株式会社について

FastLabel株式会社は、Data-centric AI開発を支えるデータ基盤の構築に取り組んでいます。データ収集・生成からアノテーション、モデル開発、DataOps構築までを一気通貫で支援しており、近年はロボティクスを含むフィジカルAI領域にも注力し、ロボット基盤モデルおよびVLAモデル開発を支えるデータパイプラインの構築を推進しています。

  • 社名: FastLabel株式会社

  • 所在地: 東京都新宿区西新宿2-6-1 新宿住友ビル24階

  • 代表: 代表取締役CEO 鈴木健史

  • 事業内容: Data-centric AI開発を支援するプロフェッショナルサービスとプロダクトの提供

  • URL: https://fastlabel.ai/service/robotics

コメント