Tóm tắt tin tức:
- Blueprint cho phép xử lý và sắp xếp dữ liệu quy mô lớn, tạo dữ liệu tổng hợp, học tăng cường và đánh giá các mô hình AI vật lý cho các tác nhân AI thị giác, robot và xe tự hành.
- Các nhà cung cấp dịch vụ đám mây, bao gồm Microsoft Azure và Nebius, cung cấp bản thiết kế để chuyển đổi điện toán quy mô toàn cầu thành các công cụ sản xuất dữ liệu trọn gói dựa trên tác nhân.
- Các nhà phát triển AI vật lý hàng đầu như FieldAI, Hexagon Robotics, Linker Vision, Milestone Systems, Skild AI, Uber và Teradyne Robotics đang sử dụng bản thiết kế này để đẩy nhanh quá trình phát triển robot, các tác nhân AI thị giác và xe tự hành.
GTC — Hôm nay, NVIDIA đã công bố NVIDIA Physical AI Data Factory Blueprint, một kiến trúc tham chiếu mở giúp thống nhất và tự động hóa cách tạo, bổ sung và đánh giá dữ liệu huấn luyện, giảm chi phí, thời gian và độ phức tạp khi huấn luyện các hệ thống AI vật lý trên quy mô lớn.
Bản thiết kế này cho phép các nhà phát triển sử dụng các mô hình nền tảng thế giới mở NVIDIA Cosmos™ và các tác nhân lập trình hàng đầu để chuyển đổi dữ liệu huấn luyện hạn chế thành các tập dữ liệu lớn, đa dạng — bao gồm cả các trường hợp ngoại lệ hiếm gặp và các kịch bản ít phổ biến mà việc thu thập chúng trong thế giới thực thường tốn kém, mất thời gian và không khả thi.
NVIDIA đang hợp tác với Microsoft Azure và Nebius để tích hợp bản thiết kế mở này với cơ sở hạ tầng và dịch vụ đám mây của họ, cho phép các nhà phát triển chuyển đổi sức mạnh tính toán được tăng tốc thành dữ liệu huấn luyện khối lượng lớn. Các nhà phát triển AI vật lý hàng đầu như FieldAI , Hexagon Robotics , Linker Vision , Milestone Systems , RoboForce , Skild AI, Teradyne Robotics và Uber đang sử dụng bản thiết kế này để đẩy nhanh quá trình phát triển robot, các tác nhân AI thị giác và xe tự hành.
“Trí tuệ nhân tạo vật lý là biên giới tiếp theo của cuộc cách mạng AI, nơi thành công phụ thuộc vào khả năng tạo ra lượng dữ liệu khổng lồ,” Rev Lebaredian, phó chủ tịch phụ trách công nghệ Omniverse và mô phỏng tại NVIDIA, cho biết. “Cùng với các nhà lãnh đạo điện toán đám mây, chúng tôi đang cung cấp một loại công cụ tác nhân mới giúp chuyển đổi sức mạnh tính toán thành dữ liệu chất lượng cao cần thiết để hiện thực hóa thế hệ hệ thống tự hành và robot tiếp theo. Trong kỷ nguyên mới này, sức mạnh tính toán chính là dữ liệu.”
Một công cụ thống nhất cho phát triểnTrí tuệ Nhân tạo Vật lý (Physical AI): Trí tuệ Nhân tạo Vật lý tuân theo các quy luật về tỷ lệ: Hiệu suất được cải thiện khi dữ liệu, khả năng tính toán và năng lực mô hình tăng lên. Bản thiết kế Nhà máy Dữ liệu Trí tuệ Nhân tạo Vật lý (Physical AI Data Factory Blueprint) đóng vai trò là kiến trúc tham chiếu duy nhất giúp các nhóm chuyển từ dữ liệu thô sang các tập dữ liệu huấn luyện sẵn sàng cho mô hình thông qua các quy trình làm việc tự động, theo mô-đun:
- Tuyển chọn và Tìm kiếm: NVIDIA Cosmos Curator xử lý, tinh chỉnh và chú thích các tập dữ liệu thực tế và tổng hợp quy mô lớn.
- Mở rộng và nhân rộng: Cosmos Transfer mở rộng và đa dạng hóa dữ liệu được chọn lọc theo cấp số nhân, nhân rộng các dữ liệu đầu vào thực tế và mô phỏng để nắm bắt tốt hơn các tình huống hiếm gặp và ít phổ biến trong các môi trường và điều kiện ánh sáng khác nhau.
- Đánh giá và xác thực: NVIDIA Cosmos Evaluator , được hỗ trợ bởi Cosmos Reason và hiện có sẵn trên GitHub, tự động chấm điểm, xác minh và lọc dữ liệu được tạo ra để đảm bảo độ chính xác vật lý và khả năng sẵn sàng cho huấn luyện.
NVIDIA đang sử dụng bản thiết kế Physical AI Data Factory Blueprint để huấn luyện và đánh giá NVIDIA Alpamayo, mô hình hành động ngôn ngữ thị giác dựa trên suy luận mở đầu tiên trên thế giới dành cho lái xe tự hành quy mô lớn. Skild AI đang áp dụng bản thiết kế này để phát triển các mô hình nền tảng robot đa năng, trong khi Uber đang sử dụng nó để đẩy nhanh quá trình phát triển xe tự hành.
Điều phối dựa trên tác nhân ở quy mô lớn:Nhiều nhà phát triển robot không đủ khả năng để thiết lập và quản lý cơ sở hạ tầng AI phức tạp cần thiết để tạo ra dữ liệu ở quy mô lớn.
NVIDIA OSMO , một khung điều phối mã nguồn mở, thống nhất và quản lý các quy trình làm việc này trên các môi trường tính toán, giảm thiểu các tác vụ thủ công để các nhà phát triển có thể tập trung vào việc xây dựng mô hình của họ.
OSMO hiện đã tích hợp với các tác nhân mã hóa hàng đầu như Claude Code, OpenAI Codex và Cursor, cho phép vận hành dựa trên AI, trong đó các tác nhân chủ động quản lý tài nguyên, giải quyết các điểm nghẽn và tăng tốc quá trình triển khai mô hình ở quy mô lớn.
Thúc đẩy hệ sinh thái AI vật lý toàn cầu:Các nhà cung cấp dịch vụ đám mây đóng vai trò quan trọng trong việc cung cấp cơ sở hạ tầng AI được tăng tốc, các hoạt động học máy và dịch vụ điều phối mà các nhà phát triển cần để xây dựng và triển khai AI vật lý ở quy mô lớn.
Microsoft Azure đang tích hợp Bản thiết kế Nhà máy Dữ liệu AI Vật lý (Physical AI Data Factory Blueprint) vào một chuỗi công cụ AI vật lý mở, hiện đã có trên GitHub. Bản thiết kế này cung cấp khả năng tích hợp với các dịch vụ Azure — bao gồm Azure IoT Operations, Microsoft Fabric, Real-Time Intelligence và Microsoft Foundry — để cung cấp các quy trình làm việc cấp doanh nghiệp, do tác nhân điều khiển, nhằm đào tạo và xác thực các hệ thống AI vật lý một cách nhanh chóng và trên quy mô lớn.
FieldAI, Hexagon Robotics , Linker Vision và Teradyne Robotics nằm trong số những công ty đầu tiên thử nghiệm bộ công cụ AI vật lý của Azure để tăng tốc và mở rộng quy mô tạo, bổ sung và đánh giá dữ liệu trên các quy trình nhận thức, di động và học tăng cường của họ.
Nebius đã tích hợp OSMO vào AI Cloud của mình, cho phép các nhà phát triển sử dụng bản thiết kế để triển khai các đường dẫn dữ liệu sẵn sàng cho sản xuất, được tùy chỉnh theo nhu cầu của họ. Cơ sở hạ tầng của Nebius cung cấp sức mạnh cho toàn bộ hệ thống AI vật lý, kết hợp GPU NVIDIA RTX PRO™ 6000 Blackwell Server Edition với bộ nhớ đối tượng cực nhanh, quản lý và gắn nhãn dữ liệu gốc, thực thi không máy chủ và suy luận được quản lý tích hợp sẵn.
Các khách hàng tiên phong như Milestone Systems, Voxel51 và RoboForce đang tận dụng mô hình trên nền tảng Nebius để đẩy nhanh quá trình phát triển mô hình cho các tác nhân AI phân tích video, xe tự hành và robot hình người công nghiệp.
Bản thiết kế NVIDIA Physical AI Data Factory dự kiến sẽ được công bố trên GitHub vào tháng Tư.
Hãy xem bài phát biểu quan trọng tại GTC của người sáng lập kiêm CEO NVIDIA, Jensen Huang, và khám phá các phiên thảo luận .
Hình ảnh minh họa được cung cấp bởi Milestone Systems (trái), FieldAI (giữa) và Hexagon Robotics cùng BMW (phải).
