Mã nguồn mở đã trở thành yếu tố thiết yếu thúc đẩy sự đổi mới trong lĩnh vực robot và tự hành. Bằng cách cung cấp quyền truy cập vào nền tảng hạ tầng quan trọng — từ các framework mô phỏng đến các mô hình AI — NVIDIA đang tạo điều kiện cho sự phát triển cộng tác, đẩy nhanh tiến độ hướng tới các hệ thống tự hành an toàn hơn và có nhiều khả năng hơn.
Tại CES vừa qua, NVIDIA đã giới thiệu một bộ công cụ mới gồm các mô hình và framework cho AI vật lý mở nhằm đẩy nhanh quá trình phát triển robot hình người, xe tự hành và các hiện thân AI vật lý khác. Những công cụ này bao trùm toàn bộ vòng đời phát triển robot — từ mô phỏng thế giới có độ chính xác cao và tạo dữ liệu tổng hợp đến điều phối dựa trên đám mây và triển khai tại biên — cung cấp cho các nhà phát triển một bộ công cụ mô-đun để xây dựng các hệ thống tự hành có khả năng suy luận, học hỏi và hành động trong thế giới thực.
OpenUSD cung cấp khung chung giúp chuẩn hóa cách dữ liệu 3D được chia sẻ giữa các công cụ AI vật lý này, cho phép các nhà phát triển xây dựng các bản sao kỹ thuật số chính xác và tái sử dụng chúng một cách liền mạch từ giai đoạn mô phỏng đến triển khai. Các thư viện NVIDIA Omniverse , được xây dựng trên nền tảng OpenUSD, đóng vai trò là nguồn dữ liệu mô phỏng thực tế cung cấp cho toàn bộ hệ thống.
Từ phòng thí nghiệm đến sàn triển lãm
Tại CES 2026, các nhà phát triển đã đưa nền tảng trí tuệ nhân tạo vật lý của NVIDIA từ phòng thí nghiệm ra triển lãm, giới thiệu các loại máy móc từ thiết bị hạng nặng và trợ lý nhà máy đến robot xã hội và robot dịch vụ.
Nền tảng này tận dụng các mô hình thế giới NVIDIA Cosmos ; các công nghệ NVIDIA Isaac, bao gồm cả khung phần mềm mã nguồn mở Isaac Lab-Arena mới để đánh giá chính sách; danh mục mở NVIDIA Alpamayo gồm các mô hình AI, khung mô phỏng và bộ dữ liệu AI vật lý dành cho xe tự hành; và khung phần mềm NVIDIA OSMO để điều phối quá trình huấn luyện trên các môi trường tính toán.
Trợ lý AI Cat của Caterpillar , được hỗ trợ bởi các mô hình mở NVIDIA Nemotron dành cho trí tuệ nhân tạo tác nhân và chạy trên mô-đun AI biên NVIDIA Jetson Thor, mang khả năng tương tác ngôn ngữ tự nhiên trực tiếp vào cabin của các phương tiện hạng nặng. Người vận hành có thể đặt câu hỏi kiểu “Hey Cat” và nhận hướng dẫn từng bước, cũng như điều chỉnh các thông số an toàn bằng giọng nói.
Về mặt kỹ thuật, Caterpillar sử dụng thư viện Omniverse để xây dựng các mô hình kỹ thuật số song sinh của nhà máy và công trường, giúp mô phỏng bố cục, luồng giao thông và quy trình làm việc đa máy móc. Những hiểu biết này được đưa trở lại vào thiết bị và đội xe trước khi các thay đổi được triển khai tại công trường, giúp các hoạt động hỗ trợ bởi AI an toàn và hiệu quả hơn.
LEM Surgical đã giới thiệu Hệ thống Phẫu thuật Robot Dynamis, một hệ thống đã được FDA cấp phép và đang được sử dụng thường quy trong lâm sàng cho các thủ thuật cột sống. Hệ thống thế hệ mới này sử dụng NVIDIA Jetson AGX Thor để tính toán, NVIDIA Holoscan để xử lý cảm biến thời gian thực và NVIDIA Isaac for Healthcare để huấn luyện các cánh tay robot tự hành.
LEM Surgical cũng sử dụng NVIDIA Cosmos Transfer — một mô hình thế giới mở, hoàn toàn có thể tùy chỉnh, cho phép tạo dữ liệu tổng hợp dựa trên vật lý — để tạo dữ liệu huấn luyện tổng hợp và khung NVIDIA Isaac Sim để mô phỏng bản sao kỹ thuật số. Được thiết kế như một robot phẫu thuật hình người hai tay dành cho phẫu thuật mô cứng, hệ thống Dynamis mô phỏng sự khéo léo của bác sĩ phẫu thuật và cho phép thực hiện các thủ thuật cột sống phức tạp với độ chính xác cao hơn, giảm bớt gánh nặng thể chất cho bác sĩ phẫu thuật và trợ lý phẫu thuật.

Trưng bày sản phẩm phẫu thuật LEM.
NEURA Robotics đang xây dựng các robot nhận thức trên nền tảng NVIDIA đầy đủ, sử dụng Isaac Sim và Isaac Lab để huấn luyện robot hình người 4NE1 và robot dịch vụ MiPA trong mô hình song sinh kỹ thuật số dựa trên OpenUSD trước khi triển khai trong môi trường gia đình và nơi làm việc. Công ty đã sử dụng NVIDIA Isaac GR00T-Mimic để huấn luyện lại mô hình nền tảng Isaac GR00T cho các nền tảng của mình.
Ngoài ra, NEURA Robotics đang hợp tác với SAP và NVIDIA để tích hợp các tác nhân Joule của SAP với robot của mình, sử dụng Mega NVIDIA Omniverse Blueprint để mô phỏng và tinh chỉnh hành vi của robot trong các kịch bản vận hành phức tạp, thực tế trước khi các tác nhân và hành vi đó được triển khai vào hệ sinh thái Neuraverse của công ty, cũng như trong các đội robot thực tế.
AgiBot sử dụng NVIDIA Cosmos Predict 2 làm nền tảng mô hình hóa thế giới cho hệ thống Genie Envisioner (GE-Sim) của mình — cho phép hệ thống này tạo ra các video được điều kiện hóa theo hành động dựa trên các thông tin tiên nghiệm mạnh mẽ về hình ảnh và vật lý. Việc kết hợp dữ liệu này với Isaac Sim và Isaac Lab, cũng như quá trình huấn luyện sau đó trên dữ liệu riêng của AgiBot, cho phép các chính sách được phát triển trong Genie Envisioner được chuyển giao một cách đáng tin cậy hơn cho các robot hình người Genie2 và các robot để bàn nhỏ gọn chạy bằng Jetson Thor.
Intbot đang sử dụng mô hình mở NVIDIA Cosmos Reason 2 để trang bị cho robot xã hội của mình “giác quan thứ sáu” trong thế giới thực — sử dụng khả năng suy luận của mô hình để nhận diện các tín hiệu xã hội đơn giản và bối cảnh an toàn vượt ra ngoài các nhiệm vụ được lập trình sẵn. Trong hướng dẫn Cosmos Cookbook của mình , Intbot chứng minh cách các mô hình ngôn ngữ thị giác suy luận có thể hỗ trợ robot trong việc quyết định khi nào nên nói và làm thế nào để tương tác với con người một cách tự nhiên hơn.
Các nhà phát triển robot đang sử dụng các bộ công cụ và khung phần mềm mới như thế nào?
Gần đây, NVIDIA đã giới thiệu Agile, một công cụ dựa trên Isaac Lab dành cho việc điều khiển chuyển động của người máy hình người, tích hợp một quy trình làm việc hoàn chỉnh, được kiểm chứng từ mô phỏng đến thực tế, để huấn luyện các chính sách học tăng cường mạnh mẽ trên các nền tảng như Unitree G1 và LimX Dynamics TRON.
Các nhà phát triển robot có thể sử dụng cấu hình tác vụ tích hợp sẵn của Agile, mô hình toán học Quy trình Quyết định Markov để ra quyết định, các tiện ích huấn luyện và công cụ đánh giá xác định để tinh chỉnh các chính sách. Sau đó, các nhà phát triển có thể kiểm tra độ bền của các chính sách này trong Isaac Lab và chuyển giao chuyển động và hành vi toàn thân cho robot thực tế một cách đáng tin cậy và hiệu quả hơn.
Hugging Face và NVIDIA đang kết nối cộng đồng robot của họ bằng cách tích hợp các mô hình NVIDIA Isaac GR00T N và khung mô phỏng vào hệ sinh thái LeRobot . Giờ đây, các nhà phát triển có thể truy cập trực tiếp các mô hình Isaac GR00T N1.6 và Isaac Lab-Arena trong LeRobot để đơn giản hóa việc đào tạo và đánh giá chính sách.
Thêm vào đó, robot hình người Reachy 2 mã nguồn mở của Hugging Face hiện đã hoàn toàn tương thích với NVIDIA Jetson Thor, cho phép triển khai trực tiếp các mô hình ngôn ngữ hành động thị giác (VLA) tiên tiến để đạt hiệu suất mạnh mẽ trong thế giới thực.
ROBOTIS , một nhà phát triển hàng đầu về động cơ servo thông minh, bộ truyền động công nghiệp, cánh tay robot, nền tảng robot hình người mã nguồn mở và bộ dụng cụ robot giáo dục, đã xây dựng một quy trình chuyển đổi từ mô phỏng sang thực tế mã nguồn mở sử dụng công nghệ NVIDIA Isaac. Quy trình bắt đầu bằng việc tạo dữ liệu độ chính xác cao trong Isaac Sim, mở rộng quy mô tập dữ liệu huấn luyện bằng GR00T-Mimic để tăng cường và sau đó tinh chỉnh mô hình Isaac GR00T N dựa trên VLA để triển khai trực tiếp lên phần cứng — đẩy nhanh quá trình chuyển đổi từ mô phỏng sang các tác vụ thực tế mạnh mẽ.
Kết nối ngay!
Tìm hiểu thêm về OpenUSD và phát triển robot bằng cách khám phá các nguồn tài liệu sau:
- Hãy đọc bài viết kỹ thuật này để tìm hiểu cách phát triển khả năng đa năng cho người máy hình người với NVIDIA Isaac và GR00T N1.6.
- Hãy đọc bài viết kỹ thuật này để tìm hiểu cách đánh giá các chính sách của robot đa năng trong môi trường mô phỏng bằng NVIDIA Isaac Lab – Arena.
- Hãy tìm hiểu cách huấn luyện Isaac GR00T sau khi thu thập dữ liệu thông qua video hướng dẫn gồm hai phần này .
- Hãy xem bài thuyết trình đặc biệt của Jensen Huang, người sáng lập kiêm CEO của NVIDIA, tại CES .
- Nâng cao kỹ năng phát triển robot với lộ trình học robot tự định hướng .
- Hãy tham gia Cosmos Cookoff , một thử thách trí tuệ nhân tạo thực hành, nơi các nhà phát triển sử dụng Cosmos Reason để vận hành robot, hệ thống tự động và quy trình làm việc trí tuệ nhân tạo về thị giác.
