Khi các mô hình mở thúc đẩy sự bùng nổ của AI, NVIDIA Jetson hiện thực hóa điều đó ở biên

Các mô hình AI tạo sinh mã nguồn mở đang dần rời khỏi trung tâm dữ liệu và xuất hiện trong các máy móc hoạt động trong thế giới vật lý. Từ Orin đến Thor, dòng sản phẩm NVIDIA Jetson đang trở thành nơi phổ biến để chạy các mô hình như NVIDIA Nemotron, Cosmos và Isaac GR00T, cùng với danh sách ngày càng tăng các mô hình cộng đồng như Qwen, Gemma, Mistral AI, GPT-OSS, PI và nhiều mô hình khác.

Máy xúc mini Cat 306 CR nặng chưa đến tám tấn và có thể chứa vừa trong một container vận chuyển tiêu chuẩn. Đây là loại máy mà các nhà thầu thuê khi công trường có không gian chật hẹp: đào rãnh tiện ích gần móng nhà, đào hầm trong khu dân cư đông đúc.

Khoang lái có kích thước xấp xỉ một bốt điện thoại. Người điều khiển ngồi gần bảng điều khiển, hai cần điều khiển, mỗi tay thực hiện nhiều chức năng khác nhau. Cần thời gian để làm quen. Và cần nhiều thời gian hơn nữa để lái nhanh.

Tại CES hồi đầu năm nay, cỗ máy đó đã trả lời các câu hỏi . Trong bản demo, Trợ lý AI Mèo chạy trên NVIDIA Jetson Thor , một nền tảng AI biên được xây dựng cho suy luận thời gian thực trong các hệ thống công nghiệp và robot. Mô hình giọng nói NVIDIA Nemotron được sử dụng để tương tác giọng nói tự nhiên nhanh chóng và chính xác. Qwen3 4B, được phục vụ cục bộ thông qua vLLM, diễn giải các yêu cầu và tạo ra phản hồi với độ trễ thấp, không cần kết nối đám mây.

Ngoài việc thúc đẩy đổi mới doanh nghiệp, các mô hình mở mở ra những khả năng mới cho các nhà phát triển để xây dựng và thử nghiệm một cách tự do. Việc chạy OpenClaw trên NVIDIA Jetson cho phép các nhà phát triển tạo ra các trợ lý AI riêng tư, luôn hoạt động ở biên mạng — với chi phí giao diện lập trình ứng dụng bằng không và bảo mật dữ liệu tuyệt đối.

Tất cả các bộ công cụ phát triển Jetson đều hỗ trợ OpenClaw, mang lại sự linh hoạt để chuyển đổi giữa các mô hình mở từ 2 tỷ tham số đến 30 tỷ tham số. Với trợ lý AI tiên tiến chạy cục bộ, người dùng có thể hỗ trợ các bản tin buổi sáng, tự động hóa các tác vụ hàng ngày, thực hiện đánh giá mã và điều khiển các hệ thống nhà thông minh — tất cả đều trong thời gian thực.

Từ đám mây đến thiết bị đầu cuối

Trong phần lớn lịch sử gần đây, các mô hình mở thường tồn tại ở những nơi dễ hỗ trợ chúng nhất.

Chúng hoạt động trên các trung tâm dữ liệu, được hỗ trợ bởi khả năng tính toán linh hoạt và mạng lưới liên tục. Việc triển khai trên nền tảng đám mây có những nhược điểm về độ trễ và chi phí tính toán liên tục, tỷ lệ thuận với mỗi truy vấn.

Các hệ thống vật lý được tối ưu hóa cho những mục đích khác. Độ trễ thấp vì máy móc tương tác với con người và môi trường. Công suất hạn chế vì các thiết bị có giới hạn nhất định. Và hành vi nhất quán vì sự biến đổi tiềm ẩn rủi ro.

Vấn đề nguồn cung cũng là một mối quan ngại. Tình trạng thiếu hụt bộ nhớ đã đẩy giá thành lên cao trên toàn ngành. Jetson tích hợp khả năng tính toán và bộ nhớ vào một hệ thống trên module, giúp tăng tốc quá trình thiết kế phần cứng của khách hàng và đơn giản hóa việc tìm nguồn cung ứng và kiểm định so với các phương pháp sử dụng linh kiện rời rạc.

Và khi các mô hình trở nên hiệu quả hơn, các nhà phát triển cũng bắt đầu đặt ra một câu hỏi khác. Không phải là mô hình nào hoạt động tốt nhất khi đứng riêng lẻ, mà là nên chạy mô hình đó ở đâu thì hợp lý.

Thông thường, câu trả lời nằm ở thiết bị, bắt đầu từ Jetson Orin Nano 8GB dành cho các mô hình AI tạo sinh cấp thấp.

Xây dựng hệ thống trí tuệ nhân tạo vật lý tự động quy mô lớn

Đối với các hệ thống AI vật lý , các mô hình AI tạo sinh đang mở rộng những khả năng hiện có.

Trợ lý AI Cat trong cabin của Caterpillar, hiện đang trong quá trình phát triển, chạy các mô hình ngôn ngữ và giọng nói cục bộ cùng với ngữ cảnh máy móc đáng tin cậy, hỗ trợ hướng dẫn người vận hành và các tính năng an toàn.

Tại CES, Franka Robotics đã trình diễn điều đó trong lĩnh vực robot. Hệ thống hai cánh tay FR3 Duo của công ty đã chạy mô hình NVIDIA GR00T N1.6 từ đầu đến cuối, từ nhận thức đến chuyển động, không cần kịch bản tác vụ. Chính sách được thực thi cục bộ.

Trong nghiên cứu robot, dự án SONIC của phòng thí nghiệm GEAR thuộc NVIDIA huấn luyện bộ điều khiển hình người dựa trên hơn 100 triệu khung hình dữ liệu ghi lại chuyển động, sau đó triển khai chính sách thu được lên một robot vật lý, nơi bộ lập kế hoạch động học chạy trên Jetson Orin với tốc độ khoảng 12 mili giây mỗi lần chạy. Vòng lặp chính sách chạy ở tần số 50 Hz. Mọi thứ đều được thực thi trên bo mạch.

Xu hướng này lan rộng đến cộng đồng các nhà phát triển. Một nhóm từ câu lạc bộ SIGRobotics của UIUC đã chế tạo một robot pha trà matcha hai tay trên hệ điều hành Jetson Thor chạy mô hình GR00T N1.5. Robot này đã giành giải nhất tại cuộc thi hackathon về trí tuệ nhân tạo tích hợp của NVIDIA.

Đà nghiên cứu này tiếp tục được thúc đẩy tại Trung tâm Robot và Trí tuệ Hiện thân của Đại học NYU. Nhóm nghiên cứu gần đây đã chạy robot YOR trên hệ điều hành Jetson Thor, sử dụng bộ xử lý NVIDIA Blackwell để xử lý các tác vụ nặng cần thiết cho chuyển động được điều khiển bởi trí tuệ nhân tạo. Kết quả ban đầu cho thấy YOR thực hiện các nhiệm vụ nhặt và đặt phức tạp với khả năng khái quát hóa tốt hơn đối với các vật thể mới và khả năng thích ứng với sự thay đổi của môi trường xung quanh, đẩy nhanh quá trình sẵn sàng cho nhiều công việc gia đình như nấu ăn và giặt giũ.

Các nhà nghiên cứu độc lập cũng đang phát hiện ra điều tương tự. Andrés Marafioti, trưởng nhóm nghiên cứu đa phương thức tại Hugging Face , đã xây dựng một hệ thống AI tác nhân trên Jetson AGX Orin có khả năng phân bổ nhiệm vụ giữa các mô hình và lên lịch công việc của chính nó. Vào một đêm khuya, tác nhân này đã gửi cho anh một tin nhắn: “Đi ngủ đi. Mọi thứ sẽ sẵn sàng vào sáng mai.”

Lập trình viên Ajeet Singh Raina từ cộng đồng Collabnix đã trình bày cách chạy OpenClaw trên NVIDIA Jetson Thor để tạo ra một trợ lý AI cá nhân hoạt động 24/7. Cấu hình này cho phép suy luận mô hình ngôn ngữ quy mô lớn riêng tư cho dữ liệu của người dùng trong khi hệ thống quản lý email và lịch thông qua một cổng cục bộ.

Jetson là tiêu chuẩn mới

NVIDIA Jetson đã trở thành một nền tảng phổ biến để chạy các mô hình mã nguồn mở ở biên mạng.

Nó hỗ trợ nhiều mô hình mở và khung AI, mang lại cho các nhà phát triển sự linh hoạt cho hầu hết mọi khối lượng công việc AI tạo sinh ở biên.

Các kết quả kiểm định mô hình có sẵn tại Jetson AI Lab , cùng với các hướng dẫn từ cộng đồng mô hình mở. Jetson Thor mang lại hiệu suất suy luận hàng đầu trên tất cả các mô hình AI tạo sinh chính.

Gemma: Được xây dựng dựa trên nghiên cứu Gemini của Google, Gemma 3 là một “cỗ máy” đa năng dành cho Jetson. Nó hỗ trợ đa phương thức ngay từ khi xuất xưởng, nghĩa là có thể nhìn và nói hơn 140 ngôn ngữ. Trên Jetson Thor, nó xử lý cửa sổ ngữ cảnh khổng lồ lên đến 128K. Điều này làm cho nó hoàn hảo cho các robot cần ghi nhớ một danh sách dài các hướng dẫn phức tạp hoặc nhiều bước.

gpt-oss-20B: Mô hình này từ OpenAI giúp giảm bớt rào cản trong việc triển khai AI tiên tiến bằng cách cung cấp hiệu năng suy luận gần như hàng đầu trong một mô hình có thể chạy cục bộ trên Jetson Thor và Orin để suy luận tiết kiệm chi phí.

Trí tuệ nhân tạo Mistral: Dòng mô hình mở Mistral 3 mới mang đến độ chính xác, hiệu quả và khả năng tùy chỉnh hàng đầu trong ngành cho các nhà phát triển và doanh nghiệp. Dòng sản phẩm này bao gồm các mô hình nhỏ gọn, có kích thước từ 3 tỷ đến 14 tỷ, hoạt động nhanh và cực kỳ thông minh so với kích thước của chúng. Các nhà phát triển Jetson có thể sử dụng vùng chứa vLLM trên NVIDIA Jetson Thor để đạt được 52 token mỗi giây cho xử lý đồng thời đơn lẻ, và có thể mở rộng lên đến 273 token mỗi giây với xử lý đồng thời tám luồng.

NVIDIA Cosmos : Mô hình ngôn ngữ thị giác suy luận mở, hàng đầu này cho phép robot và các tác nhân AI nhìn, hiểu và hành động trong thế giới vật lý giống như con người. Cả hai mô hình 8B và 2B đều chạy trên Jetson để cung cấp khả năng nhận thức và suy luận không gian-thời gian tiên tiến.

NVIDIA Isaac GR00T N1.6 là một mô hình hành động ngôn ngữ thị giác (VLA) mở dành cho các kỹ năng robot đa năng. Các nhà phát triển có thể sử dụng nó để xây dựng robot có khả năng nhận biết môi trường xung quanh, suy luận về các lệnh và thực hiện các hành động trong nhiều nhiệm vụ, môi trường và hình dạng khác nhau. Trên Jetson Thor, toàn bộ quy trình GR00T N1.6 được thực thi trên thiết bị, cung cấp khả năng nhận thức thời gian thực, nhận biết không gian và hành động phản hồi nhanh chóng.

NVIDIA Nemotron : Một tập hợp các mô hình, bộ dữ liệu và công nghệ mở cho phép người dùng xây dựng các hệ thống trí tuệ nhân tạo (AI) hiệu quả, chính xác và chuyên biệt. Nó được thiết kế cho khả năng suy luận nâng cao, lập trình, hiểu biết hình ảnh, các tác vụ tự động, an toàn, giọng nói và thông tin. Mô hình Nemotron 3 Nano 9B hoạt động hiệu quả trên Jetson Orin Nano Super với llama.cpp với hiệu suất 9 token mỗi giây.

PI 0.5: Một mô hình VLA từ Trí tuệ Vật lý cho phép robot hiểu các hướng dẫn và tự động thực hiện các nhiệm vụ phức tạp trong thế giới thực với khả năng khái quát hóa mạnh mẽ và khả năng thích ứng theo thời gian thực, trong khi NVIDIA Jetson Thor cung cấp 120 token hành động mỗi giây để hỗ trợ triển khai AI vật lý phản hồi nhanh, độ trễ thấp. Qwen 3.5: Dòng mô hình này từ Alibaba, bao gồm các bản phát hành Qwen 3.5 mới nhất, cung cấp sự kết hợp giữa các mô hình chuyên sâu và mô hình hỗn hợp chuyên gia, mang lại khả năng suy luận mạnh mẽ, mã hóa hiểu biết đa phương thức và hiệu suất ngữ cảnh dài. Jetson Thor mang lại hiệu suất tối ưu trên các mô hình Qwen như mô hình Qwen 3.5-35B-A3B , có khả năng suy luận ở tốc độ 35 token mỗi giây, giúp tương tác theo thời gian thực trở nên khả thi.

Bất kỳ nhà phát triển nào cũng có thể tinh chỉnh các mô hình này để tạo ra các tác nhân AI vật lý chuyên biệt và triển khai chúng một cách liền mạch vào các hệ thống AI vật lý. Nền tảng NVIDIA Jetson hỗ trợ các khung AI phổ biến từ NVIDIA TRT, Llama.cpp, Ollama, vLLM, SGLang và nhiều hơn nữa.

Áp dụng mô hình mở trên Jetson

Các nhà phát triển có thể tìm hiểu sâu hơn về các hướng dẫn của Hugging Face — bao gồm cả việc triển khai các mô hình ngôn ngữ thị giác mã nguồn mở trên Jetson — và xem livestream mới nhất . Hãy học hỏi từ hướng dẫn này và chạy OpenClaw trên NVIDIA Jetson.

Hãy tham gia gtc/" target="_blank" rel="noopener">GTC 2026 vào tháng tới để tận mắt chứng kiến tất cả. NVIDIA sẽ trình bày cách các mô hình mở đang được chuyển từ trung tâm dữ liệu sang các máy móc hoạt động trong thế giới vật lý, bao gồm cả trong một phiên thảo luận về Tương lai của Tự động hóa Công nghiệp .

Hãy theo dõi bài phát biểu quan trọng tại GTC của nhà sáng lập kiêm CEO NVIDIA, Jensen Huang, và khám phá các phiên thảo luận về trí tuệ nhân tạo vật lý , robot và trí tuệ nhân tạo thị giác .

____
Bài viết liên quan