NVIDIA nâng cấp các AI Agent cục bộ trên RTX PC và DGX Spark

RTX Spark — một khởi đầu mới cho PC — đã được công bố tại GTC Taipei trong khuôn khổ COMPUTEX, cùng với NVIDIA OpenShell mang đến các agent bảo mật cho Windows với hiệu suất suy luận gấp 2 lần trên llama.cpp; Bên cạnh đó, Adobe xây dựng lại các ứng dụng của mình với những cải tiến về hiệu suất và bộ nhớ, và Blender bổ sung tính năng tái tạo tia NVIDIA DLSS 4.5.

Các trợ lý cá nhân đang bùng nổ về mức độ phổ biến, với các dự án mã nguồn mở như OpenClaw và Hermes được cộng đồng các nhà phát triển AI trên GitHub nhanh chóng đón nhận. Được xây dựng để thích ứng với sở thích và quy trình làm việc của từng cá nhân, các trợ lý này có thể tương tác với các ứng dụng, tạo nội dung, tự động hóa các quy trình lặp đi lặp lại và quản lý các tác vụ nhiều bước — tất cả đều chạy cục bộ trên thiết bị.

Tại sự kiện COMPUTEX Taipei 2026, NVIDIA đã giới thiệu NVIDIA RTX Spark — một dòng máy tính Windows mới được thiết kế đặc biệt cho các trợ lý ảo cá nhân — cùng với một loạt các bản cập nhật mở rộng khả năng sử dụng trợ lý ảo cục bộ trên toàn bộ hệ sinh thái NVIDIA RTX và DGX.

Việc chạy các agent một cách an toàn và riêng tư đòi hỏi phần cứng đủ mạnh. Khả năng tính toán AI 1 petaflop và bộ nhớ hợp nhất 128GB của RTX Spark có thể đáp ứng nhu cầu tính toán của các agent trên thiết bị, mang đến một thế hệ máy tính mới, từ công cụ trở thành người bạn đồng hành đắc lực. Được thiết kế cho AI, sáng tạo và chơi game, RTX Spark mang 30 năm đổi mới công nghệ của NVIDIA đến với những chiếc máy tính xách tay Windows mỏng nhẹ với thời lượng pin cả ngày và máy tính để bàn siêu tiết kiệm năng lượng.

Quan hệ đối tác của NVIDIA với Windows trải rộng từ các giải pháp cá nhân đến doanh nghiệp. Cũng được giới thiệu tại triển lãm là NVIDIA DGX Station dành cho Windows, siêu máy tính AI để bàn tối ưu dành cho các chuyên gia, mang đến GPU và CPU cấp trung tâm dữ liệu cho khả năng suy luận trong một hệ thống máy tính để bàn được trang bị Windows để dễ quản lý, bảo mật và tương thích.

Máy tính AI với siêu chip NVIDIA GB10 Grace Blackwell

Các thông báo khác bao gồm:

Môi trường chạy NVIDIA OpenShell sẽ có mặt trên Windows, được xây dựng trên các nguyên tắc bảo mật mới của Microsoft dành cho các agent — cung cấp cho các nhà phát triển một gói dễ triển khai cho các agent bảo mật trên thiết bị. Hermes Agent và OpenClaw cũng sẽ tích hợp OpenShell và các nguyên tắc bảo mật của Microsoft vào các ứng dụng Windows mới của chúng.
NVIDIA NemoClaw blueprint đang được mở rộng trên toàn bộ dòng sản phẩm AI cục bộ của NVIDIA — GeForce RTX, RTX PRO, RTX và DGX Spark, và DGX Station — với trình cài đặt được đơn giản hóa và hỗ trợ cho Hermes Agent.
Hiệu suất suy luận gấp 2 lần trên các mô hình agent hàng đầu với dự đoán đa token trong llama.cpp và vLLM, cũng như các tối ưu hóa đa GPU mới cho llama.cpp và ComfyUI .
H Company đang phát hành các công cụ sử dụng máy tính — bao gồm các mô hình mới và một bộ công cụ desktop agent sắp ra mắt — được tối ưu hóa cho PC RTX và DGX.
Adobe đang tái cấu trúc các ứng dụng Photoshop và Premiere của mình, Blender bổ sung công nghệ tái tạo tia NVIDIA DLSS 4.5, và NVIDIA đã công bố công nghệ tạo khung hình video RTX, sẽ được tích hợp vào ComfyUI. Tất cả các bản cập nhật này sẽ ra mắt vào mùa thu này cùng với RTX Spark.
Bản cập nhật NVIDIA Broadcast 2.2 mang đến những tối ưu hóa tính năng Studio Voice và hỗ trợ Elgato Stream Deck . NVIDIA Project G-Assist cũng bổ sung tính năng tích hợp Stream Deck .

AI Agent tại chỗ: Cá nhân, riêng tư và nhanh chóng trên máy tính Windows RTX

Việc ứng dụng rộng rãi phần mềm độc lập này bị hạn chế bởi việc không thể chạy chúng một cách an toàn và riêng tư trên máy tính cá nhân chính của người dùng.

NVIDIA và Microsoft đang hợp tác để giải quyết thách thức này bằng cách cung cấp một nền tảng Windows mạnh mẽ và an toàn cho các agent trên thiết bị.

Sự hợp tác này bắt đầu với một nền tảng vững chắc — các nguyên tắc bảo mật mới của Windows và môi trường chạy NVIDIA OpenShell — để đảm bảo các agent hoạt động an toàn và hoàn toàn nằm dưới sự kiểm soát của người dùng.

Các thành phần cơ bản mới của Windows cung cấp khả năng nhận dạng, kiểm soát, chính sách và bảo mật đầu cuối để xây dựng và chạy các agent một cách tự nhiên. NVIDIA OpenShell cung cấp thêm các khả năng về chính sách cho người dùng để xác định những gì agent có thể và không thể làm, khả năng định tuyến truy vấn một cách thông minh đến các mô hình tại chỗ dựa trên chính sách bảo mật của người dùng và khả năng che giấu thông tin cá nhân trong các truy vấn được gửi đến các mô hình đám mây.

Lớp bảo mật và quyền riêng tư mạnh mẽ này đang được các nhà phát triển agent hàng đầu như Hermes Agent và OpenClaw áp dụng trong các ứng dụng Windows mới của họ. Các ứng dụng mới này sẽ giúp người dùng dễ dàng và an toàn truy cập vào các agent mạnh mẽ trên thiết bị, có khả năng thực thi các tác vụ trong ứng dụng Windows, suy luận thông qua quy trình làm việc liên ứng dụng, tạo hình ảnh và video, lập trình các plugin và ứng dụng, và tìm kiếm ngữ nghĩa trên các tập tin cục bộ.

Việc vận hành các agent trên thiết bị cục bộ đòi hỏi cả bảo mật mạnh mẽ và phần cứng hiệu năng cao. RTX Spark sở hữu khả năng tính toán AI lên đến 1 petaflop và 128GB bộ nhớ hợp nhất để đáp ứng nhu cầu xử lý của các agent trên thiết bị.

NVIDIA cũng đang đẩy nhanh quá trình hình thành hệ sinh thái mô hình mở tại chỗ mà các agent này dựa vào.

NVIDIA đã hợp tác với cộng đồng llama.cpp để kích hoạt các tính năng và tối ưu hóa như dự đoán đa token (MTP) — một kỹ thuật giải mã suy đoán trong đó một mô hình dự thảo nhỏ hơn đề xuất nhiều token cùng một lúc mà mô hình mục tiêu sẽ xác minh trong một lần xử lý duy nhất. Kết hợp với các tối ưu hóa khác như khởi chạy phụ thuộc lập trình, điều này mang lại hiệu suất gấp 2 lần trên Qwen 3.6 và 3.5 27B, và tăng hiệu suất gấp 1,6 lần trên Qwen 3.6 và 3.5 35B. Các bản cập nhật này có sẵn thông qua giao diện web llama.cpp và LM Studio .

Hiệu suất được cải thiện nhờ các tối ưu hóa mới nhất của NVIDIA cho llama.cpp: Qwen3.6-27B mang lại thông lượng lên đến gấp 2 lần và Qwen3.6-35B lên đến gấp 1,6 lần trên GeForce RTX 5090, giúp tăng tốc các tác vụ AI cục bộ thông qua sự hợp tác cộng đồng mã nguồn mở.

Đối với những người đam mê trí tuệ nhân tạo sử dụng dàn máy đa GPU, NVIDIA đã hợp tác với cộng đồng mã nguồn mở để nâng cấp hai trong số những công cụ AI cục bộ phổ biến nhất:

llama.cpp bổ sung khả năng song song hóa tensor, cho phép tăng gấp đôi bộ nhớ và gấp 1,8 lần khả năng tính toán trên hai GPU tương đương.
ComfyUI được bổ sung phương pháp hướng dẫn không cần phân loại mới, cho hiệu suất gấp đôi trên hai GPU tương đương, cùng với tùy chọn chia chuỗi mô hình trên các GPU để tận dụng bộ nhớ kết hợp.

Hiển thị sự cải thiện hiệu suất tạo token cho kỹ thuật Tensor Parallel Multi-GPU so với suy luận song song theo đường ống và suy luận đơn GPU trên tập dữ liệu llama.cpp.

Hiển thị sự cải thiện hiệu năng theo thời gian khi sử dụng các kỹ thuật đa GPU trên ComfyUI.

NVIDIA cũng đang mở rộng khả năng của các agent ảo với H Company . Hệ thống điều khiển bằng máy tính của H Company cho phép các agent ảo điều hướng trên PC bằng cách nhìn màn hình và vận hành chuột và bàn phím giống như người dùng, ngay cả trong các ứng dụng không có giao diện lập trình ứng dụng (API), và sẽ sớm có mặt trên các PC RTX và DGX có hỗ trợ mô hình cục bộ.

NVIDIA đã hợp tác với H Company để lượng tử hóa các mô hình sử dụng máy tính Holo tiên tiến nhất của mình, cũng như tăng tốc quá trình khai thác – giúp tăng tốc gấp đôi trên GPU của NVIDIA đồng thời giảm mức tiêu thụ bộ nhớ 35%. Các mô hình hiện đã có sẵn để tải xuống và ứng dụng Holo Desktop sẽ sớm ra mắt.

Tối ưu hóa agent cho Linux

Đối với các nhà phát triển cần các agent cục bộ luôn có thể truy cập được, NVIDIA DGX Spark là máy tính agtentic AI cá nhân mạnh mẽ nhất dành cho các nhà phát triển cần môi trường Linux — kết hợp bộ nhớ lớn, khả năng tính toán nhanh và khả năng tương thích với hệ sinh thái NVIDIA CUDA.

Phiên bản DGX Spark OS được phát hành tháng này mang đến trải nghiệm sử dụng tối ưu nhất ngay từ khi cài đặt, với trình cài đặt NemoClaw được đơn giản hóa, cùng với khả năng suy luận nhanh hơn trên các mô hình agent hàng đầu.

NemoClaw hiện đã có sẵn cho tất cả các máy tính NVIDIA RTX và DGX trên Linux và Hệ thống con Linux của Windows . Triển khai an toàn các agent cục bộ trên Linux với trình cài đặt được tối ưu hóa mới, cung cấp môi trường biệt lập tự động và hỗ trợ thêm cho Hermes Agent.

NVIDIA đã hợp tác với vLLM để tối ưu hóa quá trình suy luận cho các agent, với các tối ưu hóa trong vLLM và các điểm kiểm tra NVFP4 được tối ưu hóa mới cho Qwen 3.6 35B. Các bản cập nhật mang lại hiệu suất gấp 2,6 lần trên DGX Spark so với các điểm kiểm tra NVFP4 có sẵn trước đó từ Unsloth, và bao gồm các cải tiến về nhân cũng như độ chính xác hỗn hợp và hỗ trợ CUDA Graph cho MTP.

Hãy đọc bài viết trên blog vLLM để có hướng dẫn đầy đủ về cách chạy các mô hình hỗn hợp biểu thức NVFP4 trên DGX Spark — từ việc tinh chỉnh bộ nhớ thống nhất đến thiết lập tham chiếu NVIDIA Nemotron 3 Super hoạt động.

Mang đến những trải nghiệm sáng tạo mạnh mẽ với Adobe

NVIDIA đang hợp tác với Adobe để tái cấu trúc Adobe Premiere và Photoshop cho RTX Spark. Tính năng Generative Fill được hỗ trợ bởi Firefly trong Photoshop và Generative Extend trong Premiere nằm trong số hàng trăm công cụ được tăng tốc, mang lại sức mạnh, độ chính xác và khả năng kiểm soát sáng tạo. RTX Spark đưa những khả năng này lên một tầm cao mới, mang lại tốc độ xử lý AI, chỉnh sửa, tô màu và hiệu ứng nhanh hơn gấp 2 lần trên toàn bộ quy trình làm việc sáng tạo.

Adobe Premiere sẽ tích hợp một quy trình xử lý video mới tận dụng bộ nhớ hợp nhất, GPU Blackwell và phần mềm TensorRT của RTX Spark, mang lại hiệu năng thời gian thực cho việc chỉnh sửa và hiệu chỉnh màu sắc, hiệu năng AI được tăng tốc bằng GPU và khả năng kết xuất hiệu quả hơn cho các dòng thời gian phức tạp. Ngoài ra, Adobe Substance 3D Painter và Stager sẽ chạy trực tiếp trên RTX Spark, giúp quá trình tạo họa tiết 3D và tạo cảnh diễn ra mượt mà và nhanh nhạy hơn.

Công nghệ Photoshop thế hệ tiếp theo của Adobe sẽ được tối ưu hóa cho việc ghép ảnh tăng tốc bằng GPU, cho phép sử dụng bộ lọc trực tiếp, dải động cao và các công cụ vẽ tự nhiên hiện đại. Quy trình xử lý dựa trên AI được xây dựng để khai thác tối đa sức mạnh của RTX Spark, bao gồm cả TensorRT.

Adobe sẽ tiếp tục mở rộng Premiere và Photoshop để cho phép người dùng tạo, chỉnh sửa và thiết kế với các agent Windows, cung cấp cho người sáng tạo một cộng tác viên đắc lực để tăng tốc quy trình làm việc của họ.

Các bản cập nhật cho các ứng dụng sáng tạo của Adobe như Premiere, Photoshop và Substance dự kiến sẽ được triển khai cùng lúc với sự ra mắt của RTX Spark.

Các công cụ và bản cập nhật ứng dụng mới dành cho người sáng tạo

Các bản cập nhật nền tảng NVIDIA mới và các tối ưu hóa ứng dụng đối tác đang được triển khai trên toàn bộ hệ sinh thái RTX — một số được phát hành ngay hôm nay và một số khác sẽ ra mắt cùng với RTX Spark vào mùa thu này.

NVIDIA Broadcast 2.2 chính thức đưa Studio Voice — một tính năng trí tuệ nhân tạo giúp mọi micro phát ra âm thanh chất lượng phòng thu — ra khỏi giai đoạn beta bắt đầu từ hôm nay. Studio Voice hiện hoạt động trên GPU GeForce RTX 3060 trở lên với hiệu năng được cải thiện. Ứng dụng này cũng tích hợp với Elgato Stream Deck và hỗ trợ các phím tắt có thể cấu hình.

Dự án G-Assist cũng bổ sung hỗ trợ Stream Deck thông qua Elgato MCP Server , cho phép người dùng kích hoạt các khả năng trợ lý AI cho thiết lập phát trực tuyến của họ.

Ngoài ra, Blender Cycles đang tích hợp DLSS 4.5 Ray Reconstruction như một công cụ khử nhiễu mới, biến khung nhìn dò tia thành một trình xem tương tác, thời gian thực. Điều này cho phép các nghệ sĩ 3D điều hướng xung quanh một cảnh trong khi xem chất lượng kết xuất gần như hoàn chỉnh, làm thay đổi quy trình làm việc về ánh sáng và phát triển hình ảnh. Bản cập nhật sẽ được phát hành cùng với Blender 5.3 vào mùa thu này, cùng với RTX Spark.

Cũng ra mắt cùng với RTX Spark, RTX Video Frame Generation là một hiệu ứng AI mới giúp tăng gấp đôi hoặc gấp bốn lần tốc độ khung hình video trong thời gian thực — lý tưởng để nâng cao chất lượng đầu ra 15-20 khung hình/giây (fps) mà các mô hình AI thường tạo ra. Nó được cung cấp dưới dạng một Python wheel và một nút ComfyUI, cho phép các nhà sáng tạo AI tạo video nhanh hơn ở tốc độ khung hình thấp và sau đó nội suy lên để đạt được tốc độ phát lại mượt mà.

____
Bài viết liên quan