Các AI agent đã cách mạng hóa quy trình làm việc của nhà phát triển, và mặt trận tiếp theo của chúng là công việc tri thức: xử lý thông tin, giải quyết các vấn đề phức tạp, đưa ra ý tưởng mới và thúc đẩy đổi mới.
Codex, ứng dụng lập trình dạng agent của OpenAI, đang mở ra mặt trận mới này. Ứng dụng hiện được vận hành bởi GPT-5.5, frontier model mới nhất của OpenAI, chạy trên các hệ thống quy mô rack-scale NVIDIA GB200 NVL72.
Hơn 10.000 nhân viên NVIDIA — thuộc các bộ phận kỹ thuật, sản phẩm, pháp lý, marketing, tài chính, kinh doanh, nhân sự, vận hành và chương trình dành cho nhà phát triển — đã sử dụng Codex được vận hành bởi GPT-5.5 để đạt được, theo lời họ, những kết quả “gây choáng ngợp” và “thay đổi cuộc sống”.
Các kỹ sư NVIDIA đã có quyền truy cập GPT-5.5 thông qua ứng dụng Codex trong vài tuần, và mức cải thiện là có thể đo lường được. Được phục vụ trên GB200 NVL72, hệ thống có khả năng mang lại chi phí trên mỗi triệu token thấp hơn 35 lần và lượng token đầu ra mỗi giây trên mỗi megawatt cao hơn 50 lần so với các hệ thống thế hệ trước — Những Hiệu quả kinh tế vượt trội giúp việc suy luận mô hình tiên tiến (frontier-model Inference) trở nên hoàn toàn khả thi ở quy mô doanh nghiệp.
Những chu kỳ gỡ lỗi từng kéo dài nhiều ngày nay đang được rút ngắn xuống chỉ còn vài giờ. Việc thử nghiệm trước đây cần nhiều tuần nay đang chuyển thành tiến triển qua đêm trong các codebase phức tạp, gồm nhiều tệp. Các nhóm đang triển khai những tính năng end-to-end từ các prompt bằng ngôn ngữ tự nhiên, với độ tin cậy cao hơn và ít chu kỳ bị lãng phí hơn so với các mô hình trước đây.
Tiến bộ ấn tượng của OpenAI chỉ là ví dụ mới nhất về công việc của NVIDIA với mọi công ty mô hình tiên phong — không chỉ để tăng tốc việc sử dụng AI agent bên trong NVIDIA, mà còn để giúp các đối tác của công ty xây dựng những mô hình tốt nhất thế giới, có chi phí thấp nhất và tiết kiệm năng lượng nhất cho mọi người.
Như nhà sáng lập kiêm CEO NVIDIA Jensen Huang đã nói với nhân viên trong một email gửi toàn công ty kêu gọi mọi người sử dụng Codex: “Hãy nhảy lên tốc độ ánh sáng. Chào mừng đến với kỷ nguyên AI.”
Một triển khai được xây dựng cho bảo mật doanh nghiệp
Cũng giống như con người, mỗi agent đều cần một máy tính chuyên dụng của riêng mình.
Để đảm bảo hoạt động liền mạch trong các môi trường doanh nghiệp bảo mật, ứng dụng Codex hỗ trợ kết nối Secure Shell (SSH) từ xa tới các máy ảo đám mây đã được phê duyệt, cho phép các agent làm việc với dữ liệu thật của công ty mà không để lộ dữ liệu ra bên ngoài.
Vì vậy, để đảm bảo mức độ bảo mật và khả năng kiểm toán tối đa, bộ phận IT của NVIDIA đã triển khai các máy ảo (VM) đám mây cho từng nhân viên để chạy agent của họ một cách an toàn. Điều này cung cấp một sandbox chuyên dụng để agent hoạt động với năng lực tối đa trong khi vẫn duy trì khả năng kiểm toán đầy đủ. Người dùng có thể điều khiển agent Codex đang chạy trong VM đám mây từ một giao diện người dùng quen thuộc với mọi nhân viên.
Việc triển khai của NVIDIA được quản lý bởi chính sách không lưu giữ dữ liệu, và các agent truy cập hệ thống production với quyền chỉ đọc thông qua giao diện dòng lệnh và Skills — cùng bộ công cụ agentic mà NVIDIA dùng để vận hành các workflow tự động hóa trong toàn công ty.

Một thập kỷ hợp tác full-stack
Việc ra mắt GPT-5.5 và triển khai Codex phản ánh hơn 10 năm hợp tác giữa NVIDIA và OpenAI. Quan hệ đối tác này bắt đầu vào năm 2016, khi Huang trực tiếp mang siêu máy tính AI NVIDIA DGX-1 đầu tiên đến trụ sở OpenAI tại San Francisco.
Kể từ đó, hai công ty đã hợp tác chặt chẽ trên toàn bộ AI stack.
NVIDIA là đối tác từ ngày đầu tiên cho đợt ra mắt mô hình open-weight gpt-oss của OpenAI, tối ưu hóa trọng số mô hình cho NVIDIA TensorRT-LLM và các framework trong hệ sinh thái, bao gồm vLLM và Ollama.
OpenAI đã cam kết triển khai hơn 10 gigawatt hệ thống NVIDIA cho hạ tầng AI thế hệ tiếp theo của mình — một đợt xây dựng mở rộng sẽ đặt hàng triệu GPU NVIDIA làm nền tảng cho việc huấn luyện mô hình và suy luận của OpenAI trong nhiều năm tới.
Và OpenAI cùng NVIDIA là các đối tác sớm về silicon và đồng thiết kế: OpenAI cung cấp phản hồi để định hướng lộ trình phần cứng của NVIDIA, và đổi lại được tiếp cận sớm các kiến trúc mới. Mối quan hệ đó đã tạo ra một cột mốc cụ thể — việc cùng đưa vào vận hành cụm GB200 NVL72 100.000 GPU đầu tiên. Cụm này đã hoàn tất nhiều lượt huấn luyện quy mô lớn và thiết lập một chuẩn mới về độ tin cậy cấp hệ thống ở quy mô frontier.
GPT-5.5 là sản phẩm của hạ tầng đó khi vận hành ở toàn bộ công suất.
Bài viết liên quan
- NVIDIA Riva giải pháp Voice RAG: tối ưu luồng dữ liệu âm thanh và đồng bộ Avatar 3D
- NVIDIA Dynamo Snapshot: Khởi động nhanh cho workload suy luận trên Kubernetes
- Triển khai kiến trúc Multi-Agent Intelligent Warehouse cho việc vận hành kho hàng hiện đại
- Triển khai AI Agent sẵn sàng cho thực tế tại biên với hiệu quả sử dụng bộ nhớ cao trên NVIDIA JetPack 7.2
- NVIDIA và Microsoft tái định nghĩa “Windows PC” cho kỷ nguyên của AI cá nhân
