Tại sự kiện NVIDIA GTC 2026, phiên trình bày của Azita Martin (Phó Chủ tịch kiêm Tổng Giám đốc khối Bán lẻ và CPG tại NVIDIA) đã vẽ nên một bức tranh hoàn toàn mới về cách ngành bán lẻ và hàng tiêu dùng nhanh (CPG) ứng dụng Trí tuệ Nhân tạo. Thay vì những mô hình ngôn ngữ đơn lẻ, trọng tâm giờ đây đã dịch chuyển sang các hệ thống đa tác tử (agentic systems), tối ưu hóa suy luận, và đưa AI vật lý (Physical AI) vào sâu trong chuỗi cung ứng.
Dưới đây là 6 xu hướng công nghệ cốt lõi sẽ định hình lại ngành bán lẻ trong kỷ nguyên mới.
1. Mô hình Mở (Open Models) và Chiến lược làm chủ Dữ liệu
Hệ sinh thái các mô hình AI mở đang phát triển với tốc độ vũ bão, với sự góp mặt của hàng loạt gã khổng lồ như Google, Meta, Microsoft, Alibaba và NVIDIA. Đối mặt với làn sóng này, NVIDIA đề xuất một chiến lược rõ ràng cho các doanh nghiệp bán lẻ: Sở hữu tài sản trí tuệ (IP) của riêng mình.
- Bằng cách sử dụng các mô hình mở kết hợp với dữ liệu nội bộ độc quyền, doanh nghiệp có thể tạo ra các hệ thống AI chuyên biệt.
- Các mô hình này mang lại sự linh hoạt tối đa khi có thể triển khai ở bất cứ đâu: trên Đám mây (Cloud), hạ tầng tại chỗ (On-premise) hoặc qua NVIDIA DGX Cloud.
Để hỗ trợ chiến lược này, NVIDIA đã ra mắt dòng mô hình Nemotron, trải dài từ quy mô nhỏ đến siêu lớn: Nemotron Nano (30B-A3B) , Nemotron Super (120B-A12B) , và Nemotron Ultra (500B-A50B). Hệ sinh thái này còn cung cấp các biến thể chuyên biệt xử lý tài liệu (RAG), giọng nói (Speech) và kiểm duyệt an toàn nội dung (Safety).
2. Bước ngoặt “Agentic Scaling”: Khi AI giao tiếp với AI
Khái niệm mang tính cách mạng nhất tại GTC 2026 chính là “Agentic Scaling – AI talking to AI”. Ngành công nghệ đang chính thức bước qua thời kỳ sử dụng một AI đơn lẻ để chuyển sang hệ thống gồm nhiều AI Agent phối hợp nhịp nhàng với nhau.
Đại diện tiêu biểu cho xu hướng này là NVIDIA Agentic Commerce Blueprint. Bản thiết kế này cung cấp một nền tảng toàn diện giúp nhà bán lẻ:
- Hỗ trợ tương tác trực tiếp và đàm phán với các tác tử mua sắm của đối tác như OpenAI Shopping Agent và Google Shopping Agent.
- Vận hành thông qua các agent chuyên biệt: Agent Khuyến mãi (Promotion), Agent Gợi ý (Recommendation), và Agent Hậu mãi (Post-purchase).
- Đặc biệt, hệ thống này giúp nhà bán lẻ giữ vững quyền kiểm soát giao dịch, bảo vệ tuyệt đối vai trò “Merchant-of-Record”.
3. Tối ưu hóa Suy luận (Inference) trong Thương mại điện tử
Trong vận hành AI, tối ưu hóa suy luận đồng nghĩa với tối ưu hóa chi phí. Case-study từ nền tảng thương mại điện tử Shopify là một minh chứng rõ nét.
- Shopify đã ứng dụng engine vLLM được NVIDIA tối ưu hóa (CentML) để xử lý các tác vụ nặng.
- Các tác vụ này bao gồm: Phân loại sản phẩm (taxonomy classification), Gợi ý mua sắm, Làm phong phú danh mục (Catalog enrichment), và Trợ lý mua sắm thông minh.
Kết quả mang lại cực kỳ ấn tượng: Tốc độ suy luận tăng từ 1.5 đến 4.5 lần, đồng thời giảm chi phí suy luận từ 1.5 đến 6 lần.
4. Đưa AI Vật lý (Physical AI) vào Chuỗi cung ứng và R&D
Không chỉ giới hạn ở phần mềm, AI đang trực tiếp tái thiết lập thế giới vật lý của ngành bán lẻ:
- Bản sao kỹ thuật số (Digital Twins): Tập đoàn PepsiCo đã sử dụng nền tảng NVIDIA Omniverse để mô phỏng chính xác các nhà kho và trung tâm phân phối. Việc tối ưu hóa trên thế giới ảo đã giúp họ tăng 20% thông lượng (throughput) và ước tính giảm 10–15% chi phí đầu tư (CAPEX).
- Tối ưu hóa chuỗi cung ứng (cuOpt): Đối tác Kinaxis ứng dụng thư viện NVIDIA cuOpt để giải quyết các bài toán toán học hóc búa như Định tuyến xe (VRP) , Quy hoạch tuyến tính (LP) và Quy hoạch nguyên hỗn hợp (MIP). Hệ thống tính toán end-to-end nhanh hơn 12 lần , giảm 90% chu kỳ lập kế hoạch và giải quyết các bài toán tối ưu cốt lõi nhanh hơn 23 lần.
- Nghiên cứu & Phát triển (ALCHEMI): Ứng dụng trong nghiên cứu công thức sản phẩm mới (ví dụ: công thức bảo vệ da của L’Oréal). AI giúp tăng tốc sàng lọc (screening) lên 100 lần , rút ngắn dòng thời gian khám phá lên 10 lần , qua đó tiết kiệm đáng kể ngân sách R&D.
5. Kỷ nguyên của Cửa hàng Thông minh (Intelligent Stores)
Bên trong các cửa hàng bán lẻ vật lý, AI đang trở thành “mắt thần” và “não bộ” điều hành mọi ngóc ngách. Các ứng dụng tiêu biểu bao gồm: Hệ thống chống thất thoát tài sản (Asset protection) , Tối ưu giá động (Dynamic pricing) , Quản lý tồn kho và hết hàng (Inventory & stockout management) , Trợ lý cho nhân viên (Employee assistants) , Phân tích cửa hàng (Store analytics) , và Quảng cáo thích ứng (Adaptive advertising).
6. Cú nhảy vọt về Hiệu năng Hạ tầng
Mọi kiến trúc AI thông minh đều cần một bệ phóng phần cứng tương xứng. NVIDIA nhấn mạnh rằng Suy luận (Inference) chính là khối lượng công việc cốt lõi của “Nhà máy AI”.
Sự xuất hiện của siêu chip GB300 NVL72 NVFP4 đã thiết lập một tiêu chuẩn mới. Khi so sánh với thế hệ H200 FP8 trước đó , hệ thống mới mang lại hiệu năng trên mỗi watt điện cao hơn 50 lần và giảm chi phí tới 35 lần trên mỗi triệu token được sinh ra.
Kết luận
Phiên trình bày của NVIDIA tại GTC 2026 đã vạch ra một lộ trình sắc nét cho các doanh nghiệp Bán lẻ & CPG. Để duy trì lợi thế cạnh tranh, các công ty cần xây dựng hệ thống AI riêng dựa trên mô hình mở và dữ liệu nội bộ, dịch chuyển sang kiến trúc đa tác tử (Agentic systems), và liên tục tối ưu hóa chi phí suy luận. Đồng thời, việc mạnh dạn áp dụng AI Vật lý vào chuỗi cung ứng, R&D và trực tiếp tại cửa hàng sẽ là chìa khóa để kiến tạo nên những hệ thống vận hành thông minh và bền vững nhất.
