Tái thiết bán lẻ đa kênh với Physical AI: Kết nối cửa hàng từ biên đến đám mây

Trong kỷ nguyên số hóa, chúng ta thường khai thác triệt để các tệp dữ liệu hành vi của khách hàng trên các nền tảng trực tuyến – từ việc họ dừng lại xem sản phẩm bao lâu đến việc họ bỏ gì vào giỏ hàng. Tuy nhiên, các nhà bán lẻ lại gần như “mù” hoàn toàn khi khách hàng bước vào cửa hàng vật lý – nơi vốn vẫn chiếm tới 80% tổng doanh số bán lẻ tạp hóa toàn cầu. Tại sự kiện NVIDIA GTC 2026, David từ Instacart đã chia sẻ một tầm nhìn táo bạo nhằm xóa bỏ ranh giới này thông qua Physical AI, biến cửa hàng truyền thống thành một thực thể dữ liệu sống động.

Khoảng cách giữa Trực tuyến và Ngoại tuyến: “Điểm mù” của ngành bán lẻ

Mặc dù Instacart là đơn vị dẫn đầu về giao hàng tạp hóa trực tuyến tại Bắc Mỹ, họ nhận ra rằng để thực sự làm chủ thị trường, họ phải hiện diện tại nơi “chiến trường” thực sự diễn ra: các cửa hàng vật lý. Thách thức lớn nhất không chỉ là mang lại sự tiện lợi của thương mại điện tử vào đời thực, mà là làm sao để hiểu được khách hàng trong cửa hàng giống như cách chúng ta hiểu họ trên web.

Hiện nay, hầu hết các nhà bán lẻ không biết khách hàng đang đứng ở đâu, họ đang phân vân giữa hai món đồ nào, hay tại sao họ lại đặt một món hàng trở lại kệ. Việc thiếu hụt dữ liệu này dẫn đến các chiến dịch khuyến mãi kém hiệu quả và quản lý tồn kho không chính xác. Physical AI sinh ra để giải quyết “điểm mù” kinh niên này.

Caper Cart: Bộ não di động và Trải nghiệm mua sắm mượt mà

Trung tâm của cuộc cách mạng này chính là Caper Cart – xe đẩy mua sắm thông minh thế hệ mới của Instacart. Đây không đơn thuần là một phương tiện vận chuyển hàng hóa, mà là một trung tâm xử lý dữ liệu di động được trang bị những công nghệ tiên tiến nhất:

  • NVIDIA Jetson Board: Mỗi chiếc xe là một máy chủ nhỏ chạy trực tiếp tại biên (Edge AI). Điều này cho phép xử lý hình ảnh và dữ liệu ngay lập tức mà không cần phụ thuộc hoàn toàn vào kết nối Wi-Fi chập chờn trong siêu thị.
  • Hệ thống thị giác máy tính và Cảm biến thông minh: Xe được trang bị nhiều camera góc rộng để nhận diện sản phẩm ngay khi chúng được thả vào giỏ hàng, kể cả khi sản phẩm bị che khuất một phần.
  • Cân trọng lượng đạt chứng nhận thương mại: Đảm bảo độ chính xác tuyệt đối cho các mặt hàng không có mã vạch như rau củ quả. Hệ thống biết chính xác bạn vừa lấy 3 quả táo hay 4 quả.

Trải nghiệm người dùng được nâng cấp đáng kể: Khách hàng có thể đăng nhập bằng tài khoản thành viên, xem danh sách mua sắm đã soạn sẵn ở nhà, và thanh toán ngay trên xe. Sự tích hợp này không chỉ tiết kiệm thời gian mà còn loại bỏ hoàn toàn việc phải xếp hàng chờ đợi – nỗi ám ảnh lớn nhất của người đi siêu thị.

Sức mạnh của sự kết hợp: Chiến lược Hybrid Edge và Cloud

Để đạt được độ chính xác tuyệt đối trong môi trường cửa hàng phức tạp – nơi ánh sáng thay đổi liên tục và hàng ngàn mặt hàng có bao bì tương tự nhau – Instacart sử dụng chiến lược AI hai tầng độc đáo:

  1. Tại Biên (Edge): Các mô hình AI chạy trên bo mạch Jetson phản hồi trong vòng vài trăm mili giây. Khi bạn bỏ một hộp ngũ cốc vào xe của mình, màn hình sẽ hiển thị ngay lập tức, tạo ra cảm giác tương tác mượt mà.
  2. Trên Đám mây (Cloud): Sử dụng các mô hình ngôn ngữ thị giác (VLM) mạnh mẽ và nền tảng NVIDIA Triton để xử lý các tác vụ phức tạp hơn. Ví dụ, nếu xe không chắc chắn về một mặt hàng lạ, dữ liệu sẽ được gửi lên mây để phân tích sâu hơn dựa trên ngữ cảnh lịch sử mua sắm.

Hệ thống Hợp nhất cảm biến (Sensor Fusion) này giúp xe đẩy hiểu được không chỉ món đồ đó là gì mà còn cả vị trí của nó trên sơ đồ kệ hàng. Instacart thậm chí đang thử nghiệm mô hình NVIDIA Nemotron để hiểu ý định của khách hàng thông qua ngôn ngữ tự nhiên, giúp việc tìm kiếm hàng hóa trở nên dễ dàng như đang trò chuyện với một nhân viên hỗ trợ thực thụ.

Cá nhân hóa quy mô lớn và Tác động doanh thu

Khả năng cá nhân hóa dựa trên vị trí (Location-based personalization) là một “vũ khí” thay đổi cuộc chơi. Khi khách hàng đẩy xe đến quầy sữa, hệ thống dựa trên lịch sử mua sắm trực tuyến có thể nhắc: “Bạn có muốn mua thêm ngũ cốc đang giảm giá ở dãy kế bên không?”.

Một ví dụ điển hình là tính năng “Got everything you need?” (Bạn đã có đủ mọi thứ chưa?). Ngay trước khi khách hàng thanh toán, AI sẽ phân tích giỏ hàng hiện tại, so sánh với thói quen mua sắm 10 năm qua của khách hàng và vị trí hiện tại để đưa ra lời nhắc cuối cùng. Kết quả thực tế cho thấy:

  • Doanh số bán hàng: Tăng trưởng ở mức hai con số tại các cửa hàng áp dụng.
  • Quảng cáo bán lẻ (Retail Media): Hiệu quả tăng vọt do gợi ý đúng người, đúng thời điểm ngay tại điểm bán.
  • Giá trị khách hàng: Giá trị vòng đời (LTV) của nhóm khách đa kênh cao hơn tới 70% so với nhóm chỉ mua một kênh đơn lẻ.

Hướng tới “Mô hình Thế giới Tạp hóa” (Grocery World Model)

Tầm nhìn dài hạn của Instacart không dừng lại ở chiếc xe đẩy. Họ đang xây dựng Grocery World Model – một hệ thống AI nền tảng có khả năng hiểu toàn bộ “hệ sinh thái” bán lẻ. Hệ thống này không chỉ hiểu sản phẩm, mà còn hiểu cách chúng tương tác với nhau và cách con người vận hành trong không gian đó.

Khi mọi kệ hàng và mọi hành vi của khách hàng được số hóa thành dữ liệu có thể đo lường (Measurable Stores), cửa hàng sẽ trở nên có thể tối ưu hóa (Optimizable Stores). Điều này mở ra cánh cửa cho robot tự hành kiểm kho, hệ thống tự động đặt hàng khi sản phẩm trên kệ vơi đi, và giúp các thương hiệu tiêu dùng (CPG) như Bimbo Bakeries biết chính xác vị trí nào trong cửa hàng đang mang lại hiệu quả trưng bày tốt nhất.

Kỷ nguyên mới của Bán lẻ đại diện (Agentic Commerce)

Với sự hỗ trợ từ nền tảng phần cứng và phần mềm của NVIDIA, Instacart đang biến những chiếc xe đẩy thô sơ thành những trợ lý AI quyền năng. Đây không chỉ là một bước tiến về kỹ thuật, mà là sự chuyển mình sang kỷ nguyên Agentic Commerce – nơi AI không chỉ phản hồi yêu cầu mà còn chủ động hỗ trợ, dự báo và tối ưu hóa trải nghiệm cho cả khách hàng lẫn nhà bán lẻ.

Khi AI phục vụ con người một cách tự nhiên và mượt mà ngay trong đời thực, đó cũng là lúc bán lẻ truyền thống tìm lại được vị thế hoàng kim của mình trong thế giới số.