tensorrt – NTC AI

Blog

Tự động hóa quá trình tối ưu hóa Inference với NVIDIA TensorRT-LLM AutoDeploy

NVIDIA TensorRT-LLM cho phép các nhà phát triển xây dựng các engine suy luận (inference engines) hiệu suất cao cho các mô hình ngôn ngữ lớn (LLM). Tuy nhiên, việc …

Blog

Suy luận thích ứng trong NVIDIA TensorRT dành cho RTX cho phép tối ưu hóa tự động

Việc triển khai các ứng dụng AI trên nhiều phần cứng tiêu dùng khác nhau theo truyền thống đòi hỏi sự đánh đổi. Bạn có thể tối ưu hóa cho …