Tại NVIDIA GTC 2026, panel “Open Source & Business” quy tụ Ion Stoica (UC Berkeley), Jonathan Cohen (NVIDIA), Ranjay Krishna (Allen Institute), Ying Sheng (ReddixArc), Jeff Boudier (Hugging Face) đã vẽ ra bức tranh rõ nét: Mã nguồn mở không chỉ là tình yêu khoa học, mà là nền tảng kinh doanh AI tỷ đô.
1. Công thức từ cộng đồng thành doanh nghiệp
Ion Stoica (Apache Spark, Ray, vLLM, Databricks founder) chia sẻ:”Open source project thành công = đã giải quyết vấn đề thực tế = product-market fit”.
Con đường thương mại hóa:
- Apache Spark → Databricks (managed cloud services + performance/cost optimization)
- Ray → Anyscale
- SGLang → ReddixArc (Ying Sheng – CEO, inference engine Miles)
Ying Sheng bổ sung: “Khi open source project lớn mạnh, cần company đứng sau lead direction, maintain stability, build enterprise infrastructure”.
2. NVIDIA Nemotron Coalition – Foundation cho cả ngành
Jonathan Cohen (VP Applied Research, co-lead Nemotron):Tại sao NVIDIA open source foundation models?”Nếu mỗi company tự train from scratch = incredibly inefficient. NVIDIA muốn entire ecosystem move fast”.
Portfolio mã nguồn mở:
- Nemotron Super (state-of-the-art LLM)
- Cosmos (world models)
- GR00T (robotics foundation models)
Nemotron Coalition: Hàng trăm companies/startups/research institutes cùng chia sẻ:
- Datasets
- Training recipes & ablation studies
- Technical know-how
“Không phải mọi smart person đều làm tại NVIDIA. Cần involve cả thế giới để build great models”.
3. Multimodal & Embodied AI: Simulation > Real data
Ranjay Krishna (Allen Institute, UW Professor) chỉ trích:”Multimodal models barely understand 3D space. Can’t count bottles properly. Benchmarks static + overfit”.
Breakthrough từ Allen Institute:
- Momo: Vision Language Model đầu tiên beat GPT (dù nhỏ hơn nhiều)
- MomoBot: Train 100% simulation data → outperform real-world trained models
Giải pháp: Build simulation environments (hospitals, homes, conference rooms) → generate diverse synthetic data at scale.”Open source everything: training suite, data, code, infra, eval”.
4. Hugging Face: 5M models + Democratized Agentic AI
Jeff Boudier (Lead Commercial Product):Scale: “5M models/datasets/apps, hundreds of petabytes/month (Netflix-scale)”.
Trending không chỉ LLM: Speech-to-text, image generation, multimodal > LLMs.
Agentic AI revolution:
textCLI command: "HF register skill" → fine-tune + add tools cho agent GRPO/TRL → beginner dev cũng customize enterprise-grade AI Từ data scientist → mọi AI builder đều làm được
Hệ sinh thái hoàn chỉnh từ GTC 2026
Học thuật (Berkeley 5-year labs) ↓ innovate core tech (Spark/Ray/vLLM/Momo) NVIDIA ↓ foundation infra (Nemotron Coalition) Hugging Face ↓ distribution + agentic tools (5M models/CLI) Doanh nghiệp ↓ managed services (Databricks/ReddixArc)
Kết luận: Open source = asset tạo network effect + fast iteration → business layer monetize knowledge/services/tools. Từ lab Berkeley → ecosystem doanh thu tỷ đô. Agentic AI multi-agent orchestration là next frontier.
