Trung Quốc vừa ra mắt mô hình AI lớn nhất của mình được huấn luyện hoàn toàn mà không cần dùng chip NVIDIA. Meituan đã công bố LongCat-2.0 – một mô hình ngôn ngữ lớn mã nguồn mở với 1.6 nghìn tỷ tham số. Dự án này do “ông lớn” giao đồ ăn tại Bắc Kinh tự triển khai từ đầu đến cuối trên phần cứng trong nước.
Thành tựu này đang thay đổi cách ngành công nghiệp AI toàn cầu nhìn nhận về nỗ lực tự chủ công nghệ của Trung Quốc.
LongCat-2.0 của Meituan mang đến điều gì cho cuộc đua AI?
Mô hình ngôn ngữ lớn là hệ thống AI được huấn luyện với bộ dữ liệu khổng lồ, có khả năng hiểu, tạo ra và suy luận bằng ngôn ngữ tự nhiên trên nhiều lĩnh vực. LongCat-2.0 thuộc nhóm những mô hình lớn nhất từng được phát triển với 1.6 nghìn tỷ tham số và khả năng xử lý 1 triệu token mỗi lần tương tác.
Việc ra mắt này diễn ra khi Trung Quốc tiếp tục đẩy mạnh tự chủ hoàn toàn về hạ tầng tính toán cốt lõi. Ngoài ra, Meituan cho biết LongCat-2.0 là mô hình đầu tiên trong ngành có quy mô hàng nghìn tỷ tham số, hoàn thiện toàn bộ quá trình huấn luyện lẫn vận hành trên phần cứng nội địa. Thành công này thực sự là một dấu mốc kỹ thuật quan trọng.
Theo dõi chúng tôi trên X để cập nhật tin tức mới nhất ngay khi vừa xảy ra.
Điểm khác biệt này rất quan trọng. DeepSeek V4-pro chỉ dùng chip nội địa cho quá trình vận hành (inference) – tức là giai đoạn trả lời câu hỏi người dùng, vốn nhẹ hơn rất nhiều.
Ngược lại, LongCat-2.0 đã sử dụng phần cứng trong nước cho cả vận hành lẫn giai đoạn huấn luyện trước cực kỳ phức tạp và tiêu tốn tài nguyên.
Meituan cho biết họ đã xây dựng cụm máy dựa trên các siêu máy chủ ASIC quy mô lớn – đây là những con chip tùy biến cho từng nhiệm vụ cụ thể. Ngoài ra, doanh nghiệp sử dụng thư viện hợp tác HCCL của Huawei để điều phối giữa các chip với nhau trên quy mô lớn, tương tự cách NVIDIA dùng NCCL để điều phối cụm GPU của mình.
“…Nó khiến tôi nhớ đến nhận định của Jensen Huang trên podcast Dwarkesh: Các lệnh hạn chế xuất khẩu GPU NVIDIA sẽ không thể ngăn được Trung Quốc. Ngược lại, chúng sẽ tạo động lực để AI phát triển mạnh mẽ trên nền tảng chip Trung Quốc”, nhà phân tích Yuchen Jin chia sẻ trên X.
Tại sao sự kiện ra mắt LongCat-2.0 lại quan trọng với toàn cầu?
LongCat-2.0 đã thể hiện khả năng vượt trội trên nhiều tiêu chuẩn đánh giá. Mô hình vượt qua Gemini 3.1 Pro trước đây của Google trên Terminal-Bench 2.1 và SWE-Bench Pro.
Dù vậy, LongCat-2.0 vẫn chưa theo kịp các hệ thống dẫn đầu toàn cầu như GPT-5.5 của OpenAI hay Opus 4.8 của Anthropic ở những bài kiểm tra tác vụ phức tạp, đòi hỏi khả năng lập luận sâu và xử lý tự động.
Các chuyên gia công nghệ đã phản hồi rất nhanh. Nhà phân tích TP Huang đánh giá sự kiện này giúp xua tan những lo ngại về các siêu máy chủ Atlas-950 SuperPoDs của Huawei. Một nhà nghiên cứu tại Đại học Lehigh – Hanchi Sun còn gọi đây là mô hình đầu tiên đạt gần đến trình độ “frontier” khi được huấn luyện nhờ 50,000 bộ tăng tốc nội địa Trung Quốc.
“…Nếu Trung Quốc có thể mở rộng đào tạo các mô hình tầm cỡ frontier trên nền tảng chip tự phát triển như thế này, cuộc đua về tính toán AI chắc chắn sẽ cởi mở hơn bao giờ hết”, đối tác đầu tư Alvin Foo nhận xét.
Dù vậy, vẫn còn nhiều thử thách lớn với lĩnh vực AI của Trung Quốc. Meituan thừa nhận hệ sinh thái phần mềm của mình vẫn còn tụt hậu khá xa so với cộng đồng GPU lâu năm của NVIDIA. Ngoài ra, giới hạn về bộ nhớ vẫn là rào cản lớn nhất trong quá trình huấn luyện, bởi các bộ tăng tốc nội địa thường ít dung lượng hơn so với chip H800 hiện đã bị cấm xuất khẩu của NVIDIA.
Tín hiệu tổng thể mang ý nghĩa cấu trúc: Thành công của Meituan đã chứng minh rằng việc huấn luyện mô hình quy mô “frontier” trên phần cứng Trung Quốc là hoàn toàn khả thi về mặt kỹ thuật.
Kết quả là khoảng cách giữa các mô hình mã nguồn mở của Trung Quốc với những hệ thống “đóng” hàng đầu phương Tây có thể thu hẹp nhanh hơn nhiều so với dự báo trước đây.









