DeepSeek Trung Quốc: Mô hình AI R1 chỉ tốn 294.000 USD để huấn luyện

By Bùi Thị Thanh Thảo

Khi cuộc đua AI toàn cầu đang nóng bỏng với những con số khổng lồ về chi phí, một “quả bom” từ Trung Quốc vừa nổ tung: DeepSeek – công ty AI tại Hàng Châu công bố mô hình R1 của họ chỉ tốn vỏn vẹn 294.000 USD để huấn luyện, thấp hơn hàng trăm lần so với các ông lớn Mỹ. Thông tin này được tiết lộ trong bài báo được bình duyệt trên tạp chí Nature ngày 18 tháng 9 năm 2025, đánh dấu lần đầu tiên DeepSeek công khai chi phí, và nhanh chóng khơi dậy tranh cãi sôi nổi về vị thế của Bắc Kinh trong cuộc chiến trí tuệ nhân tạo. Không chỉ là con số, đây là lời thách thức trực tiếp đến sự thống trị của Mỹ, nơi các mô hình như GPT của OpenAI đòi hỏi hàng trăm triệu USD, nhắc nhở rằng đổi mới có thể đến từ sự khéo léo hơn là sức mạnh tài chính thô.

DeepSeek, một startup ít được biết đến ngoài Trung Quốc, đã gây chấn động thị trường từ tháng 1 năm 2025 khi ra mắt các mô hình AI giá rẻ, khiến nhà đầu tư toàn cầu bán tháo cổ phiếu công nghệ, lo ngại sự đe dọa đến Nvidia và các lãnh đạo AI khác. Kể từ đó, công ty và nhà sáng lập Liang Wenfeng hầu như “im thin thít”, chỉ cập nhật vài sản phẩm mới. Bài báo trên Nature, với Liang là đồng tác giả, tiết lộ chi tiết: Mô hình R1 tập trung vào lý luận được huấn luyện trên cụm 512 chip Nvidia H800 trong 80 giờ, sau giai đoạn chuẩn bị bằng chip A100. Đây là lần đầu DeepSeek thừa nhận sở hữu A100 – loại chip bị Mỹ cấm xuất khẩu sang Trung Quốc từ tháng 10 năm 2022 – nhưng chỉ dùng cho thí nghiệm mô hình nhỏ, không phải huấn luyện chính.

Chi phí huấn luyện mô hình ngôn ngữ lớn (LLM) – động cơ của chatbot AI – thường bao gồm việc chạy cụm chip mạnh mẽ hàng tuần hoặc tháng để xử lý dữ liệu khổng lồ. So sánh với Mỹ, Sam Altman, CEO OpenAI, từng nói năm 2023 rằng huấn luyện mô hình nền tảng tốn “nhiều hơn hẳn 100 triệu USD”, dù không công bố con số cụ thể. Với R1, DeepSeek chứng minh rằng hiệu suất cao không nhất thiết đòi hỏi ngân sách khổng lồ, nhờ tối ưu hóa thuật toán và sử dụng chip H800 – phiên bản Nvidia thiết kế riêng cho thị trường Trung Quốc để tuân thủ lệnh cấm xuất khẩu H100 và A100 mạnh hơn.

Credit: The Business Times

Tuy nhiên, con số 294.000 USD không chỉ gây ngạc nhiên mà còn khơi dậy tranh cãi. Các quan chức Mỹ từng cáo buộc DeepSeek tiếp cận “lượng lớn” chip H100 bất hợp pháp sau lệnh cấm, dù Nvidia khẳng định họ chỉ dùng H800 hợp pháp. DeepSeek lần đầu thừa nhận sở hữu A100 trong tài liệu bổ sung của bài báo Nature, nhưng nhấn mạnh chỉ dùng cho chuẩn bị. Hơn nữa, công ty phản hồi gián tiếp cáo buộc “chưng cất” (distillation) mô hình từ OpenAI – kỹ thuật học từ mô hình khác để tiết kiệm chi phí. DeepSeek bảo vệ rằng distillation cải thiện hiệu suất và mở rộng tiếp cận AI, đồng thời dùng mô hình mã nguồn mở Llama của Meta cho một số phiên bản. Trong bài báo, họ giải thích dữ liệu huấn luyện V3 bao gồm trang web chứa “số lượng đáng kể câu trả lời do mô hình OpenAI tạo”, nhưng đây là “ngẫu nhiên, không chủ ý”.

Sự tiết lộ này đến giữa lúc DeepSeek thu hút nhân tài hàng đầu Trung Quốc nhờ cụm siêu máy tính A100 hiếm hoi. Nó không chỉ thách thức quan điểm Mỹ rằng Bắc Kinh bị kìm hãm bởi lệnh cấm chip, mà còn nhấn mạnh lợi thế của Trung Quốc trong tối ưu hóa chi phí – yếu tố then chốt khi AI ngày càng dân chủ hóa. Nhà đầu tư từng lo DeepSeek đe dọa Nvidia, nhưng giờ đây, con số cụ thể càng củng cố vị thế của họ như “ngựa ô” trong cuộc đua AI.

Sâu sắc hơn, câu chuyện của DeepSeek không chỉ về chi phí; nó phản ánh cuộc chiến địa chính trị ngầm giữa Mỹ và Trung Quốc, nơi công nghệ trở thành vũ khí. Với ngân sách chỉ bằng một phần nhỏ của OpenAI, DeepSeek chứng minh rằng sáng tạo có thể vượt qua rào cản, nhưng cũng đặt câu hỏi: Liệu “chưng cất” có phải cạnh tranh lành mạnh hay sao chép? Trong kỷ nguyên AI nơi mô hình như R1 có thể thay đổi cách chúng ta suy nghĩ và làm việc, DeepSeek nhắc nhở rằng tương lai không thuộc về những người chi nhiều nhất, mà là những người khôn ngoan nhất. Khi Bắc Kinh âm thầm vươn lên, cuộc đua AI không còn là chuyện công nghệ, mà là cuộc chiến định hình trí tuệ nhân loại.