Công ty khởi nghiệp trí tuệ nhân tạo Trung Quốc – DeepSeek – vừa âm thầm phát hành bản nâng cấp mới của mô hình suy luận R1, mang tên R1-0528, trên nền tảng Hugging Face vào ngày 29/5/2025. Mặc dù không có thông báo chính thức hay tài liệu mô tả chi tiết đi kèm, bản cập nhật này nhanh chóng gây chú ý trong cộng đồng AI toàn cầu nhờ hiệu suất vượt trội.
R1-0528 đã vươn lên vị trí top 3 trên bảng xếp hạng LiveCodeBench – tiêu chuẩn đánh giá các mô hình AI trong khả năng viết mã và suy luận logic, do các nhà nghiên cứu từ UC Berkeley, MIT và Cornell phát triển.
Cụ thể, R1-0528 chỉ xếp sau các mô hình o4 mini và o3 của OpenAI, nhưng vượt mặt cả Grok-3 mini của xAI (Elon Musk) và Qwen 3 của Alibaba. Đây là minh chứng rõ ràng cho thấy DeepSeek đang tạo ra sức ép ngày càng lớn lên các công ty AI dẫn đầu của Mỹ.
Trước đó vào tháng 1/2025, mô hình R1 phiên bản đầu tiên đã tạo cơn sốt khi đạt hiệu suất tiệm cận GPT-4 nhưng chỉ tốn khoảng 6 triệu USD chi phí huấn luyện – thấp hơn rất nhiều so với các mô hình cùng phân khúc. Sự thành công của R1 khiến nhiều người đánh giá lại niềm tin lâu nay rằng chỉ các công ty lớn với ngân sách hàng tỷ USD mới có thể cạnh tranh trên thị trường AI tiên tiến.
Bản cập nhật R1-0528 tuy được mô tả nội bộ là “nâng cấp thử nghiệm nhỏ” nhưng lại đạt được bước tiến đáng kể về hiệu suất, đặc biệt trong lĩnh vực lập trình – một trong những thước đo quan trọng cho AI hiện đại.
Việc DeepSeek không ngừng cải tiến công nghệ, đặc biệt trong bối cảnh Trung Quốc đang tăng tốc phát triển các mô hình ngôn ngữ lớn (LLM), đã khiến các ông lớn như OpenAI, Google và Anthropic phải điều chỉnh chiến lược – từ giảm giá API cho đến tung ra phiên bản mini hiệu quả hơn.
Theo các chuyên gia, nếu giữ vững tốc độ hiện tại, DeepSeek có thể trở thành đối thủ toàn cầu đáng gờm nhất của các công ty AI Mỹ, đặc biệt trong mảng mã nguồn mở và các mô hình tối ưu chi phí.
Hiện cộng đồng công nghệ đang kỳ vọng vào sự ra mắt của mô hình tiếp theo – DeepSeek R2 – được cho là đang trong giai đoạn thử nghiệm cuối cùng. Dù chưa có lịch trình chính thức, giới phân tích dự đoán R2 sẽ được giới thiệu vào cuối quý III năm nay và có thể là bước đột phá tiếp theo của Trung Quốc trong lĩnh vực trí tuệ nhân tạo.
Theo Reuters và CNBC.