Trong cuộc đua phát triển trí tuệ nhân tạo, DeepSeek – một startup AI từ Trung Quốc, đã giới thiệu mô hình lý luận mới mang tên R1-Lite, được cho là vượt trội hơn so với mô hình o1 của OpenAI. Mô hình này hứa hẹn sẽ mang lại những cải tiến đáng kể trong việc giải thích quá trình suy luận của AI.
Mô hình R1-Lite của DeepSeek được thiết kế để cung cấp các giải thích chi tiết về quá trình suy luận, trái ngược với phong cách ngắn gọn của mô hình o1 của OpenAI. Điều này giúp người dùng hiểu rõ hơn về cách AI đưa ra các quyết định và kết quả cuối cùng. Tuy nhiên, sự chi tiết này đôi khi có thể trở nên phức tạp và khó hiểu, làm giảm tính hiệu quả của mô hình.

Credit: The Decorder
DeepSeek tuyên bố rằng R1-Lite có thể vượt qua o1 trong các bài kiểm tra tiêu chuẩn như AIME và MATH. Mô hình này đạt độ chính xác 91,6% trong bài kiểm tra MATH, một con số ấn tượng trong lĩnh vực AI. Tuy nhiên, R1-Lite vẫn gặp khó khăn với các nhiệm vụ logic đơn giản như trò chơi tic-tac-toe.
DeepSeek đang lên kế hoạch phát hành các phiên bản mã nguồn mở của mô hình R1 và mở rộng quyền truy cập thông qua API. Điều này thể hiện cam kết của công ty đối với cộng đồng AI mã nguồn mở và hứa hẹn sẽ thúc đẩy sự phát triển của các ứng dụng AI trong tương lai.
Mặc dù còn một số hạn chế, mô hình R1-Lite của DeepSeek đã chứng minh được tiềm năng lớn trong việc cải thiện khả năng lý luận của AI. Sự cạnh tranh giữa DeepSeek và OpenAI không chỉ thúc đẩy sự phát triển của công nghệ AI mà còn mang lại nhiều lợi ích cho người dùng cuối.