DeepSeek, một phòng thí nghiệm AI của Trung Quốc, và tác động của nó đối với ngành công nghiệp AI. Đầu năm 2025, DeepSeek đã giới thiệu một mô hình mới gây chấn động ngành công nghiệp AI, dẫn đến sự sụt giảm 17% giá cổ phiếu của Nvidia và các cổ phiếu liên quan đến nhu cầu trung tâm dữ liệu AI khác.
Sự thay đổi này được thúc đẩy bởi sự khan hiếm dữ liệu huấn luyện. Các phòng thí nghiệm AI lớn đã huấn luyện mô hình của họ trên hầu hết các dữ liệu công khai có sẵn trên internet, dẫn đến việc cải thiện thêm trong giai đoạn tiền huấn luyện trở nên chậm lại. Do đó, các nhà cung cấp mô hình đang tìm kiếm “tính toán khi suy luận” (TTC) như một phương pháp thay thế để cải thiện hiệu suất tổng thể của mô hình. TTC cho phép các mô hình suy nghĩ trước khi trả lời câu hỏi tại thời điểm suy luận, có thể mang lại những cải tiến tương tự như những gì đã thúc đẩy giai đoạn tiền huấn luyện trước đây.
Ảnh: Internet
Báo cáo của VentureBeat chỉ ra hai sự thay đổi quan trọng: Thứ nhất, các phòng thí nghiệm hoạt động với ngân sách nhỏ hơn hiện có khả năng phát hành các mô hình tiên tiến. Thứ hai, TTC được coi là động lực tiềm năng tiếp theo của sự tiến bộ AI. Sự thay đổi này có thể có nhiều tác động đối với cảnh quan AI rộng lớn hơn, bao gồm phần cứng, nền tảng đám mây, mô hình nền tảng và phần mềm doanh nghiệp.
Về phần cứng, sự chuyển hướng sang TTC có thể ảnh hưởng đến loại tài nguyên phần cứng mà các công ty AI yêu cầu và cách chúng được quản lý. Thay vì đầu tư vào các cụm GPU ngày càng lớn dành cho khối lượng công việc huấn luyện, các công ty AI có thể tăng cường đầu tư vào khả năng suy luận để hỗ trợ nhu cầu TTC ngày càng tăng. Mặc dù các công ty AI vẫn cần một số lượng lớn GPU để xử lý khối lượng công việc suy luận, nhưng sự khác biệt giữa khối lượng công việc huấn luyện và suy luận có thể ảnh hưởng đến cách các chip này được cấu hình và sử dụng,
Sự phát triển của DeepSeek cho thấy rằng các phòng thí nghiệm AI nhỏ hơn, với ngân sách hạn chế, vẫn có thể tạo ra các mô hình tiên tiến và cạnh tranh với các đối thủ lớn hơn. Điều này có thể thúc đẩy sự cạnh tranh và đổi mới trong ngành công nghiệp AI, đồng thời mở ra nhiều cơ hội mới cho các công ty khởi nghiệp và các nhà nghiên cứu.