DeepSeek-V3 gây xôn xao trong ngành AI: Chạy 20 token/giây trên Mac Studio, thách thức OpenAI

By Nguyễn Thị Thảo Nhi 30 Tháng ba, 2025

Một công ty AI Trung Quốc, DeepSeek, đã âm thầm ra mắt một mô hình ngôn ngữ lớn mới, gây xôn xao trong ngành công nghiệp trí tuệ nhân tạo – không chỉ vì khả năng của nó mà còn vì cách thức triển khai. Mô hình 641GB, mang tên DeepSeek-V3-0324, đã xuất hiện trên kho dữ liệu AI Hugging Face hôm nay mà không có thông báo chính thức, tiếp tục chiến lược phát hành lặng lẽ nhưng có ảnh hưởng của công ty này.

Điều đặc biệt khiến lần ra mắt này thu hút sự chú ý là giấy phép MIT của mô hình – cho phép sử dụng miễn phí cho mục đích thương mại – và những báo cáo ban đầu cho rằng mô hình này có thể chạy trực tiếp trên phần cứng dành cho người tiêu dùng, đặc biệt là trên Mac Studio của Apple với chip M3 Ultra.

“Mô hình DeepSeek-V3-0324 mới ở dạng 4-bit chạy trên 512GB M3 Ultra với mlx-lm đạt hơn 20 token/giây!”, nhà nghiên cứu AI Awni Hannun viết trên mạng xã hội. Mặc dù Mac Studio trị giá 9.499 USD có thể vượt xa định nghĩa về “phần cứng dành cho người tiêu dùng”, khả năng chạy một mô hình khổng lồ như vậy trên phần cứng cá nhân là một bước đột phá lớn so với yêu cầu về trung tâm dữ liệu thông thường đối với AI hiện đại.

Ảnh: Internet

Chiến lược ra mắt kín đáo của DeepSeek phá vỡ kỳ vọng thị trường AI

Mô hình với 685 tỷ tham số này ra mắt mà không có bài nghiên cứu, bài đăng blog hay chiến dịch tiếp thị – chỉ có một tệp README trống và chính các trọng số mô hình. Cách tiếp cận này hoàn toàn trái ngược với những buổi ra mắt sản phẩm được tổ chức công phu của các công ty AI phương Tây, nơi các chiến dịch quảng bá kéo dài hàng tháng trước khi sản phẩm thực sự được phát hành.

Các người thử nghiệm ban đầu báo cáo rằng mô hình mới đã có những cải tiến đáng kể so với phiên bản trước. Nhà nghiên cứu AI Xeophon tuyên bố trên X.com: “Đã thử nghiệm DeepSeek V3 mới trên hệ thống bench của tôi và nó có sự tiến bộ lớn trong mọi chỉ số. Đây hiện là mô hình không có khả năng suy luận tốt nhất, vượt qua Sonnet 3.5”.

Nếu tuyên bố này được xác nhận qua các thử nghiệm rộng rãi, nó sẽ đưa mô hình mới của DeepSeek lên trên Sonnet 3.5 của Anthropic, một trong những hệ thống AI thương mại được đánh giá cao nhất. Và khác với Sonnet, yêu cầu phải đăng ký, trọng số mô hình DeepSeek-V3-0324 có sẵn miễn phí cho bất kỳ ai tải về và sử dụng.

Cách thức kiến trúc đột phá của DeepSeek V3-0324 đạt được hiệu quả vượt trội

DeepSeek-V3-0324 sử dụng kiến trúc “mixture-of-experts” (MoE), cách mạng hóa cách thức hoạt động của các mô hình ngôn ngữ lớn. Các mô hình truyền thống sẽ kích hoạt toàn bộ số tham số của chúng cho mọi tác vụ, nhưng phương pháp của DeepSeek chỉ kích hoạt khoảng 37 tỷ tham số trong tổng số 685 tỷ tham số của mô hình trong các tác vụ cụ thể.

Việc kích hoạt chọn lọc này tạo ra một sự thay đổi lớn trong hiệu quả mô hình. Bằng cách chỉ kích hoạt các “chuyên gia” tham số có liên quan nhất cho mỗi tác vụ cụ thể, DeepSeek đạt được hiệu suất tương đương với các mô hình có tham số đầy đủ nhưng giảm đáng kể yêu cầu về tính toán.

Mô hình còn tích hợp hai công nghệ đột phá khác: Multi-Head Latent Attention (MLA) và Multi-Token Prediction (MTP). MLA tăng cường khả năng duy trì bối cảnh qua các đoạn văn dài, trong khi MTP tạo ra nhiều token mỗi bước thay vì cách tiếp cận tạo một token một lần như bình thường. Cùng với nhau, những cải tiến này giúp tăng tốc độ đầu ra lên gần 80%.

Simon Willison, người sáng tạo công cụ phát triển, đã chỉ ra trong một bài viết blog rằng phiên bản 4-bit giảm dung lượng lưu trữ xuống còn 352GB, khiến việc chạy mô hình trên phần cứng tiêu dùng cao cấp như Mac Studio với chip M3 Ultra trở nên khả thi.

Điều này đại diện cho một sự thay đổi có thể mang tính bước ngoặt trong việc triển khai AI. Trong khi cơ sở hạ tầng AI truyền thống thường phụ thuộc vào nhiều GPU Nvidia tiêu tốn vài kilowatt điện năng, Mac Studio chỉ tiêu thụ dưới 200 watt khi thực hiện suy luận. Khoảng cách về hiệu suất này cho thấy ngành công nghiệp AI có thể cần phải xem xét lại các giả định về yêu cầu cơ sở hạ tầng đối với hiệu suất của mô hình hàng đầu.

Cách mạng AI mã nguồn mở của Trung Quốc thách thức mô hình “vườn kín” của Silicon Valley

Chiến lược phát hành của DeepSeek thể hiện một sự khác biệt cơ bản trong triết lý kinh doanh AI giữa các công ty Trung Quốc và phương Tây. Trong khi các ông lớn như OpenAI và Anthropic ở Mỹ giữ các mô hình của họ đằng sau các tường phí, các công ty AI Trung Quốc ngày càng áp dụng giấy phép mã nguồn mở cho phép sử dụng miễn phí.

Cách tiếp cận này đang thay đổi nhanh chóng hệ sinh thái AI của Trung Quốc. Việc cung cấp các mô hình tiên tiến mở ra cơ hội cho các công ty khởi nghiệp, nhà nghiên cứu và lập trình viên xây dựng dựa trên công nghệ AI tinh vi mà không cần phải chi tiêu lớn. Điều này đã thúc đẩy mạnh mẽ năng lực AI của Trung Quốc, khiến các quan sát viên phương Tây ngạc nhiên.

Logic kinh doanh phía sau chiến lược này phản ánh thực tế thị trường ở Trung Quốc. Với nhiều đối thủ cạnh tranh được đầu tư mạnh mẽ, việc duy trì phương pháp độc quyền ngày càng trở nên khó khăn khi đối thủ có thể cung cấp các khả năng tương tự miễn phí. Việc mã nguồn mở tạo ra các con đường giá trị thay thế thông qua việc lãnh đạo hệ sinh thái, dịch vụ API và các giải pháp doanh nghiệp được xây dựng trên các mô hình nền miễn phí.

Ngay cả các công ty công nghệ khổng lồ Trung Quốc cũng nhận thức được sự thay đổi này. Baidu đã thông báo kế hoạch làm mã nguồn mở cho dòng mô hình Ernie 4.5 vào tháng 6, trong khi Alibaba và Tencent cũng đã phát hành các mô hình AI mã nguồn mở với các khả năng chuyên biệt. Phong trào này đối lập rõ rệt với chiến lược tập trung vào API của các ông lớn phương Tây.

Ảnh: Internet

DeepSeek V3-0324: Nền tảng cho cuộc cách mạng suy luận AI

Thời điểm và đặc điểm của DeepSeek-V3-0324 mạnh mẽ chỉ ra rằng nó sẽ là nền tảng cho DeepSeek-R2, một mô hình chuyên sâu vào suy luận dự kiến sẽ ra mắt trong vài tháng tới. Điều này tuân theo mô hình đã được DeepSeek thiết lập, trong đó các mô hình cơ sở được phát hành trước các mô hình suy luận chuyên biệt vài tuần.

Hướng đi của DeepSeek trong AI sẽ mở ra những cơ hội toàn cầu

Chiến lược phát triển và phân phối AI của DeepSeek không chỉ là một thành tựu kỹ thuật – nó thể hiện một tầm nhìn hoàn toàn khác biệt về cách công nghệ tiên tiến nên lan tỏa trong xã hội. Bằng cách làm AI tiên tiến sẵn có miễn phí với giấy phép rộng rãi, DeepSeek tạo điều kiện cho sự đổi mới theo cấp số nhân mà các mô hình đóng không thể có được.

Triết lý này đang nhanh chóng thu hẹp khoảng cách AI giữa Trung Quốc và Mỹ. Chỉ vài tháng trước, hầu hết các nhà phân tích ước tính rằng Trung Quốc chậm hơn Mỹ 1-2 năm trong lĩnh vực AI. Nhưng hôm nay, khoảng cách này đã thu hẹp lại đáng kể, có thể chỉ còn 3-6 tháng, với một số lĩnh vực đạt mức độ tương đương hoặc thậm chí vượt trội của Trung Quốc.

Các sự kiện này không chỉ ảnh hưởng đến sự cạnh tranh thị trường mà còn đặt ra những câu hỏi cơ bản về quyền tiếp cận công nghệ. Các lãnh đạo AI phương Tây ngày càng phải đối mặt với chỉ trích vì tập trung các khả năng tiên tiến vào tay các tập đoàn và cá nhân có nguồn lực mạnh. Cách tiếp cận của DeepSeek phân phối những khả năng này rộng rãi hơn, có thể thúc đẩy sự phát triển AI toàn cầu.

Tags: