Google công bố Gemma 3 đạt 98% độ chính xác của DeepSeek chỉ với một GPU

By Bùi Thị Thanh Thảo 16 Tháng ba, 2025

Google đã công bố mô hình AI mới nhất của mình, Gemma 3, đạt được 98% độ chính xác của mô hình DeepSeek R1 chỉ với một GPU. Đây là một bước tiến lớn trong việc tối ưu hóa hiệu suất và hiệu quả của các mô hình AI.

Gemma 3 là mô hình AI mã nguồn mở mới nhất của Google, được thiết kế để hoạt động hiệu quả trên một GPU hoặc TPU duy nhất. Theo Google, Gemma 3 đạt được điểm Elo 1338, so với 1363 của DeepSeek R1, chỉ sử dụng một GPU Nvidia H100, trong khi DeepSeek R1 cần tới 32 GPU H100 để đạt được điểm số tương tự. Điểm Elo là một hệ thống đo lường thường được sử dụng để xếp hạng các kỳ thủ cờ vua và vận động viên, và trong trường hợp này, nó được sử dụng để đánh giá hiệu suất của các mô hình AI.

Credit: ZDNET

Một trong những yếu tố quan trọng giúp Gemma 3 đạt được hiệu suất cao như vậy là công nghệ distillation. Đây là một kỹ thuật AI phổ biến, trong đó các trọng số của mô hình lớn được trích xuất và chèn vào một mô hình nhỏ hơn, giúp mô hình nhỏ hơn có được sức mạnh tương tự như mô hình lớn. Gemma 3 có số lượng tham số nhỏ hơn nhiều so với R1, với các phiên bản có từ 1 tỷ đến 27 tỷ tham số, trong khi R1 có tới 671 tỷ tham số.

Google cho biết Gemma 3 là mô hình AI mạnh mẽ nhất mà người dùng có thể chạy trên một GPU hoặc TPU duy nhất. Điều này mở ra nhiều cơ hội cho các nhà phát triển và doanh nghiệp trong việc tạo ra các trải nghiệm người dùng hấp dẫn mà không cần đầu tư quá nhiều vào phần cứng. Gemma 3 cũng vượt trội hơn so với các mô hình khác như Llama-405B của Meta và DeepSeek-V3 trong các đánh giá sơ bộ về sở thích của con người trên bảng xếp hạng LMArena.

Với việc ra mắt Gemma 3, Google đã chứng minh rằng hiệu suất và hiệu quả của các mô hình AI có thể được tối ưu hóa đáng kể. Sự kết hợp giữa công nghệ distillation và khả năng hoạt động trên một GPU duy nhất giúp Gemma 3 trở thành một công cụ mạnh mẽ cho các nhà phát triển và doanh nghiệp. Đây là một bước tiến quan trọng trong việc làm cho AI trở nên dễ tiếp cận và hiệu quả hơn.

Tags: