Mô hình AI Maverick của Meta xếp hạng thấp hơn so với đối thủ trên bảng xếp hạng trò chuyện phổ biến

By Bùi Thanh Thảo

Meta đã gặp phải một số chỉ trích khi mô hình AI mới nhất của họ, Llama 4 Maverick, xếp hạng thấp hơn so với các đối thủ trên bảng xếp hạng trò chuyện phổ biến LM Arena. Điều này đã gây ra nhiều tranh cãi và đặt ra câu hỏi về hiệu quả thực sự của mô hình này.

Llama 4 Maverick, một trong những mô hình AI hàng đầu mới nhất của Meta, đã không đạt được kết quả như mong đợi trên bảng xếp hạng LM Arena. Mô hình này xếp hạng dưới các đối thủ như GPT-4o của OpenAI, Claude 3.5 Sonnet của Anthropic và Gemini 1.5 Pro của Google. Điều đáng chú ý là nhiều mô hình này đã ra mắt từ nhiều tháng trước, trong khi Llama 4 Maverick là một mô hình mới.

Credit: Times Now

Một phần của vấn đề xuất phát từ việc Meta đã sử dụng một phiên bản thử nghiệm chưa phát hành của Llama 4 Maverick để đạt điểm cao trên LM Arena. Sự cố này đã khiến những người duy trì LM Arena phải xin lỗi và thay đổi chính sách của họ, đồng thời đánh giá lại phiên bản gốc, không tùy chỉnh của Maverick. Kết quả là phiên bản gốc này không cạnh tranh được với các mô hình khác.

Trong một tuyên bố, người phát ngôn của Meta cho biết công ty thường xuyên thử nghiệm các biến thể tùy chỉnh khác nhau của mô hình AI. Phiên bản thử nghiệm của Llama 4 Maverick được tối ưu hóa cho khả năng trò chuyện và đã hoạt động tốt trên LM Arena. Tuy nhiên, phiên bản gốc không đạt được kết quả tương tự. Meta đã phát hành phiên bản mã nguồn mở của Llama 4 và hy vọng các nhà phát triển sẽ tùy chỉnh mô hình này cho các trường hợp sử dụng riêng của họ.

Việc Meta sử dụng phiên bản thử nghiệm để đạt điểm cao trên bảng xếp hạng đã gây ra nhiều tranh cãi trong cộng đồng AI. Các nhà nghiên cứu cho rằng việc tùy chỉnh mô hình để đạt điểm cao trên một bảng xếp hạng cụ thể có thể gây hiểu lầm và làm cho việc dự đoán hiệu suất của mô hình trong các ngữ cảnh khác trở nên khó khăn. Điều này cũng đặt ra câu hỏi về tính minh bạch và độ tin cậy của các bảng xếp hạng AI.

Dù gặp phải những khó khăn ban đầu, Meta vẫn lạc quan về tương lai của Llama 4 Maverick. Công ty hy vọng rằng với sự tùy chỉnh và phản hồi từ cộng đồng phát triển, mô hình này sẽ được cải thiện và trở nên cạnh tranh hơn. Meta cũng cam kết tiếp tục nghiên cứu và phát triển các công nghệ AI để đáp ứng nhu cầu ngày càng cao của người dùng.