Foxconn, nhà sản xuất điện tử hợp đồng lớn nhất thế giới, đã công bố mô hình ngôn ngữ lớn đầu tiên của mình mang tên “FoxBrain”. Mô hình này được thiết kế để cải thiện quy trình sản xuất và quản lý chuỗi cung ứng, đồng thời mở ra nhiều ứng dụng tiềm năng trong các lĩnh vực khác.
FoxBrain được huấn luyện bằng cách sử dụng 120 GPU H100 của Nvidia và hoàn thành trong khoảng bốn tuần. Đây là mô hình ngôn ngữ lớn đầu tiên của Đài Loan có khả năng suy luận và được tối ưu hóa cho các phong cách ngôn ngữ truyền thống của Trung Quốc và Đài Loan. Mặc dù có một chút chênh lệch về hiệu suất so với mô hình chưng cất của DeepSeek từ Trung Quốc, nhưng hiệu suất tổng thể của FoxBrain rất gần với tiêu chuẩn thế giới.
Credit: Reuters
Foxconn cho biết mô hình này ban đầu được thiết kế cho các ứng dụng nội bộ, bao gồm phân tích dữ liệu, hỗ trợ ra quyết định, hợp tác tài liệu, toán học, suy luận và giải quyết vấn đề, và tạo mã. Công ty cũng có kế hoạch hợp tác với các đối tác công nghệ để mở rộng các ứng dụng của mô hình, chia sẻ thông tin mã nguồn mở và thúc đẩy AI trong sản xuất, quản lý chuỗi cung ứng và ra quyết định thông minh.
Nvidia đã cung cấp hỗ trợ thông qua siêu máy tính “Taipei-1” đặt tại Đài Loan và cung cấp tư vấn kỹ thuật trong quá trình huấn luyện mô hình. Taipei-1 là siêu máy tính lớn nhất ở Đài Loan, được sở hữu và vận hành bởi Nvidia tại thành phố Cao Hùng.
Foxconn sẽ công bố thêm chi tiết về mô hình này trong hội nghị nhà phát triển GTC của Nvidia vào giữa tháng 3. Công ty hy vọng rằng FoxBrain sẽ không chỉ cải thiện hiệu quả sản xuất mà còn mở ra nhiều cơ hội mới trong các lĩnh vực khác như y tế, giáo dục và nghiên cứu khoa học.