Tại hội nghị thường niên re:Invent ở Las Vegas, Amazon AWS đã công bố thế hệ thứ ba của chip Trainium, được thiết kế để huấn luyện các mô hình ngôn ngữ lớn (LLMs) và các dạng trí tuệ nhân tạo khác. Chip Trainium3 mới sẽ có tốc độ nhanh gấp đôi và hiệu quả năng lượng cao hơn 40% so với phiên bản trước.

Credit: ZDnet
Trainium3 là chip đầu tiên của AWS sử dụng công nghệ sản xuất bán dẫn 3 nanomet, mang lại hiệu suất cao hơn và tiêu thụ ít năng lượng hơn. AWS cũng giới thiệu UltraServers, một dịch vụ mới kết nối 64 chip Trainium2 thành một máy chủ khổng lồ, giúp xử lý các mô hình AI với hàng nghìn tỷ tham số.
AWS cũng tiết lộ dự án Project Rainier, một “UltraCluster” sẽ nhóm hàng trăm nghìn chip Trainium để cung cấp sức mạnh tính toán khổng lồ cho các ứng dụng AI. Dự án này được phát triển hợp tác với startup Gen AI Anthropic, nhằm tăng tốc độ phát triển và triển khai các mô hình AI tiên tiến.

Credit: Linqto
Nhìn chung, với sự ra mắt của Trainium3 và dự án Project Rainier, Amazon AWS đang tiếp tục khẳng định vị thế dẫn đầu trong lĩnh vực điện toán đám mây và trí tuệ nhân tạo, mang lại những giải pháp hiệu quả và tiên tiến cho khách hàng trên toàn thế giới.
Trainium3 được kỳ vọng sẽ giúp giảm thời gian huấn luyện và chi phí cho các mô hình AI, đồng thời hỗ trợ các khung làm việc phổ biến như PyTorch và TensorFlow. AWS Neuron SDK cung cấp các công cụ và thư viện tối ưu hóa cho Trainium, giúp các nhà phát triển dễ dàng tích hợp và sử dụng.