Google ra mắt Ironwood TPU – Bộ xử lý AI thế hệ mới cho kỷ nguyên suy luận

By Bùi Thanh Thảo

Tại hội nghị thường niên Google Cloud Next 2025, Google đã công bố thế hệ TPU (Tensor Processing Unit) mới mang tên Ironwood – đánh dấu bước tiến quan trọng trong nỗ lực tối ưu hóa các tác vụ suy luận AI (AI inference). Đây là một phần trong chiến lược lâu dài của Google nhằm xây dựng một siêu máy tính AI linh hoạt, mạnh mẽ và tiết kiệm năng lượng, đáp ứng nhu cầu ngày càng cao của các mô hình trí tuệ nhân tạo hiện đại như mô hình ngôn ngữ lớn (LLM), mô hình hỗn hợp chuyên gia (MoE) và các ứng dụng AI quy mô lớn khác.

Suy luận (inference) là quá trình mà mô hình AI được huấn luyện sử dụng để đưa ra dự đoán hoặc phản hồi đầu ra từ dữ liệu đầu vào. Đây là giai đoạn tiêu tốn rất nhiều tài nguyên khi các mô hình AI ngày càng trở nên lớn và phức tạp. Ironwood TPU được thiết kế đặc biệt để giải quyết những thách thức này.

Credit: Google Blog

Theo Google, Ironwood có khả năng xử lý inference nhanh hơn gấp 5 lần so với thế hệ TPU trước đó (TPU v5e). Hơn nữa, mỗi chip Ironwood được trang bị băng thông bộ nhớ cao hơn gấp 6 lần, cho phép xử lý các mô hình dung lượng cực lớn một cách mượt mà.

Hệ thống có thể mở rộng lên tới 9.216 chip, đạt hiệu năng 42,5 exaFLOPS – ngang bằng hoặc vượt qua nhiều siêu máy tính mạnh nhất thế giới hiện nay. Với sức mạnh này, Ironwood trở thành trụ cột trong việc vận hành các mô hình AI có quy mô hàng chục, thậm chí hàng trăm tỷ tham số, đặc biệt là những mô hình sử dụng kiến trúc phân mảnh như MoE, nơi một phần của mô hình được kích hoạt tùy thuộc vào truy vấn.

Trong bối cảnh các trung tâm dữ liệu AI ngày càng tiêu tốn nhiều điện năng, hiệu quả năng lượng trở thành yếu tố sống còn. Ironwood không chỉ mạnh mẽ mà còn hiệu quả năng lượng vượt trội.

So với TPU thế hệ đầu tiên mà Google công bố vào năm 2015, Ironwood cho thấy bước nhảy vọt ấn tượng: hiệu suất gấp 3.600 lần, đồng thời tiêu thụ điện năng ít hơn tới 29 lần trên mỗi đơn vị tính toán. Điều này đặc biệt quan trọng khi các tổ chức muốn triển khai AI một cách bền vững, vừa đảm bảo hiệu suất, vừa giảm thiểu dấu chân carbon.

Sự ra đời của Ironwood không chỉ đơn giản là bước tiến công nghệ – mà còn là lời khẳng định rằng AI đang bước vào giai đoạn triển khai quy mô lớn. Các mô hình AI giờ đây không chỉ được huấn luyện trên những cụm máy khổng lồ, mà còn cần được suy luận nhanh chóng, chính xác và tiết kiệm chi phí trong thực tế sử dụng hàng ngày.

Với Ironwood, Google mang đến một giải pháp toàn diện cho các doanh nghiệp muốn tận dụng AI mà không phải đầu tư vào hạ tầng vật lý đắt đỏ. Bên cạnh đó, Google cũng nhấn mạnh cam kết phát triển AI bền vững, đảm bảo rằng bước tiến công nghệ này không đánh đổi bằng môi trường sống hay chi phí năng lượng quá lớn.

Ironwood TPU là minh chứng rõ nét cho tầm nhìn của Google về một tương lai AI hiệu quả, mạnh mẽ và dễ tiếp cận. Trong bối cảnh cuộc đua AI toàn cầu ngày càng gay gắt, Ironwood không chỉ giúp Google giữ vững vị thế tiên phong, mà còn đặt ra tiêu chuẩn mới cho cách thế giới vận hành và triển khai trí tuệ nhân tạo.