Meta bắt đầu thử nghiệm chip đào tạo AI đầu tiên tự sản xuất

Ảnh: Dado Ruvic

Meta, công ty sở hữu Facebook, đang thử nghiệm chip tự sản xuất đầu tiên để đào tạo các hệ thống trí tuệ nhân tạo (AI), một cột mốc quan trọng trong quá trình thiết kế silicon tùy chỉnh của riêng mình, giảm bớt sự phụ thuộc vào các nhà cung cấp bên ngoài như Nvidia, theo hai nguồn tin cho biết. Công ty mạng xã hội lớn nhất thế giới đã bắt đầu triển khai thử nghiệm chip và dự định tăng cường sản xuất để sử dụng rộng rãi nếu thử nghiệm thành công.

Việc phát triển chip tự sản xuất là một phần trong kế hoạch dài hạn của Meta nhằm giảm chi phí hạ tầng khổng lồ khi công ty đặt cược lớn vào các công cụ AI để thúc đẩy tăng trưởng. Meta, công ty cũng sở hữu Instagram và WhatsApp, dự báo tổng chi phí cho năm 2025 sẽ vào khoảng 114 đến 119 tỷ USD, trong đó có tới 65 tỷ USD là chi tiêu vốn chủ yếu dành cho cơ sở hạ tầng AI.

Một trong các nguồn tin cho biết, chip đào tạo mới của Meta là một bộ tăng tốc chuyên dụng, có nghĩa là nó được thiết kế để xử lý các tác vụ AI đặc thù, điều này giúp chip tiết kiệm năng lượng hơn so với các đơn vị xử lý đồ họa tích hợp (GPU) thông thường được dùng cho các công việc AI.

Meta đang hợp tác với nhà sản xuất chip Đài Loan TSMC để sản xuất chip này.

Việc triển khai thử nghiệm bắt đầu sau khi Meta hoàn thành “tape-out” đầu tiên của chip, một dấu mốc quan trọng trong quá trình phát triển silicon, liên quan đến việc gửi thiết kế ban đầu qua nhà máy sản xuất chip, nguồn tin còn lại cho biết.

Quá trình tape-out thường tốn hàng triệu đô la và mất khoảng ba đến sáu tháng để hoàn thành, nhưng không có gì đảm bảo là thử nghiệm sẽ thành công. Nếu thất bại, Meta sẽ phải chẩn đoán vấn đề và thực hiện lại bước tape-out.

Meta và TSMC từ chối bình luận.

Chip này là mới nhất trong dòng Meta Training and Inference Accelerator (MTIA) của công ty. Chương trình này đã gặp khó khăn trong những năm qua và có lúc đã bỏ qua một chip ở giai đoạn phát triển tương tự.

Tuy nhiên, vào năm ngoái, Meta đã bắt đầu sử dụng chip MTIA để thực hiện suy luận (inference), tức là quá trình chạy một hệ thống AI khi người dùng tương tác với nó, cho các hệ thống đề xuất nội dung hiển thị trên dòng thời gian của Facebook và Instagram.

Ảnh: Skorzewiak / Shutterstock

Các giám đốc của Meta cho biết họ muốn bắt đầu sử dụng chip của riêng mình vào năm 2026 cho việc đào tạo, hay còn gọi là quá trình tính toán tốn kém để cung cấp cho hệ thống AI lượng dữ liệu lớn để “dạy” nó cách hoạt động.

Giống như chip suy luận, mục tiêu của chip đào tạo là bắt đầu với các hệ thống đề xuất và sau đó sử dụng cho các sản phẩm AI sáng tạo như chatbot Meta AI, các giám đốc cho biết. “Chúng tôi đang làm việc về cách thực hiện đào tạo cho các hệ thống đề xuất và sau đó cuối cùng là làm thế nào để nghĩ về đào tạo và suy luận cho AI sáng tạo”, Chris Cox, Giám đốc Sản phẩm của Meta, nói tại hội nghị công nghệ, truyền thông và viễn thông của Morgan Stanley tuần trước.

Cox mô tả các nỗ lực phát triển chip của Meta như là “một quá trình đi bộ, bò, chạy”, nhưng cho biết các giám đốc coi chip suy luận đầu tiên cho các đề xuất là một “thành công lớn”.

Meta đã từng hủy bỏ việc phát triển một chip suy luận tùy chỉnh nội bộ sau khi nó thất bại trong một thử nghiệm quy mô nhỏ tương tự như thử nghiệm mà họ đang thực hiện với chip đào tạo, thay vào đó họ đã đặt mua hàng tỷ đô la GPU của Nvidia vào năm 2022. Kể từ đó, công ty mạng xã hội này vẫn là một trong những khách hàng lớn nhất của Nvidia, tích lũy một kho GPU để đào tạo các mô hình của mình, bao gồm các hệ thống đề xuất, quảng cáo và các mô hình nền tảng Llama. Các đơn vị này cũng thực hiện suy luận cho hơn 3 tỷ người dùng mỗi ngày trên các ứng dụng của Meta.

Giá trị của những GPU này đã bị nghi ngờ trong năm nay khi các nhà nghiên cứu AI ngày càng bày tỏ nghi ngờ về việc liệu có thể tiến xa hơn bao nhiêu nữa nếu tiếp tục “mở rộng quy mô” các mô hình ngôn ngữ lớn chỉ bằng cách thêm nhiều dữ liệu và sức mạnh tính toán.

Những nghi ngờ này đã được củng cố khi các mô hình chi phí thấp mới của công ty khởi nghiệp Trung Quốc DeepSeek được ra mắt vào cuối tháng 1, tối ưu hóa hiệu quả tính toán bằng cách dựa nhiều hơn vào suy luận thay vì mô hình truyền thống.

Trong đợt lao dốc toàn cầu của cổ phiếu AI do DeepSeek gây ra, cổ phiếu của Nvidia đã mất tới một phần năm giá trị. Tuy nhiên, sau đó cổ phiếu đã phục hồi phần lớn, với các nhà đầu tư tin tưởng rằng chip của công ty sẽ vẫn là tiêu chuẩn ngành cho đào tạo và suy luận, mặc dù chúng lại giảm giá trở lại do lo ngại về thương mại rộng lớn hơn.