Hugging Face ra mắt mô hình Robot SmolVLA

By Nhã Thanh

Nền tảng phát triển AI Hugging Face đã chính thức công bố SmolVLA, một mô hình trí tuệ nhân tạo dành cho robot với hiệu suất cao đến mức có thể chạy trên một chiếc MacBook thông thường. Đây là bước tiến lớn trong việc dân chủ hóa công nghệ robot, giúp các nhà phát triển dễ dàng tiếp cận và thử nghiệm các hệ thống robot tiên tiến mà không cần đến phần cứng đắt tiền.

SmolVLA là một mô hình Vision-Language-Action (VLA) với kích thước chỉ 450 triệu tham số, được huấn luyện trên các bộ dữ liệu mã nguồn mở từ cộng đồng LeRobot. Dù nhỏ gọn, mô hình này được đánh giá là vượt trội hơn nhiều mô hình lớn hơn trong cả môi trường ảo và thực tế.

Hugging Face cho biết SmolVLA không chỉ là một mô hình AI, mà còn là một phương pháp huấn luyện và đánh giá công nghệ robot tổng quát, hướng đến việc xây dựng các hệ thống robot có khả năng xử lý đa nhiệm và thích nghi với nhiều tình huống khác nhau.

Ảnh: TechCrunch

Một trong những điểm nổi bật của SmolVLA là khả năng chạy trên GPU tiêu dùng hoặc thậm chí là MacBook, điều này mở ra cơ hội lớn cho các nhà phát triển cá nhân và các nhóm nghiên cứu nhỏ. Mô hình cũng tương thích với các hệ thống robot giá rẻ do chính Hugging Face phát triển sau khi mua lại startup Pollen Robotics tại Pháp.

SmolVLA còn hỗ trợ một kiến trúc gọi là “asynchronous inference stack”, cho phép tách biệt quá trình xử lý hành động của robot với việc phân tích hình ảnh và âm thanh. Điều này giúp robot phản ứng nhanh hơn trong các môi trường thay đổi liên tục, một yếu tố quan trọng trong các ứng dụng thực tế.

SmolVLA là một phần trong chiến lược dài hạn của Hugging Face nhằm xây dựng một hệ sinh thái robot mã nguồn mở, dễ tiếp cận và chi phí thấp. Trước đó, công ty đã ra mắt LeRobot, một bộ công cụ bao gồm mô hình, dữ liệu và phần mềm dành cho robot, và gần đây là các hệ thống robot hình người giá rẻ.

Một người dùng trên mạng xã hội X đã chia sẻ rằng họ đã sử dụng SmolVLA để điều khiển một cánh tay robot bên thứ ba, chỉ với 31 lần huấn luyện mẫu, và kết quả ngang bằng hoặc vượt trội so với các mô hình chuyên biệt.