OpenAI chính thức công bố ra mắt một dịch vụ mới mang tên Flex, nhằm tối ưu chi phí cho các tác vụ trí tuệ nhân tạo (AI) không cần xử lý tức thì. Flex được triển khai như một tùy chọn trong hệ thống API của OpenAI, cho phép các nhà phát triển gửi yêu cầu tính toán với mức độ ưu tiên thấp hơn, đổi lại mức giá sử dụng rẻ hơn đáng kể so với các hình thức xử lý thông thường.
Khác với các dịch vụ hiện tại của OpenAI vốn tập trung vào xử lý yêu cầu theo thời gian thực, Flex hướng đến những tác vụ có thể chờ đợi, chẳng hạn như huấn luyện lại dữ liệu, tổng hợp thông tin định kỳ, tạo nội dung theo lô, hoặc xử lý hậu kỳ cho các ứng dụng không yêu cầu phản hồi ngay lập tức.
Credit: ITdaily
Trong bài công bố, OpenAI cho biết các yêu cầu gửi qua Flex sẽ không được xử lý ngay lập tức mà được đưa vào hàng đợi. Khi hệ thống có đủ tài nguyên rỗi, các tác vụ này sẽ được thực hiện. Đổi lại, người dùng sẽ được hưởng mức phí tiết kiệm đáng kể, giúp giảm áp lực tài chính cho các startup và doanh nghiệp vừa & nhỏ khi tích hợp AI.
Dịch vụ Flex được kỳ vọng giảm rào cản tiếp cận công nghệ AI tiên tiến, đặc biệt đối với các dự án có ngân sách hạn chế. Với mức phí thấp hơn, các công ty có thể mở rộng quy mô ứng dụng AI mà không phải lo ngại về chi phí vận hành tăng vọt.
OpenAI cho biết Flex sẽ không thay thế các tùy chọn xử lý truyền thống, vốn được thiết kế cho các tác vụ yêu cầu độ trễ thấp như chatbot, trợ lý ảo hoặc các hệ thống phản hồi trực tuyến. Thay vào đó, hai lựa chọn này sẽ tồn tại song song, cho phép nhà phát triển tùy chỉnh chiến lược sử dụng AI linh hoạt hơn tùy theo mục tiêu cụ thể: khi nào cần nhanh, khi nào nên tiết kiệm.
Ngoài ra, Flex cũng hỗ trợ các mô hình mới nhất như GPT-4-turbo, giúp đảm bảo rằng người dùng vẫn có thể tận dụng các tính năng tiên tiến mà không phải đánh đổi về chất lượng đầu ra.
Giới chuyên gia nhận định việc ra mắt Flex là bước đi chiến lược của OpenAI nhằm mở rộng hệ sinh thái người dùng, đặc biệt trong bối cảnh các đối thủ như Anthropic, Google hay Mistral cũng đang cạnh tranh quyết liệt về giá cả và hiệu suất.
Bên cạnh đó, Flex còn giúp OpenAI tối ưu hóa hiệu suất sử dụng máy chủ GPU, tận dụng được tài nguyên khi hệ thống đang nhàn rỗi thay vì để lãng phí, từ đó nâng cao hiệu quả vận hành toàn cục.
Dịch vụ Flex của OpenAI không chỉ là một giải pháp công nghệ mới, mà còn là một lời nhắn gửi tới cộng đồng AI rằng hiệu quả và chi phí có thể đi cùng nhau. Trong tương lai, khi AI ngày càng trở thành một phần không thể thiếu trong mọi ngành nghề, những lựa chọn linh hoạt như Flex sẽ đóng vai trò quan trọng giúp các tổ chức tối ưu hóa chi tiêu mà vẫn đảm bảo chất lượng trải nghiệm người dùng.