Trong một động thái đáng chú ý, mạng xã hội X – nền tảng do Elon Musk sở hữu, trước đây được biết đến với tên gọi Twitter vừa cập nhật điều khoản sử dụng, chính thức cấm các bên thứ ba sử dụng nội dung trên nền tảng này để huấn luyện các mô hình trí tuệ nhân tạo (AI). Quyết định này được đưa ra trong bối cảnh cuộc đua AI đang nóng lên từng ngày, và dữ liệu người dùng trở thành một trong những tài nguyên quý giá nhất đối với các công ty công nghệ.
Theo cập nhật mới nhất trong thỏa thuận dành cho nhà phát triển, X đã thêm một điều khoản rõ ràng dưới mục “Kỹ thuật đảo ngược và các hạn chế khác”, trong đó nêu rõ: “Bạn không được và không được cố gắng (hoặc cho phép người khác) sử dụng API hoặc nội dung từ X để tinh chỉnh hoặc huấn luyện bất kỳ mô hình nền tảng hoặc mô hình tiên tiến nào”.
Ảnh: TechCrunch
Điều này đồng nghĩa với việc các công ty AI, bao gồm cả những gã khổng lồ như OpenAI, Google DeepMind hay Anthropic, sẽ không còn được phép thu thập hoặc sử dụng dữ liệu công khai từ X để huấn luyện các mô hình ngôn ngữ lớn (LLM) – trừ khi có thỏa thuận riêng với nền tảng này.
Động thái này không chỉ là một biện pháp bảo vệ quyền riêng tư người dùng, mà còn là một chiến lược kinh doanh rõ ràng. Sau khi công ty AI xAI của Elon Musk mua lại X vào tháng 3, việc giữ lại dữ liệu cho riêng mình trở nên quan trọng hơn bao giờ hết. Việc cho phép các đối thủ tiếp cận kho dữ liệu khổng lồ của X – bao gồm hàng tỷ bài đăng, hình ảnh, và tương tác sẽ vô tình tiếp tay cho sự phát triển của các mô hình cạnh tranh với Grok, chatbot AI do chính xAI phát triển.
Trước đó, vào năm 2023, X từng cập nhật chính sách quyền riêng tư để cho phép sử dụng dữ liệu công khai trên nền tảng nhằm huấn luyện các mô hình AI nội bộ. Tuy nhiên, việc mở cửa cho các bên thứ ba đã gây ra nhiều tranh cãi, đặc biệt là về quyền kiểm soát dữ liệu cá nhân và sự minh bạch trong cách dữ liệu được sử dụng.
X không phải là công ty duy nhất thực hiện biện pháp này. Reddit, một nền tảng mạng xã hội lớn khác, cũng đã áp dụng các biện pháp hạn chế AI crawler. Gần đây, The Browser Company – công ty đứng sau trình duyệt AI-focused Dia cũng đưa ra điều khoản tương tự trong chính sách sử dụng của mình.
Điều này phản ánh một xu hướng ngày càng rõ rệt: các nền tảng sở hữu dữ liệu người dùng đang tìm cách kiểm soát chặt chẽ hơn việc khai thác dữ liệu của họ cho mục đích huấn luyện AI. Trong bối cảnh dữ liệu trở thành “dầu mỏ mới” của thời đại số, việc kiểm soát nguồn tài nguyên này không chỉ là vấn đề đạo đức, mà còn là lợi thế cạnh tranh sống còn.
Việc X đóng cửa dữ liệu đối với các công ty AI có thể gây ra những ảnh hưởng không nhỏ. Các mô hình ngôn ngữ lớn cần một lượng dữ liệu khổng lồ và đa dạng để học hỏi và cải thiện. Mạng xã hội, với đặc trưng là ngôn ngữ tự nhiên, đa dạng chủ đề và phản ánh đời sống thực, là nguồn dữ liệu lý tưởng.
Khi các nền tảng lớn bắt đầu “khóa cửa”, các công ty AI sẽ buộc phải tìm kiếm các nguồn dữ liệu thay thế – hoặc phải trả tiền để tiếp cận. Điều này có thể làm tăng chi phí phát triển mô hình, đồng thời đặt ra câu hỏi về tính công bằng và khả năng tiếp cận trong ngành công nghệ.