Dữ liệu mới cho thấy OpenAI và Perplexity đang gây hại cho các nhà xuất bản như thế nào?

Ảnh: Pexels

Các công ty AI từng hứa hẹn rằng công cụ tìm kiếm trí tuệ nhân tạo (AI search) của họ sẽ mang lại nhiều lượt truy cập hơn cho các nhà xuất bản. Nhưng thực tế lại không phải vậy.

Lượt truy cập giảm mạnh vì AI

Những công ty như OpenAI và Perplexity từng tuyên bố rằng công cụ tìm kiếm AI của họ – vốn thu thập thông tin từ web để tạo ra câu trả lời tổng hợp – sẽ giúp các nhà xuất bản tăng thu nhập bằng cách đưa thêm độc giả đến trang web của họ. Tuy nhiên, dữ liệu mới đây lại chỉ ra một thực tế hoàn toàn trái ngược.

Theo một báo cáo từ nền tảng cấp phép nội dung TollBit, các công cụ tìm kiếm AI chỉ mang lại lưu lượng truy cập ít hơn 96% so với công cụ tìm kiếm truyền thống như Google. Trong khi đó, số lần AI quét dữ liệu trên các trang web đã tăng gấp đôi trong những tháng gần đây.

Báo cáo này, được chia sẻ độc quyền với Forbes, đã phân tích 160 trang web thuộc các lĩnh vực như tin tức, công nghệ tiêu dùng và mua sắm trong ba tháng cuối năm 2024. Kết quả cho thấy, các công ty AI như OpenAI, Perplexity và Meta đã quét trang web trung bình 2 triệu lần mỗi quý, tương đương mỗi trang web bị quét khoảng 7 lần.

Cách các bot AI thu thập dữ liệu

CEO Toshit Panigrahi của TollBit chia sẻ: “Chúng tôi đang chứng kiến một làn sóng bot AI tấn công các trang web mỗi khi người dùng đặt câu hỏi. Nhu cầu đối với nội dung từ các nhà xuất bản đang ở mức rất cao”.

TollBit, với công nghệ theo dõi các hoạt động quét dữ liệu, cho biết các công ty AI không chỉ thu thập thông tin mà còn gây thiệt hại nghiêm trọng cho các nhà xuất bản khi họ không được hưởng lợi từ lưu lượng truy cập mà AI hứa hẹn.

Phản hồi của các công ty AI:

  • OpenAI từ chối bình luận.
  • Meta không trả lời yêu cầu phản hồi.
  • Người phát ngôn của Perplexity tuyên bố rằng công ty tôn trọng quy định “robots.txt” – một tệp hướng dẫn bot web về những phần của trang web có thể được truy cập. Tuy nhiên, báo cáo của TollBit cho thấy Perplexity vẫn tiếp tục quét dữ liệu ngay cả khi bị chặn.

Google và tác động đến doanh nghiệp

Theo một dự báo từ công ty nghiên cứu Gartner vào tháng 2/2024, lưu lượng truy cập từ các công cụ tìm kiếm truyền thống sẽ giảm 25% vào năm 2026, chủ yếu do chatbot AI và các trợ lý ảo khác.

Những doanh nghiệp phụ thuộc vào lưu lượng truy cập từ tìm kiếm đã bắt đầu chịu ảnh hưởng nặng nề. Ví dụ, công ty giáo dục trực tuyến Chegg đã kiện Google vì sử dụng nội dung từ trang web của họ trong các bản tóm tắt AI mà không ghi nguồn, khiến số lượng người dùng truy cập trang giảm mạnh.

  • Lượt truy cập của Chegg giảm 49% trong tháng 1/2024, so với mức giảm 8% trong quý II/2023 khi Google mới ra mắt tính năng tóm tắt AI.
  • CEO Chegg, Nathan Schultz, cho rằng Google đã phá vỡ “hợp đồng xã hội” vốn có giữa công cụ tìm kiếm và các nhà xuất bản.

Không chỉ Chegg, nhiều trang web du lịch như Kayak và TripAdvisor cũng đang lo ngại rằng tính năng tổng hợp thông tin của AI sẽ làm giảm lưu lượng truy cập của họ.

Ảnh: Pexels

Các vụ kiện chống lại OpenAI và Perplexity

Các nhà xuất bản tin tức như The New York Post, Dow Jones, Forbes, Condé Nast, Vox và The Atlantic đã đệ đơn kiện OpenAI, Perplexity và công ty AI Cohere vì vi phạm bản quyền, cáo buộc họ thu thập và sử dụng trái phép nội dung báo chí.

Perplexity bị cáo buộc không chỉ quét dữ liệu bất hợp pháp mà còn sao chép gần như nguyên văn các bài viết của các trang tin lớn như Forbes, CNBC và Bloomberg mà không dẫn nguồn đầy đủ.

  • Forbes đã gửi thư yêu cầu Perplexity ngừng hành vi xâm phạm bản quyền vào tháng 6/2024.
  • Vào tháng 10/2024, The New York Post và Dow Jones đã kiện Perplexity vì đưa ra các thông tin sai lệch và vi phạm bản quyền.
  • Đầu tháng 2/2025, các nhà xuất bản lớn tiếp tục khởi kiện công ty AI Cohere vì đã quét trái phép 4.000 bài viết có bản quyền.

Trong khi đó, Perplexity tiếp tục khẳng định rằng những cáo buộc chống lại họ là “thiển cận, không cần thiết và tự hủy hoại chính mình”.

AI đang làm tăng chi phí vận hành của các nhà xuất bản

Không chỉ làm giảm lưu lượng truy cập, AI còn gây ra vấn đề khác: chi phí vận hành tăng cao.

  • Khi bot AI liên tục truy cập trang web để thu thập dữ liệu, nó tiêu tốn tài nguyên máy chủ và tăng chi phí duy trì trang web.
  • Một số công ty AI như OpenAI và Perplexity đang phát triển các trợ lý nghiên cứu AI có thể truy cập hàng trăm trang web cùng lúc để tạo ra báo cáo chuyên sâu, khiến vấn đề trở nên nghiêm trọng hơn.

Hướng đi mới: Cấp phép nội dung cho AI

Một số nhà xuất bản lớn đã bắt đầu ký hợp đồng cấp phép nội dung với các công ty AI để kiếm lợi nhuận từ việc này, như:

  • The Associated Press.
  • Axel Springer.
  • The Financial Times.

Ngoài ra, những công ty như TollBit đang tìm cách giúp các nhà xuất bản thu phí từ AI. TollBit làm việc với 500 nhà xuất bản, bao gồm TIME, Hearst và Adweek, để theo dõi các lượt quét dữ liệu và tính phí các công ty AI mỗi khi họ sử dụng nội dung từ các trang web.

CEO Panigrahi cho biết: “AI không đọc thông tin như con người. Con người chỉ nhấp vào một vài liên kết rồi dừng lại, còn AI sẽ quét 10-20 liên kết để có câu trả lời”.

AI mang lại nhiều lợi ích nhưng cũng đặt ra những thách thức lớn đối với các nhà xuất bản nội dung. Khi các công cụ tìm kiếm AI ngày càng phổ biến, các trang tin tức và blog đang phải đối mặt với nguy cơ mất kiểm soát nội dung, giảm lưu lượng truy cập và tăng chi phí vận hành.

Việc cấp phép nội dung có thể là một giải pháp, nhưng nếu các công ty AI tiếp tục quét dữ liệu mà không có sự đồng thuận, các vụ kiện tụng sẽ còn tiếp diễn và cuộc chiến giữa AI và các nhà xuất bản vẫn chưa có hồi kết.