Anthropic ra mắt chế độ thoại cho Claude, mở ra trải nghiệm trò chuyện tự nhiên hơn với AI

By Nhã Thanh

Ngày 27 tháng 5 năm 2025, công ty AI Anthropic chính thức công bố tính năng “voice mode” (chế độ thoại) cho chatbot Claude – một bước tiến quan trọng trong việc đưa trải nghiệm tương tác với trí tuệ nhân tạo trở nên tự nhiên và gần gũi hơn với con người. 

Tính năng này hiện đang được triển khai dưới dạng beta trên ứng dụng Claude dành cho thiết bị di động. Người dùng có thể trò chuyện trực tiếp bằng giọng nói với Claude, đồng thời nhận phản hồi bằng giọng nói từ AI, thay vì chỉ gõ văn bản như trước đây. Theo Anthropic, voice mode được thiết kế để hỗ trợ người dùng trong các tình huống “tay bận nhưng đầu óc rảnh”, chẳng hạn như khi đang nấu ăn, lái xe hoặc tập thể dục. 

Ảnh: PYMNTS.com

Voice mode được vận hành mặc định bởi mô hình Claude Sonnet 4, và cho phép người dùng chuyển đổi linh hoạt giữa chế độ thoại và văn bản. Sau mỗi cuộc trò chuyện, ứng dụng sẽ hiển thị bản tóm tắt và bản ghi nội dung, giúp người dùng dễ dàng theo dõi và lưu trữ thông tin. 

Một điểm thú vị là người dùng có thể lựa chọn giữa năm giọng nói khác nhau cho Claude, mang lại cảm giác cá nhân hóa và thân thiện hơn. Ngoài ra, người dùng phiên bản trả phí còn có thể kết nối Claude với Google Workspace, cho phép AI truy cập lịch Google Calendar, email Gmail và tài liệu Google Docs – tuy nhiên, tính năng này chỉ khả dụng cho người dùng doanh nghiệp (Claude Enterprise). 

Anthropic không phải là công ty đầu tiên triển khai trò chuyện bằng giọng nói với AI. Trước đó, OpenAI đã giới thiệu voice chat cho ChatGPT, Google có Gemini Live, và xAI của Elon Musk cũng có Voice Mode cho Grok. Tuy nhiên, Claude được đánh giá cao nhờ khả năng giữ mạch hội thoại mượt mà, phản hồi nhanh và giọng nói tự nhiên hơn so với nhiều đối thủ. 

Việc bổ sung voice mode cho Claude không chỉ là một cải tiến về mặt công nghệ, mà còn phản ánh xu hướng chung của ngành AI: đưa các mô hình ngôn ngữ lớn (LLMs) tiến gần hơn đến vai trò trợ lý cá nhân thực thụ có thể nghe, hiểu, phản hồi và hỗ trợ người dùng trong thời gian thực.