Amazon ra mắt mô hình giọng nói AI Nova Sonic, cải thiện tương tác tự nhiên

By Bùi Thị Thanh Thảo 9 Tháng tư, 2025

Amazon vừa công bố mô hình giọng nói AI mới mang tên Nova Sonic, hứa hẹn mang lại những cải tiến vượt bậc trong việc xử lý giọng nói và tạo ra các cuộc trò chuyện tự nhiên hơn. Nova Sonic là một phần trong nỗ lực của Amazon nhằm cạnh tranh với các mô hình giọng nói tiên tiến từ OpenAI và Google.

Nova Sonic sử dụng kiến trúc mô hình hợp nhất, kết hợp nhận dạng giọng nói, xử lý ngôn ngữ và tạo giọng nói trong một hệ thống duy nhất. Điều này cho phép mô hình duy trì toàn bộ ngữ cảnh của cuộc trò chuyện, bao gồm cả ngữ điệu, tốc độ và ý định của người dùng. Nova Sonic có khả năng phát hiện cảm xúc trong giọng nói của người dùng và điều chỉnh phản hồi phù hợp, giúp tạo ra các cuộc trò chuyện tự nhiên và phản ứng nhanh chóng.

Credit: The Verge

Một trong những điểm nổi bật của Nova Sonic là khả năng xử lý giọng nói theo thời gian thực và tạo ra giọng nói tự nhiên. Mô hình này đã được tích hợp vào Alexa+, trợ lý giọng nói nâng cấp của Amazon, và sẽ có sẵn cho các nhà phát triển thông qua nền tảng Bedrock của Amazon. Nova Sonic cũng hỗ trợ nhiều ngôn ngữ và giọng điệu khác nhau, giúp mở rộng phạm vi sử dụng trên toàn cầu.

Theo Amazon, Nova Sonic có hiệu suất vượt trội so với các mô hình giọng nói khác về tốc độ, nhận dạng giọng nói và chất lượng cuộc trò chuyện. Mô hình này ít mắc lỗi nhận dạng giọng nói hơn, ngay cả khi người dùng nói lắp bắp, nói sai hoặc trong môi trường ồn ào. Trên một bài kiểm tra đo lường khả năng nhận dạng giọng nói đa ngôn ngữ, Nova Sonic đạt tỷ lệ lỗi từ chỉ 4,2% khi trung bình trên các ngôn ngữ như tiếng Anh, tiếng Pháp, tiếng Ý, tiếng Đức và tiếng Tây Ban Nha.

Nova Sonic không chỉ giúp cải thiện trải nghiệm người dùng mà còn mở ra nhiều cơ hội mới cho các ứng dụng giọng nói trong các lĩnh vực như dịch vụ khách hàng, giáo dục và giải trí. Với khả năng tương tác tự nhiên và phản ứng nhanh chóng, Nova Sonic hứa hẹn sẽ mang lại những trải nghiệm giọng nói tốt hơn và tiện lợi hơn cho người dùng.

Tags: