Google ra mắt tính năng AI mới cho Gemini Live: Chia sẻ màn hình và tương tác camera

By Bùi Thanh Thảo

Google đã chính thức triển khai các tính năng trí tuệ nhân tạo mới cho nền tảng Gemini Live, cho phép người dùng tương tác trực tiếp với màn hình và camera của điện thoại thông minh. Đây là một phần trong sáng kiến AI rộng lớn hơn của Google, được biết đến với tên gọi “Project Astra”.

Các tính năng mới bao gồm khả năng đọc màn hình và phân tích video trực tiếp, cho phép Gemini Live trả lời các câu hỏi của người dùng về những gì đang hiển thị trên màn hình điện thoại hoặc qua ống kính camera. Điều này giúp người dùng có thể yêu cầu Gemini nhận diện các đối tượng, đưa ra gợi ý thẩm mỹ, hoặc thậm chí hướng dẫn thực hiện các công việc như chọn màu sơn cho đồ gốm mới tráng men.

Credit: Bleeping Computer

Google đã bắt đầu triển khai các tính năng này cho những người dùng đăng ký gói Google One AI Premium trên các thiết bị Android. Một người dùng Reddit đã chia sẻ video về việc Gemini thành công trong việc đọc nội dung trên màn hình điện thoại và trả lời chính xác các câu hỏi liên quan. Điều này đã được xác nhận bởi 9to5Google.

Việc triển khai các tính năng mới của Gemini Live diễn ra trong bối cảnh các đối thủ cạnh tranh như Amazon và Apple cũng đang nỗ lực nâng cấp các trợ lý ảo của mình. Amazon đang chuẩn bị ra mắt bản nâng cấp Alexa Plus với các tính năng tương tự, trong khi Apple đã trì hoãn việc phát hành Siri phiên bản mới. Samsung vẫn dựa vào trợ lý ảo Bixby, nhưng sự tích hợp liền mạch của Gemini vào điện thoại của Google mang lại lợi thế rõ rệt.

Project Astra đại diện cho nỗ lực của Google trong việc định hình lại giới hạn của các trợ lý ảo. Bằng cách kết hợp phân tích hình ảnh với xử lý ngôn ngữ tự nhiên, Google mong muốn tạo ra một trải nghiệm AI tương tác và trực quan hơn. Các tính năng mới của Gemini Live không chỉ mở ra nhiều khả năng mới cho người dùng mà còn đặt ra tiêu chuẩn mới cho các trợ lý ảo trong tương lai.