Google vừa công bố bản cập nhật lớn cho Gemini, chatbot AI của hãng, với khả năng tạo và chỉnh sửa hình ảnh được cải thiện đáng kể nhờ tích hợp công cụ mới mang tên ImageFX. Đây là một phần trong nỗ lực của Google nhằm đưa Gemini trở thành một công cụ đa năng hơn trong hệ sinh thái trí tuệ nhân tạo đang phát triển nhanh chóng.
Theo công bố ngày 30/4, người dùng Gemini hiện có thể yêu cầu tạo hình ảnh từ văn bản, đồng thời dễ dàng chỉnh sửa các hình ảnh đã tạo bằng các tùy chọn trực quan như thay đổi phong cách, phối màu, hoặc điều chỉnh các chi tiết cụ thể. Google cho biết công cụ này được thiết kế với giao diện thân thiện, cho phép người dùng thử nghiệm và tùy biến hình ảnh theo nhiều hướng sáng tạo khác nhau mà không cần kiến thức đồ họa chuyên sâu.
Ảnh: TechRadar
Tính năng mới được hỗ trợ bởi Imagen 2, một mô hình tạo ảnh mạnh mẽ do Google DeepMind phát triển. Imagen 2 được biết đến với khả năng tạo ra hình ảnh có chất lượng cao, chi tiết rõ nét và phản ánh đúng các mô tả ngôn ngữ tự nhiên một cách chính xác.
Đặc biệt, Google nhấn mạnh rằng việc tạo và chỉnh sửa hình ảnh trong Gemini sẽ được kiểm soát chặt chẽ về mặt đạo đức và minh bạch. Mỗi hình ảnh được tạo ra từ AI đều sẽ được đánh dấu bằng metadata kỹ thuật số dựa trên tiêu chuẩn C2PA (Coalition for Content Provenance and Authenticity), giúp người xem nhận biết rằng hình ảnh đó do máy tạo ra, hạn chế nguy cơ lạm dụng như tạo ảnh giả mạo hoặc gây hiểu lầm.
Tính năng tạo và chỉnh sửa ảnh ban đầu sẽ được triển khai cho người dùng Gemini Advanced – phiên bản trả phí của Gemini ở một số thị trường như Mỹ, và sau đó sẽ mở rộng ra toàn cầu. Đây cũng là một phần trong nỗ lực lớn hơn của Google nhằm định vị Gemini như một trợ lý AI toàn diện, không chỉ hỗ trợ văn bản mà còn cả hình ảnh và âm thanh trong tương lai.
Việc nâng cấp khả năng tạo hình ảnh cho Gemini diễn ra trong bối cảnh cạnh tranh gay gắt giữa các ông lớn công nghệ trong lĩnh vực AI sáng tạo (generative AI), với các đối thủ như OpenAI (DALL·E), Microsoft (Designer) hay Adobe (Firefly) đều đang tung ra các công cụ tương tự. Tuy nhiên, với lợi thế về dữ liệu, cơ sở hạ tầng và tích hợp chặt chẽ vào hệ sinh thái Google (Docs, Search, Android…), Gemini hứa hẹn sẽ trở thành một công cụ phổ biến cho cả người dùng cá nhân lẫn doanh nghiệp.
Bản cập nhật này không chỉ mở rộng chức năng cho Gemini, mà còn phản ánh một xu hướng rõ rệt: các trợ lý AI hiện đại đang ngày càng trở thành nền tảng đa phương tiện, phục vụ mọi nhu cầu sáng tạo, làm việc và giải trí của người dùng trong một trải nghiệm thống nhất.