Midjourney ra mắt công cụ tạo video AI đầu tiên: bước đột phá từ hình ảnh sang chuyển động

By Phạm Phương

Midjourney – nền tảng tạo hình ảnh AI đình đám – vừa chính thức công bố Video v1, công cụ tạo video đầu tiên cho phép người dùng chuyển hình ảnh tĩnh thành những đoạn phim ngắn động. Đây được xem là bước chuyển lớn của Midjourney khi mở rộng từ lĩnh vực hình ảnh sang thế giới video đầy tiềm năng và cạnh tranh khốc liệt.

Image: Midjourney

Từ một bức ảnh, tạo nên chuyển động

Với Video v1, người dùng có thể chọn bất kỳ hình ảnh nào (do Midjourney tạo hoặc tải lên), sau đó nhấn nút “Animate” để hệ thống bắt đầu xử lý. Video đầu tiên kéo dài 5 giây, được tạo dựa trên hình ảnh gốc và phần mô tả văn bản (prompt) có thể do người dùng viết hoặc để AI tự động tạo.

Sau đó, người dùng có thể thêm tối đa bốn phân đoạn mở rộng, mỗi đoạn dài 4 giây, nâng tổng độ dài video lên đến 21 giây. Ngoài ra, Midjourney còn cung cấp hai tuỳ chọn chuyển động: “low motion” giúp chuyển động mượt nhẹ chỉ trên chủ thể, và “high motion” tạo hiệu ứng di chuyển cho cả khung hình. Điều này giúp kiểm soát nhịp điệu hình ảnh một cách linh hoạt và mang tính cá nhân hóa cao.

Cách sử dụng và chi phí

Hiện tại, Video v1 được tích hợp trên Discord và website Midjourney. Người dùng cần có tài khoản trả phí (từ 10 USD/tháng trở lên) để truy cập tính năng này. Thời gian xử lý video tính theo thời lượng GPU sử dụng – cao gấp khoảng 8 lần so với tạo ảnh tĩnh. Ước tính, mỗi giây video sẽ tiêu tốn tài nguyên tương đương với một hình ảnh Midjourney thông thường.

Midjourney cũng nhấn mạnh rằng đây là phiên bản thử nghiệm, nên các giới hạn về thời lượng, chất lượng và tốc độ vẫn đang trong quá trình tinh chỉnh.

Cơ hội sáng tạo – và rủi ro pháp lý

Việc Midjourney bước vào lĩnh vực video diễn ra đúng thời điểm nhạy cảm: công ty đang đối mặt với vụ kiện từ Disney và Universal liên quan đến việc sử dụng dữ liệu có bản quyền để huấn luyện mô hình. Việc tạo video – một định dạng phức tạp hơn – có thể làm tăng mối lo ngại và áp lực pháp lý với Midjourney.

Tuy vậy, nhà sáng lập David Holz khẳng định Video v1 chỉ là “bước đệm” cho những tham vọng lớn hơn, như mô phỏng không gian 3D thời gian thực hay tương tác thế giới mở bằng AI. Midjourney cũng đang mở rộng phát triển các tính năng như cá nhân hóa prompt, giao diện web mới và công cụ tạo vật thể 3D.

Cuộc đua video AI đang nóng lên

Video v1 đưa Midjourney chính thức gia nhập đường đua cùng các ông lớn như OpenAI (với Sora), Google (Veo), Meta, Runway, Pika và Stability AI. Mỗi nền tảng có thế mạnh riêng, từ chất lượng hình ảnh đến khả năng xử lý cốt truyện hay hiệu ứng vật lý. Tuy nhiên, ưu điểm nổi bật của Midjourney là cộng đồng sáng tạo mạnh mẽ và hệ sinh thái prompt đa dạng. Với phiên bản đầu tiên, Video v1 đã cho thấy khả năng tạo ra những đoạn video ngắn ấn tượng từ một hình ảnh đơn lẻ – điều từng là giới hạn lớn của sáng tạo AI trước đây.

Midjourney đang tiến một bước xa hơn khỏi thế giới ảnh tĩnh. Video v1 không chỉ là công cụ thử nghiệm, mà là cánh cửa mở ra một xu hướng sáng tạo mới: nơi mỗi bức ảnh có thể kể một câu chuyện bằng chuyển động. Dù còn nhiều giới hạn kỹ thuật và thách thức pháp lý, không thể phủ nhận đây là một bước tiến đầy tham vọng – và có thể sẽ định hình tương lai của video AI trong thập kỷ tới.