Công nghệ tạo video AI của Google gây ấn tượng

Google Research đã phát hành một bài giới thiệu về Lumiere, một mô hình chuyển từ văn bản sang video.

Công nghệ tạo video AI của Google gây ấn tượng

Ảnh: ZD Net

Kể từ khi OpenAI phát hành DALL-E vào cuối năm 2022, các trình tạo văn bản thành hình ảnh đã trở nên bùng nổ với rất nhiều đối thủ cạnh tranh gia nhập thị trường. Giờ đây, hơn một năm sau, chúng ta đang ở những ngày đầu của một công nghệ mới: tạo video AI.

Mới đây, Google Research đã phát hành một bài giới thiệu về Lumiere, một mô hình chuyển từ văn bản sang video có thể tạo ra video sở hữu độ chân thực cao từ lời nhắc văn bản và các hình ảnh khác.

Theo bài viết, mô hình này được thiết kế để giải quyết một thách thức đáng kể trong việc tổng hợp video, đó là tạo ra “chuyển động chân thực, đa dạng và mạch lạc”. Bạn có thể nhận thấy các mô hình tạo video thường hiển thị video bị giật nhưng cách tiếp cận của Google mang lại trải nghiệm xem liền mạch hơn. Lumiere làm được điều đó thông qua kiến trúc Space-Time U-Net, trong đó tạo ra video hoàn chỉnh từ đầu đến cuối chỉ trong một lần chạy.

Phương thức này khác với những mô hình trước đây, vốn chỉ tổng hợp những khoảnh khắc chính và cách xa nhau, khiến video cuối cùng khó đạt được sự đồng nhất.

Lumiere có thể xây dựng phong cách riêng cho video, dựa trên hình ảnh mẫu do người dùng cung cấp. Ngoài tạo nội dung mới, nó cũng được dùng để chỉnh sửa hoặc chữa những phần bị lỗi trong video sẵn có theo yêu cầu của người dùng.

Google Research so sánh hiệu năng của Lumiere với các AI tạo video từ văn bản hiện nay, như ImagenVideo, Pika, ZeroScope và Gen2, bằng cách đề nghị một nhóm thử nghiệm chọn ra video có chất lượng hình ảnh và chuyển động tốt nhất, nhưng không cho biết chúng được tạo ra bởi mô hình nào. Theo báo cáo, Lumiere vượt xa mọi đối thủ trong thử nghiệm.

Hiện tại, mô hình này vẫn chưa được ra mắt công chúng; tuy nhiên, nếu bạn muốn tìm hiểu thêm, bạn có thể truy cập trang web Lumiere, nơi có nhiều bản demo khi mô hình thực hiện các nhiệm vụ khác nhau.

Theo ZD Net

Đọc thêm

Câu lệnh có thể thao túng AI

Câu lệnh có thể thao túng AI

Phương pháp bẻ khoá, khai thác thông tin qua trí tuệ nhân tạo ngày càng tinh vi, đòi hỏi giải pháp bảo mật tốt hơn từ cá nhân và doanh nghiệp.
Đừng nghĩ nhiều khi sạc iPhone

Đừng nghĩ nhiều khi sạc iPhone

iPhone đã có mặt trên thị trường gần 18 năm. Vẫn có rất nhiều hiểu lầm xoay quanh nó tiếp tục lan truyền. Không ít trong số đó có thể ảnh hưởng xấu đến trải nghiệm người dùng.
ChatGPT vượt Google trong cuộc đua AI

ChatGPT vượt Google trong cuộc đua AI

Khi xét theo lượng người dùng ứng dụng riêng lẻ, ChatGPT đang dẫn trước Gemini của Google. Tuy nhiên, lợi thế về hệ sinh thái rộng lớn vẫn giúp Google duy trì sức mạnh vượt trội.
Mắt thông minh AI dành cho người khiếm thị

Mắt thông minh AI dành cho người khiếm thị

Các nhà khoa học đã phát triển hệ thống thiết bị đeo tích hợp công nghệ AI để chỉ dẫn người khiếm thị tránh các chướng ngại vật trên đường và xử lý các tác vụ hàng ngày.
Tính năng sạc đặc biệt của iPhone

Tính năng sạc đặc biệt của iPhone

Tính năng Clean Energy Saving (Sạc pin năng lượng sạch) nhằm mục tiêu giảm khí thải carbon sẽ được triển khai trên toàn bộ iPhone và iPad trưng bày tại Mỹ.
Những lưu ý khi sạc điện thoại trên ô tô

Những lưu ý khi sạc điện thoại trên ô tô

Sạc điện thoại trên ô tô là một giải pháp hỗ trợ tối ưu để duy trì liên lạc với mọi người xung quanh. Tuy nhiên, sạc không đúng cách tiềm ẩn nguy hiểm cho người ngồi trên xe.
Thiết bị gập bí ẩn của Apple

Thiết bị gập bí ẩn của Apple

Với màn hình gập có kích thước gần 19 inch, rất khó để hình dung cách Apple định vị phân khúc thị trường cho sản phẩm này.
Kỷ nguyên iPhone 'nhàm chán' sắp kết thúc

Kỷ nguyên iPhone 'nhàm chán' sắp kết thúc

Apple đang chuẩn bị cho một sự thay đổi mang tính cách mạng đối với dòng sản phẩm iPhone, mở ra một kỷ nguyên mới sau giai đoạn được nhận định là thiếu đột phá.
Hình ảnh mới của iOS 19

Hình ảnh mới của iOS 19

iOS 19 tiếp tục lộ diện với biểu tượng ứng dụng mới, các thành phần giao diện bóng bẩy hơn.
Đừng tin vào AI

Đừng tin vào AI

Công ty đứng sau mô hình Claude cho rằng chuỗi suy nghĩ của AI ngày càng kém minh bạch hơn và có thể dễ dàng đánh lừa người dùng.