Công nghệ tạo video AI của Google gây ấn tượng

Google Research đã phát hành một bài giới thiệu về Lumiere, một mô hình chuyển từ văn bản sang video.

Công nghệ tạo video AI của Google gây ấn tượng

Ảnh: ZD Net

Kể từ khi OpenAI phát hành DALL-E vào cuối năm 2022, các trình tạo văn bản thành hình ảnh đã trở nên bùng nổ với rất nhiều đối thủ cạnh tranh gia nhập thị trường. Giờ đây, hơn một năm sau, chúng ta đang ở những ngày đầu của một công nghệ mới: tạo video AI.

Mới đây, Google Research đã phát hành một bài giới thiệu về Lumiere, một mô hình chuyển từ văn bản sang video có thể tạo ra video sở hữu độ chân thực cao từ lời nhắc văn bản và các hình ảnh khác.

Theo bài viết, mô hình này được thiết kế để giải quyết một thách thức đáng kể trong việc tổng hợp video, đó là tạo ra “chuyển động chân thực, đa dạng và mạch lạc”. Bạn có thể nhận thấy các mô hình tạo video thường hiển thị video bị giật nhưng cách tiếp cận của Google mang lại trải nghiệm xem liền mạch hơn. Lumiere làm được điều đó thông qua kiến trúc Space-Time U-Net, trong đó tạo ra video hoàn chỉnh từ đầu đến cuối chỉ trong một lần chạy.

Phương thức này khác với những mô hình trước đây, vốn chỉ tổng hợp những khoảnh khắc chính và cách xa nhau, khiến video cuối cùng khó đạt được sự đồng nhất.

Lumiere có thể xây dựng phong cách riêng cho video, dựa trên hình ảnh mẫu do người dùng cung cấp. Ngoài tạo nội dung mới, nó cũng được dùng để chỉnh sửa hoặc chữa những phần bị lỗi trong video sẵn có theo yêu cầu của người dùng.

Google Research so sánh hiệu năng của Lumiere với các AI tạo video từ văn bản hiện nay, như ImagenVideo, Pika, ZeroScope và Gen2, bằng cách đề nghị một nhóm thử nghiệm chọn ra video có chất lượng hình ảnh và chuyển động tốt nhất, nhưng không cho biết chúng được tạo ra bởi mô hình nào. Theo báo cáo, Lumiere vượt xa mọi đối thủ trong thử nghiệm.

Hiện tại, mô hình này vẫn chưa được ra mắt công chúng; tuy nhiên, nếu bạn muốn tìm hiểu thêm, bạn có thể truy cập trang web Lumiere, nơi có nhiều bản demo khi mô hình thực hiện các nhiệm vụ khác nhau.

Theo ZD Net

Đọc thêm

Tại sao gọi Zalo bên kia không nghe được?

Tại sao gọi Zalo bên kia không nghe được?

Sẽ rất khó chịu khi điện thoại gọi Zalo mà nói người khác không nghe được. Điều này khiến bạn bỏ lỡ nhiều cuộc gọi và thông tin quan trọng từ người thân, bạn bè.
iPhone 17 Pro Max lập kỷ lục mới

iPhone 17 Pro Max lập kỷ lục mới

iPhone 17 Pro và Pro Max đánh dấu lần đầu tiên Apple trang bị tùy chọn lưu trữ lên đến 2 TB và chính thức mở ra phân khúc giá hoàn toàn mới.
2 cách chuyển ảnh thành bảng Excel đơn giản

2 cách chuyển ảnh thành bảng Excel đơn giản

Việc chuyển đổi ảnh chứa dữ liệu thành bảng Excel là một kỹ năng hữu ích trong công việc và học tập. Thay vì nhập liệu thủ công, bạn có thể sử dụng các công cụ để tự động hóa quá trình này, giúp tiết kiệm thời gian và công sức.
iPhone 17: Những bí mật được chờ đợi

iPhone 17: Những bí mật được chờ đợi

Theo dự kiến, ngày 9/9/2025, Apple sẽ trình làng dòng điện thoại thông minh đình đám iPhone 17 cũng như các sản phẩm như đồng hồ thông minh Apple Watch Series 11 và tai nghe không dây AirPods Pro 3.
Cách đồng bộ hóa Google

Cách đồng bộ hóa Google

Đồng bộ hóa Google là giải pháp tối ưu, giúp kết nối thông tin mượt mà và an toàn. Đồng bộ hóa Google là công cụ mạnh mẽ giúp duy trì sự nhất quán dữ liệu trên nhiều thiết bị, hỗ trợ bạn làm việc và giải trí mọi lúc, mọi nơi.
Cách khôi phục video TikTok đã xóa đơn giản, hiệu quả

Cách khôi phục video TikTok đã xóa đơn giản, hiệu quả

TikTok hiện đã hỗ trợ tính năng khôi phục video bị xóa, giúp người dùng dễ dàng lấy lại nội dung quý giá chỉ với vài thao tác. Tính năng này chỉ có thể khôi phục video đã xóa trong vòng 30 ngày tính từ thời điểm bạn xóa video.
Át chủ bài của Samsung

Át chủ bài của Samsung

iPhone vẫn dẫn đầu doanh số tại Mỹ, nhưng làn sóng smartphone gập từ Samsung, Google và Motorola đang dần thách thức vị thế thống trị của Apple.
Năm sau không có iPhone 18

Năm sau không có iPhone 18

Apple có thể dời ngày ra mắt iPhone 18 sang đầu năm 2027, trong khi các model cao cấp được ưu tiên giới thiệu sớm hơn.