Công nghệ tạo video AI của Google gây ấn tượng

Google Research đã phát hành một bài giới thiệu về Lumiere, một mô hình chuyển từ văn bản sang video.

Công nghệ tạo video AI của Google gây ấn tượng

Ảnh: ZD Net

Kể từ khi OpenAI phát hành DALL-E vào cuối năm 2022, các trình tạo văn bản thành hình ảnh đã trở nên bùng nổ với rất nhiều đối thủ cạnh tranh gia nhập thị trường. Giờ đây, hơn một năm sau, chúng ta đang ở những ngày đầu của một công nghệ mới: tạo video AI.

Mới đây, Google Research đã phát hành một bài giới thiệu về Lumiere, một mô hình chuyển từ văn bản sang video có thể tạo ra video sở hữu độ chân thực cao từ lời nhắc văn bản và các hình ảnh khác.

Theo bài viết, mô hình này được thiết kế để giải quyết một thách thức đáng kể trong việc tổng hợp video, đó là tạo ra “chuyển động chân thực, đa dạng và mạch lạc”. Bạn có thể nhận thấy các mô hình tạo video thường hiển thị video bị giật nhưng cách tiếp cận của Google mang lại trải nghiệm xem liền mạch hơn. Lumiere làm được điều đó thông qua kiến trúc Space-Time U-Net, trong đó tạo ra video hoàn chỉnh từ đầu đến cuối chỉ trong một lần chạy.

Phương thức này khác với những mô hình trước đây, vốn chỉ tổng hợp những khoảnh khắc chính và cách xa nhau, khiến video cuối cùng khó đạt được sự đồng nhất.

Lumiere có thể xây dựng phong cách riêng cho video, dựa trên hình ảnh mẫu do người dùng cung cấp. Ngoài tạo nội dung mới, nó cũng được dùng để chỉnh sửa hoặc chữa những phần bị lỗi trong video sẵn có theo yêu cầu của người dùng.

Google Research so sánh hiệu năng của Lumiere với các AI tạo video từ văn bản hiện nay, như ImagenVideo, Pika, ZeroScope và Gen2, bằng cách đề nghị một nhóm thử nghiệm chọn ra video có chất lượng hình ảnh và chuyển động tốt nhất, nhưng không cho biết chúng được tạo ra bởi mô hình nào. Theo báo cáo, Lumiere vượt xa mọi đối thủ trong thử nghiệm.

Hiện tại, mô hình này vẫn chưa được ra mắt công chúng; tuy nhiên, nếu bạn muốn tìm hiểu thêm, bạn có thể truy cập trang web Lumiere, nơi có nhiều bản demo khi mô hình thực hiện các nhiệm vụ khác nhau.

Theo ZD Net

Đọc thêm

Lý do AI của iPhone tốt hơn Android

Lý do AI của iPhone tốt hơn Android

Nhiều tính năng mới của trí tuệ nhân tạo của Apple hoạt động trên thiết bị hoặc đám mây bảo mật. Đây là lợi thế cạnh tranh so với các thiết bị Android.
Loạt tính năng AI mới của Apple

Loạt tính năng AI mới của Apple

Apple Intelligence sẽ hỗ trợ tiếng Việt vào cuối năm, thêm tính năng dịch trực tiếp, nhận dạng hình ảnh để tìm kiếm hoặc lấy thông tin, tạo hình với ChatGPT.
BlackBerry sắp trở lại

BlackBerry sắp trở lại

Một công ty Trung Quốc muốn hồi sinh mẫu smartphone BlackBerry Classic (Q20) với hệ điều hành Android và trang bị phần cứng hiện đại.
AI có hại cho trẻ em?

AI có hại cho trẻ em?

Trong bối cảnh AI tạo sinh ngày càng dễ tiếp cận, các chuyên gia và phụ huynh cần quan tâm nhiều hơn về tác động của chatbot AI lên tâm lý trẻ em.
Hồi chuông báo động cho Apple

Hồi chuông báo động cho Apple

Sự kết hợp giữa OpenAI, cha đẻ ChatGPT và bậc thầy thiết kế Jony Ive trong việc tạo ra một thế hệ thiết bị AI mới khiến cách tiếp cận của Apple bị đặt dấu hỏi.
iPhone 17 sẽ đắt đến đâu?

iPhone 17 sẽ đắt đến đâu?

Dựa vào chính sách thuế thay đổi liên tục, xu hướng giá của các đời máy trước, iPhone 17 có thể là chiếc iPhone đắt nhất từ trước đến nay.
Viettel đấu giá thành công băng tần 700 MHz

Viettel đấu giá thành công băng tần 700 MHz

Tập đoàn Công nghiệp - Viễn thông Quân đội (Viettel) vừa đấu giá thành công quyền sử dụng tần số vô tuyến điện đối với khối tần B2 – B2’ của băng tần 700MHz trong vòng 15 năm tới.
Đừng mắc lỗi ngớ ngẩn này khi dùng AI

Đừng mắc lỗi ngớ ngẩn này khi dùng AI

Việc sử dụng AI để tạo nội dung vẫn thường thấy trên các nền tảng. Tuy nhiên, một số người dùng quên bỏ câu dẫn nhập của AI, tạo ra những lỗi ngớ ngẩn.