Công nghệ tạo video AI của Google gây ấn tượng

Google Research đã phát hành một bài giới thiệu về Lumiere, một mô hình chuyển từ văn bản sang video.

Công nghệ tạo video AI của Google gây ấn tượng

Ảnh: ZD Net

Kể từ khi OpenAI phát hành DALL-E vào cuối năm 2022, các trình tạo văn bản thành hình ảnh đã trở nên bùng nổ với rất nhiều đối thủ cạnh tranh gia nhập thị trường. Giờ đây, hơn một năm sau, chúng ta đang ở những ngày đầu của một công nghệ mới: tạo video AI.

Mới đây, Google Research đã phát hành một bài giới thiệu về Lumiere, một mô hình chuyển từ văn bản sang video có thể tạo ra video sở hữu độ chân thực cao từ lời nhắc văn bản và các hình ảnh khác.

Theo bài viết, mô hình này được thiết kế để giải quyết một thách thức đáng kể trong việc tổng hợp video, đó là tạo ra “chuyển động chân thực, đa dạng và mạch lạc”. Bạn có thể nhận thấy các mô hình tạo video thường hiển thị video bị giật nhưng cách tiếp cận của Google mang lại trải nghiệm xem liền mạch hơn. Lumiere làm được điều đó thông qua kiến trúc Space-Time U-Net, trong đó tạo ra video hoàn chỉnh từ đầu đến cuối chỉ trong một lần chạy.

Phương thức này khác với những mô hình trước đây, vốn chỉ tổng hợp những khoảnh khắc chính và cách xa nhau, khiến video cuối cùng khó đạt được sự đồng nhất.

Lumiere có thể xây dựng phong cách riêng cho video, dựa trên hình ảnh mẫu do người dùng cung cấp. Ngoài tạo nội dung mới, nó cũng được dùng để chỉnh sửa hoặc chữa những phần bị lỗi trong video sẵn có theo yêu cầu của người dùng.

Google Research so sánh hiệu năng của Lumiere với các AI tạo video từ văn bản hiện nay, như ImagenVideo, Pika, ZeroScope và Gen2, bằng cách đề nghị một nhóm thử nghiệm chọn ra video có chất lượng hình ảnh và chuyển động tốt nhất, nhưng không cho biết chúng được tạo ra bởi mô hình nào. Theo báo cáo, Lumiere vượt xa mọi đối thủ trong thử nghiệm.

Hiện tại, mô hình này vẫn chưa được ra mắt công chúng; tuy nhiên, nếu bạn muốn tìm hiểu thêm, bạn có thể truy cập trang web Lumiere, nơi có nhiều bản demo khi mô hình thực hiện các nhiệm vụ khác nhau.

Theo ZD Net

Đọc thêm

Người dùng nhiều sim phải xác thực tất cả các số đang sử dụng

Người dùng nhiều sim phải xác thực tất cả các số đang sử dụng

Trong lộ trình triển khai các quy định mới về quản lý viễn thông, hàng loạt thuê bao di động đang bước vào giai đoạn rà soát và xác thực thông tin bắt buộc. Đáng chú ý, việc xác thực hiện nay không chỉ giới hạn ở một số điện thoại chính mà yêu cầu người dân phải xác thực cả số thuê bao đang sở hữu nhằm bảo vệ quyền lợi.
Facebook bắt đầu thu phí

Facebook bắt đầu thu phí

Không phải chặn quảng cáo, các gói trả phí mới trên Instagram, Facebook và WhatsApp bổ sung nhiều tính năng nâng cao.
Lý do người dùng từ bỏ Microsoft Word

Lý do người dùng từ bỏ Microsoft Word

Microsoft Word vẫn là phần mềm soạn thảo phổ biến nhất thế giới, song ngày càng nhiều người dùng cho rằng nó gây ra phiền toái hơn hỗ trợ công việc.
Các đổi mật khẩu Wi-Fi chỉ trong tích tắc

Các đổi mật khẩu Wi-Fi chỉ trong tích tắc

Wi-Fi chậm, dễ mất kết nối hay có người lạ dùng là lúc bạn nên đổi mật khẩu để mạng ổn định hơn. Dưới đây là cách đổi Wi-Fi bằng điện thoại đơn giản, nhanh chóng.
Cách tắt giới hạn ứng dụng trên iPhone cho mọi phiên bản iOS

Cách tắt giới hạn ứng dụng trên iPhone cho mọi phiên bản iOS

Screen Time là một tính năng hữu ích giúp người dùng kiểm soát việc sử dụng điện thoại và xây dựng thói quen công nghệ lành mạnh. Việc hiểu rõ cách tắt giới hạn ứng dụng trên iPhone sẽ giúp bạn linh hoạt điều chỉnh thiết bị theo nhu cầu cá nhân.
Cách quay video 2 camera cùng lúc trên Android

Cách quay video 2 camera cùng lúc trên Android

Nhiều dòng điện thoại Android hiện nay đã hỗ trợ tính năng quay video 2 camera cùng lúc, giúp bạn ghi lại cả camera trước và sau trong cùng một khung hình cực kỳ tiện lợi.
Chi tiết mới lạ trên Galaxy Z TriFold 2

Chi tiết mới lạ trên Galaxy Z TriFold 2

Rò rỉ bằng sáng chế cho thấy Samsung đang nghiên cứu Galaxy Z TriFold 2 với khe cất bút S Pen được giấu trong bản lề, giải quyết điểm yếu lớn nhất của dòng điện thoại gập.
Apple sắp định nghĩa lại iPhone

Apple sắp định nghĩa lại iPhone

Apple đang chuẩn bị cho dự án mang tên "Glasswing" nhằm lột xác hoàn toàn iPhone 20, với thiết kế toàn kính và loại bỏ toàn bộ nút bấm vật lý.
Xin chào,
Tôi là Chatbot của
Báo Hà Tĩnh
Hãy hỏi tôi bất kỳ điều gì bạn cần biết về
Báo Hà Tĩnh nhé. Tôi sẵn sàng hỗ trợ!