Google Research đã phát hành một bài giới thiệu về Lumiere, một mô hình chuyển từ văn bản sang video.
Ảnh: ZD Net
Kể từ khi OpenAI phát hành DALL-E vào cuối năm 2022, các trình tạo văn bản thành hình ảnh đã trở nên bùng nổ với rất nhiều đối thủ cạnh tranh gia nhập thị trường. Giờ đây, hơn một năm sau, chúng ta đang ở những ngày đầu của một công nghệ mới: tạo video AI.
Mới đây, Google Research đã phát hành một bài giới thiệu về Lumiere, một mô hình chuyển từ văn bản sang video có thể tạo ra video sở hữu độ chân thực cao từ lời nhắc văn bản và các hình ảnh khác.
Theo bài viết, mô hình này được thiết kế để giải quyết một thách thức đáng kể trong việc tổng hợp video, đó là tạo ra “chuyển động chân thực, đa dạng và mạch lạc”. Bạn có thể nhận thấy các mô hình tạo video thường hiển thị video bị giật nhưng cách tiếp cận của Google mang lại trải nghiệm xem liền mạch hơn. Lumiere làm được điều đó thông qua kiến trúc Space-Time U-Net, trong đó tạo ra video hoàn chỉnh từ đầu đến cuối chỉ trong một lần chạy.
Phương thức này khác với những mô hình trước đây, vốn chỉ tổng hợp những khoảnh khắc chính và cách xa nhau, khiến video cuối cùng khó đạt được sự đồng nhất.
Lumiere có thể xây dựng phong cách riêng cho video, dựa trên hình ảnh mẫu do người dùng cung cấp. Ngoài tạo nội dung mới, nó cũng được dùng để chỉnh sửa hoặc chữa những phần bị lỗi trong video sẵn có theo yêu cầu của người dùng.
Google Research so sánh hiệu năng của Lumiere với các AI tạo video từ văn bản hiện nay, như ImagenVideo, Pika, ZeroScope và Gen2, bằng cách đề nghị một nhóm thử nghiệm chọn ra video có chất lượng hình ảnh và chuyển động tốt nhất, nhưng không cho biết chúng được tạo ra bởi mô hình nào. Theo báo cáo, Lumiere vượt xa mọi đối thủ trong thử nghiệm.
Hiện tại, mô hình này vẫn chưa được ra mắt công chúng; tuy nhiên, nếu bạn muốn tìm hiểu thêm, bạn có thể truy cập trang web Lumiere, nơi có nhiều bản demo khi mô hình thực hiện các nhiệm vụ khác nhau.
Trong quá trình sử dụng Google Drive, nhiều người thường gặp khó khăn khi tải xuống các tệp có dung lượng lớn do không thể xem trước nội dung. Điều này có thể gây bất tiện, đặc biệt khi bạn cần tải tài liệu nhanh chóng mà không có lựa chọn kiểm tra sơ bộ.
Trang trí iPhone giúp máy đẹp hơn và thể hiện cá tính. Với mẹo đổi hình nền, sắp xếp ứng dụng và dùng theme miễn phí, bạn dễ dàng tạo giao diện gọn gàng, độc đáo.
Cách kết nối máy tính với tivi không dây giúp việc phản chiếu màn hình, truyền video, hình ảnh, tài liệu,… từ máy tính sang tivi trở nên cực kỳ đơn giản và tiện lợi.
Trong quá trình sử dụng, những vấn đề chúng ta thường gặp ở “dế yêu” của mình là điện thoại bị nóng và nhanh hết pin. Tình trạng này xảy ra khiến nguời dùng không khỏi lo lắng.
Một dự báo mới cho thấy chiếc iPhone màn hình gập đầu tiên của Apple sẽ có mức giá rất cao, cùng phân khúc với dòng laptop đắt nhất của hãng là MacBook Pro 16 inch.
Tài khoản Zalo bị vô hiệu hoá là vấn đề khiến nhiều người dùng lo lắng vì ảnh hưởng trực tiếp đến liên lạc, công việc và bảo mật cá nhân. Việc hiểu rõ nguyên nhân, dấu hiệu nhận biết và hướng xử lý kịp thời sẽ giúp bạn giảm thiểu rủi ro và phục hồi quyền truy cập nhanh chóng.
Những thay đổi chưa từng có trong lộ trình ra mắt sản phẩm của Apple được dự báo sẽ đặt người dùng vào thế khó khi cân nhắc nâng cấp lên thế hệ iPhone 18.
AI đang được nhiều người trẻ sử dụng để tìm kiếm thông tin, để giãi bày và được động viên tinh thần. Tuy nhiên điều này có thể dẫn tới việc người dùng sẽ bị "lệ thuộc cảm xúc" vào máy móc.
Lấy lại nhật ký cuộc gọi đã xóa trên iPhone giúp khôi phục nhanh số điện thoại, thời gian và lịch sử liên lạc quan trọng. Xem ngay cách thực hiện đơn giản sau đây
Quy tụ gần 750 doanh nghiệp trong và ngoài nước, Tuần lễ Công nghiệp và Công nghệ Việt Nam 2025 trở thành sàn diễn hội tụ của thế hệ máy móc và công nghệ sản xuất hiện đại.
Nhờ có Apple Intelligence, các thao tác trên iPhone trở nên thông minh và tiện lợi hơn rất nhiều, kể cả việc dịch văn bản. Bạn không cần cài thêm ứng dụng hỗ trợ, chỉ với vài thao tác là iPhone có thể hiểu và dịch nội dung nhanh chóng, tự nhiên và chính xác.
Rạng sáng 13/11 (giờ Việt Nam), hàng loạt dịch vụ như công cụ tìm kiếm Google Search, dịch vụ lưu trữ Google Drive hay bộ ứng dụng văn phòng Google Docs và Google Sheets, đã gặp tình trạng gián đoạn.
Thói quen sạc pin điện thoại tưởng chừng đơn giản, nhưng nhiều người thường bỏ qua một hiện tượng quan trọng là quá nhiệt bộ sạc. Đây không chỉ là phản ứng vật lý bình thường mà đôi khi còn là lời cảnh báo về chất lượng phụ kiện, hoặc thói quen sử dụng đang âm thầm gây hại cho pin và thiết bị của bạn.
Nhờ Apple Intelligence, iPhone nay thông minh hơn với khả năng dịch văn bản cực nhanh và chính xác. Không cần cài thêm ứng dụng, bạn có thể dịch mọi nội dung chỉ với vài thao tác đơn giản.
Không phải ai cũng biết iPhone đã tích hợp sẵn tính năng chụp ảnh kèm định vị. Nhờ công cụ này, mỗi bức hình không chỉ lưu lại khoảnh khắc, mà còn đi kèm tọa độ và thời gian chụp.
Camera không hoạt động trên Google Chrome máy tính có thể gây phiền toái, đặc biệt khi bạn cần tham gia các cuộc họp trực tuyến, học online, hoặc thực hiện video call.
Nút Wifi không bật được trên iPhone khiến bạn không thể kết nối mạng và sử dụng các ứng dụng yêu thích. Tình trạng này không chỉ gây gián đoạn trải nghiệm mà còn khiến nhiều người lo lắng không biết thiết bị của mình đang gặp vấn đề gì.