Google Research đã phát hành một bài giới thiệu về Lumiere, một mô hình chuyển từ văn bản sang video.
Ảnh: ZD Net
Kể từ khi OpenAI phát hành DALL-E vào cuối năm 2022, các trình tạo văn bản thành hình ảnh đã trở nên bùng nổ với rất nhiều đối thủ cạnh tranh gia nhập thị trường. Giờ đây, hơn một năm sau, chúng ta đang ở những ngày đầu của một công nghệ mới: tạo video AI.
Mới đây, Google Research đã phát hành một bài giới thiệu về Lumiere, một mô hình chuyển từ văn bản sang video có thể tạo ra video sở hữu độ chân thực cao từ lời nhắc văn bản và các hình ảnh khác.
Theo bài viết, mô hình này được thiết kế để giải quyết một thách thức đáng kể trong việc tổng hợp video, đó là tạo ra “chuyển động chân thực, đa dạng và mạch lạc”. Bạn có thể nhận thấy các mô hình tạo video thường hiển thị video bị giật nhưng cách tiếp cận của Google mang lại trải nghiệm xem liền mạch hơn. Lumiere làm được điều đó thông qua kiến trúc Space-Time U-Net, trong đó tạo ra video hoàn chỉnh từ đầu đến cuối chỉ trong một lần chạy.
Phương thức này khác với những mô hình trước đây, vốn chỉ tổng hợp những khoảnh khắc chính và cách xa nhau, khiến video cuối cùng khó đạt được sự đồng nhất.
Lumiere có thể xây dựng phong cách riêng cho video, dựa trên hình ảnh mẫu do người dùng cung cấp. Ngoài tạo nội dung mới, nó cũng được dùng để chỉnh sửa hoặc chữa những phần bị lỗi trong video sẵn có theo yêu cầu của người dùng.
Google Research so sánh hiệu năng của Lumiere với các AI tạo video từ văn bản hiện nay, như ImagenVideo, Pika, ZeroScope và Gen2, bằng cách đề nghị một nhóm thử nghiệm chọn ra video có chất lượng hình ảnh và chuyển động tốt nhất, nhưng không cho biết chúng được tạo ra bởi mô hình nào. Theo báo cáo, Lumiere vượt xa mọi đối thủ trong thử nghiệm.
Hiện tại, mô hình này vẫn chưa được ra mắt công chúng; tuy nhiên, nếu bạn muốn tìm hiểu thêm, bạn có thể truy cập trang web Lumiere, nơi có nhiều bản demo khi mô hình thực hiện các nhiệm vụ khác nhau.
Theo báo Liberation của Pháp, trong những năm gần đây, trí tuệ nhân tạo (AI) được ca ngợi như một công cụ giúp tăng năng suất và giải phóng con người khỏi các công việc lặp lại. Tuy nhiên, đằng sau những lời hứa hẹn đó, ngày càng nhiều người lao động trong lĩnh vực công nghệ - từ nhà thiết kế, lập trình viên đến kỹ sư - đang phải đối mặt với một thực tế khác: Mệt mỏi nhận thức, “sương mù não” và nguy cơ kiệt sức nghề nghiệp gia tăng.
Một nghiên cứu quy mô lớn xác nhận hiện có tới 35% số website mới lập được tạo ra bởi các công cụ AI. Đáng chú ý, vào tháng 8/2022, tỷ lệ này gần như là số 0.
Việc bỗng nhiên đánh rơi hay để quên chiếc điện thoại iPhone đắt giá khiến nhiều người lo lắng. Nhiều người không biết làm sao để tìm iPhone bị mất khi tắt nguồn.
GPT Image 2 của OpenAI có thể tạo ảnh chụp màn hình, lịch sử chuyển khoản và ảnh người nổi tiếng chân thực đến mức không thể phân biệt, làm dấy lên làn sóng tin giả trên mạng xã hội.
Muốn xem nhật ký Zalo, bạn chỉ cần nhấn biểu tượng đồng hồ trên điện thoại. Với PC hoặc web, cần dùng giả lập Android để truy cập và quản lý quyền riêng tư.
Phần lớn người dùng quan tâm tới tốc độ gói cước, thường được thể hiện bằng chỉ số Mbps. Tuy nhiên, ngoài tốc độ, còn nhiều yếu tố khác ảnh hưởng đến chất lượng và giá trị của dịch vụ.
Nhiều quốc gia đang tăng cường kiểm soát việc sử dụng mạng xã hội của trẻ vị thành niên, song hiệu quả và tính khả thi của các biện pháp này vẫn đang gây tranh cãi.
Chủ động đầu tư hạ tầng công nghệ, triển khai lực lượng hỗ trợ rộng khắp và mở rộng nhiều điểm phục vụ trên toàn quốc, Viettel đang tạo điều kiện để khách hàng thực hiện xác thực thông tin thuê bao theo quy định, bảo vệ SIM chính chủ và hạn chế nguy cơ gián đoạn liên lạc.
Đồng bộ danh bạ trên Messenger giúp bạn dễ dàng tìm và kết nối với bạn bè, nhưng đôi khi lại gây phiền khi hiển thị quá nhiều liên hệ không cần thiết. Nếu muốn kiểm soát danh sách này tốt hơn, bạn hoàn toàn có thể tắt tính năng đồng bộ.
Từ ngày 15/4/2026, quy định xác thực sinh trắc học khuôn mặt đối với thuê bao di động của Bộ Khoa học và Công nghệ chính thức có hiệu lực. Với các thuê bao đã sử dụng số điện thoại để đăng ký tài khoản VNeID mức độ 2 hoặc đã xác thực bằng căn cước công dân gắn chip sẽ không phải thực hiện xác thực lại, trừ trường hợp có thay đổi thiết bị từ ngày 15/6.
Điều tra của New Yorker dựa trên khoảng 200 trang tài liệu nội bộ và hơn 100 cuộc phỏng vấn kết luận Sam Altman liên tục nói dối và ưu tiên quyền lực hơn an toàn AI.
Vì một lý do nào đó mà bạn muốn tìm lại những cuộc trò chuyện đã bị ẩn trên tài khoản Zalo nhưng lại không nhớ tên người liên hệ? Điều này khiến nhiều người gặp khó khăn khi muốn mở lại tin nhắn để xem nội dung cũ.
Apple dự kiến ra mắt iPhone Ultra màn hình gập vào năm 2026 với mức giá vượt ngưỡng 2.000 USD, đánh dấu bước ngoặt mới trong phân khúc smartphone siêu cao cấp.
Nếu bạn quên mật khẩu cũ và không biết cách đổi mật khẩu Facebook, đừng quá lo lắng. Bài viết sẽ hướng dẫn chi tiết cách đặt lại mật khẩu và khôi phục quyền truy cập tài khoản trên máy tính hoặc iPhone.
Dù sở hữu thông số camera ấn tượng, cách phân bổ cảm biến của Samsung trên dòng Galaxy Ultra đang bộc lộ nhiều hạn chế về trải nghiệm thực tế và hiệu suất vận hành.
Xin chào, Tôi là Chatbot của Báo Hà Tĩnh
Hãy hỏi tôi bất kỳ điều gì bạn cần biết về Báo Hà Tĩnh nhé. Tôi sẵn sàng hỗ trợ!