Nhân bản giọng nói bằng AI - mô hình kinh doanh mới ở Hollywood

Một mô hình kinh doanh mới đang hình thành khi những ngôi sao thời hoàng kim của Hollywood được “tái sinh” thông qua các hợp đồng nhân bản giọng nói của người nổi tiếng bằng trí tuệ nhân tạo (AI).

elevenlabs-ai.jpg

Công ty khởi nghiệp về công nghệ âm thanh ElevenLabs đã ký nhiều thỏa thuận với các diễn viên huyền thoại như Burt Reynolds, Judy Garland, James Dean và Sir Laurence Olivier, và sử dụng công cụ Iconic Voices của mình nhân bản giọng nói của họ, cho phép người dùng chọn nghe giọng đọc AI của những người nổi tiếng trên ứng dụng sách nói.

ElevenLabs, được các công ty đầu tư mạo hiểm Andreessen Horowitz và Sequoia tài trợ, ra đời năm 2023. ElevenLabs đã tạo ra âm thanh cho sách và các bài báo, nhân vật trò chơi điện tử, phương tiện truyền thông xã hội và quảng cáo. Công ty đã làm việc với các nhà xuất bản như New York Times và Washington Post và đầu năm nay đã được Disney lựa chọn tham gia chương trình của hãng này.

Ông Sam Sklar, thành viên của nhóm phát triển ElevenLabs, cho biết: “Cần khoảng 30 phút âm thanh chất lượng cao để tạo bản sao giọng nói chuyên nghiệp”. Sau khi được tạo, giọng nói AI có thể được chọn để đọc văn bản (bài viết, PDF, ePub, bản tin hoặc nội dung văn bản khác). Tuy nhiên, không thể trích xuất giọng nói và nội dung trong một ứng dụng đọc. Ví dụ, người dùng có thể có các bài báo đọc bằng giọng của James Dean trong ứng dụng, nhưng không thể tiếp cận giọng nói này cho bất cứ nội dung nào chưa có trong ứng dụng.

Các thỏa thuận trên giúp thiết lập ranh giới cho tương lai, cho phép kiểm soát, quản lý tốt hơn các nội dung giọng nói do AI tạo ra. Động thái trên rất quan trọng trong bối cảnh có nhiều lo ngại AI sử dụng trái phép giọng nói của người nổi tiếng, nhất là sau vụ nữ diễn viên Scarlett Johansson cáo buộc OpenAI ăn cắp giọng nói của cô.

Hiện tại nhiều diễn viên, nhất là diễn viên lồng tiếng, vẫn lo ngại về việc sử dụng AI để tạo nội dung giọng nói. Một số người từ chối xem xét bất kỳ thỏa thuận nào trong lĩnh vực này. Tuy nhiên, một số người khác cho rằng không nên bỏ qua cơ hội sao chép giọng nói của họ để sản xuất nhanh hơn, rẻ hơn trên một số dạng sách nói.

Các mô hình tạo giọng gần đây đã cho thấy những tiến bộ đáng kể so với các phiên bản trước đó, khiến việc phân biệt giọng nói giả và giọng thật trở nên ngày càng khó khăn. Cấp phép giọng nói AI có thể giảm bớt khối lượng công việc cho diễn viên lồng tiếng mà không thay thế họ, vì họ can thiệp vào quá trình này bằng cách tập trung vào việc cung cấp bản sửa lỗi hoặc cải thiện các khía cạnh không thể diễn tả được như ngữ điệu, độ ấm và sự nhấn mạnh - những yếu tố vẫn còn nhiều thách thức.

AI chỉ tốt khi các mô hình được đào tạo tốt, và bộ dữ liệu giọng nói của diễn viên trở thành một phần của quá trình này. Ông Nauman Dawalatabad tại Phòng thí nghiệm Khoa học máy tính và Trí tuệ nhân tạo MIT có nhiều nghiên cứu sâu rộng về tạo giọng nói AI, cho biết: “Việc truyền tải giọng nói của các ngôi sao điện ảnh có thể bổ sung cho khả năng học của AI bằng cách cung cấp các bộ dữ liệu giọng nói chất lượng cao để đào tạo và tinh chỉnh các mô hình lớn”.

Báo Tin tức

Đọc thêm

Con người quay lại Mặt trăng để làm gì?

Con người quay lại Mặt trăng để làm gì?

Bên cạnh sứ mệnh đưa con người trở lại quỹ đạo Mặt trăng, vụ phóng Artemis II còn là bài sát hạch khắc nghiệt quyết định liệu nhân loại có thể đặt chân lên sao Hỏa hay không.
Sẵn sàng vận hành ứng dụng i-HaTinh

Sẵn sàng vận hành ứng dụng i-HaTinh

Trung tâm Khoa học công nghệ (KHCN) và Chuyển đổi số (Sở KH&CN Hà Tĩnh) đã sẵn sàng vận hành ứng dụng Công dân số i-HaTinh tích hợp nền tảng phản ánh hiện trường.
Nhà khoa học Mỹ: “VinFuture đưa đóng góp của phụ nữ khoa học ra ánh sáng toàn cầu”

Nhà khoa học Mỹ: “VinFuture đưa đóng góp của phụ nữ khoa học ra ánh sáng toàn cầu”

Phụ nữ làm lãnh đạo trong khoa học không nên được nhìn nhận như một “ngoại lệ”, càng không phải là điều gây ngạc nhiên. Theo TS. Jayshree Seth, Nhà khoa học Doanh nghiệp tại Tập đoàn 3M (Mỹ) và thành viên Hội đồng Sơ khảo Giải thưởng VinFuture, điều đó đơn giản là trạng thái tự nhiên của thời đại.
Nơi nào nhiều vàng nhất?

Nơi nào nhiều vàng nhất?

Trái Đất đang “cất giấu” khoảng 1,6 triệu tỷ tấn vàng, đủ để phủ kín bề mặt hành tinh bằng một lớp kim loại quý dày 50 cm nhưng kho báu này lại nằm ngoài tầm với của con người.
Trung Quốc công bố 'chip dạng sợi' mỏng như tóc

Trung Quốc công bố 'chip dạng sợi' mỏng như tóc

Theo SCMP, các nhà khoa học Trung Quốc vừa tạo ra một bước đột phá trong công nghệ điện tử khi tích hợp thành công các mạch điện tử phức tạp vào những sợi dây dẻo, co giãn và mỏng như sợi tóc con người.
Có gì trong phần mềm "Trợ lý ảo AI đa lĩnh vực”?

Có gì trong phần mềm "Trợ lý ảo AI đa lĩnh vực”?

Dự án Trợ lý ảo AI đa lĩnh vực đã giành giải Nhất Cuộc thi Khởi nghiệp đổi mới sáng tạo Hà Tĩnh năm 2025, góp phần thúc đẩy chuyển đổi số và nâng cao hiệu quả phục vụ người dân, doanh nghiệp.