"Nút thắt cổ chai" đe dọa Google, Meta

Dữ liệu văn bản do con người tạo ra ngày càng cạn kiệt, trở thành mối đe dọa nghiêm trọng với các công ty đang chạy đua AI như Google, Meta.

Fortune dẫn kết quả của nhóm nghiên cứu Epoch công bố ngày 6/6 rằng đến năm 2026-2032, các công ty sẽ hết dữ liệu để đào tạo AI. AI tạo sinh (GenAI) đang được ví như "cơn sốt vàng", việc chạy đua khai thác khiến nguồn dữ liệu do con người tạo ra, vốn hữu hạn, lại càng cạn kiệt.

Trong ngắn hạn, các công ty như OpenAI và Google đang tìm mọi cách để bảo vệ nguồn tài nguyên của mình, thậm chí trả tiền để tiếp cận dữ liệu chất lượng cao cho đào tạo AI.

CEO OpenAI Sam Altman (trái) và CEO Microsoft Satya Nadella tại một sự kiện của OpenAI hồi tháng 6/2023. Ảnh: CNBC
CEO OpenAI Sam Altman (trái) và CEO Microsoft Satya Nadella tại một sự kiện của OpenAI hồi tháng 6/2023. Ảnh: CNBC

Tamay Besiroglu, tác giả chính của nghiên cứu, lưu ý về lâu dài sẽ không đủ các bài viết, blog, tin tức và bình luận mới trên mạng xã hội để duy trì quỹ đạo phát triển hiện tại của AI. Khi một số thông tin liên quan đến email, văn bản được dán nhãn nhạy cảm hoặc riêng tư, "nút thắt cổ chai" của ngành sẽ hình thành.

"Nếu gặp hạn chế về lượng dữ liệu, bạn sẽ không thể mở rộng các mô hình AI một cách hiệu quả", Besiroglu nhận định. Một số nghiên cứu chỉ ra dữ liệu chất lượng cao dưới dạng văn bản sẽ không đủ để "nuôi" cỗ máy AI vào 2026. Khi đó, các công ty như OpenAI, Google, Meta, Microsoft sẽ gặp thách thức lớn trong cuộc đua AI.

Tuy nhiên, không phải ai cũng đồng ý với "nút thắt cổ chai" của ngành AI. Nicolas Papernot, phó giáo sư về kỹ thuật máy tính tại Đại học Toronto, nói: "Tôi nghĩ điều quan trọng cần lưu ý là chúng ta không nhất thiết phải đào tạo các mô hình ngày càng lớn hơn. Chúng ta có thể xây dựng những hệ thống AI chuyên cho các nhiệm vụ cụ thể".

Nhưng Papernot cũng chung lo ngại về việc đào tạo nhiều hệ thống AI trên cùng một kho dữ liệu có thể khiến hiệu suất mô hình bị giảm nghiêm trọng, dẫn đến "sụp đổ mô hình". Hơn nữa, việc đào tạo AI dựa trên chính dữ liệu do chúng tạo ra có thể khoét sâu vào những sai lầm của trí tuệ nhân tạo liên quan đến phân biệt chủng tộc, sai lệch thông tin.

Selena Deckelmann, Giám đốc sản phẩm và công nghệ của Wikipedia, nói: "Có một điểm thú vị là con người đang tạo ra một dạng tài nguyên mới - dữ liệu. Trong khi một số người tìm cách loại bỏ dữ liệu của mình khỏi chương trình đào tạo AI, tại Wikipedia chúng tôi đặt ra một số hạn chế đối với cách các công ty sử dụng nội dung do con người biên soạn. Đây sẽ là một trong những cách thức để giữ các tình nguyện viên tiếp tục đóng bài viết chất lượng cao". Deckelmann lưu ý điều các công ty AI nên lo lắng lúc này là làm sao để nội dung do con người tạo ra tiếp tục tồn tại và họ có quyền truy cập kho dữ liệu đó.

Tuy nhiên, nhóm nghiên cứu Epoch cho rằng việc các công ty trả tiền cho hàng triệu người tạo văn bản không chắc sẽ giúp tiết kiệm tiền. OpenAI đang có cách tiếp cận mới, tại một sự kiện của Liên Hợp Quốc vào tháng trước, CEO Sam Altman tuyên bố dùng dữ liệu tổng hợp để đào tạo AI. Dữ liệu tổng hợp ở đây được hiểu là cả nội dung do con người lẫn AI viết ra, trong đó có cả kho nội dung kém chất lượng.

Altman không phủ nhận điều này. Ông cho rằng các công ty như OpenAI buộc phải cân nhắc về việc phụ thuộc quá nhiều vào dữ liệu, thay vì tìm cách cải thiện mô hình AI. Ông nói: "Sẽ có những điều rất kỳ lại xảy ra nếu đào tạo mô hình AI dựa trên kho dữ liệu tổng hợp. Không chắc chắn sáng kiến này có đem lại hiệu quả tốt".

vnexpress.net

Đọc thêm

Đây là dấu hiệu bạn cần thay pin iPhone

Đây là dấu hiệu bạn cần thay pin iPhone

Pin iPhone xuống cấp theo thời gian, song không phải ai cũng nhận ra đúng lúc để thay thế linh kiện. Đây là 9 dấu hiệu cho thấy đã đến lúc thay pin thay vì mua máy mới.
Quyết liệt thực hiện các nhiệm vụ phát triển KHCN, đổi mới sáng tạo và chuyển đổi số

Quyết liệt thực hiện các nhiệm vụ phát triển KHCN, đổi mới sáng tạo và chuyển đổi số

Đồng chí Nguyễn Duy Lâm - Ủy viên BCH Trung ương Đảng, Bí thư Tỉnh ủy Hà Tĩnh đề nghị người đứng đầu các địa phương, cơ quan, đơn vị phải trực tiếp chỉ đạo, chịu trách nhiệm về kết quả thực hiện các nhiệm vụ về phát triển khoa học công nghệ, đổi mới sáng tạo và chuyển đổi số.
Cách tìm ứng dụng bị ẩn trên Samsung

Cách tìm ứng dụng bị ẩn trên Samsung

Trong quá trình sử dụng điện thoại Samsung, đôi khi bạn vô tình ẩn một ứng dụng và đến lúc cần dùng lại thì không biết nó đang nằm ở đâu. Ứng dụng không xuất hiện ngoài màn hình chính hay trong danh sách app có thể khiến nhiều người nhầm tưởng đã bị xóa.
Đừng để bị ChatGPT qua mặt

Đừng để bị ChatGPT qua mặt

Nghiên cứu từ Đại học Stanford cảnh báo các mô hình AI đang cố tình nịnh bợ người dùng để được đánh giá cao, gây nguy cơ triệt tiêu tư duy phản biện.
Khánh thành Trung tâm Vũ trụ Việt Nam

Khánh thành Trung tâm Vũ trụ Việt Nam

Trung tâm Vũ trụ Việt Nam được khánh thành tại Khu công nghệ cao Hòa Lạc, sở hữu hệ thống mặt đất với anten đường kính 9,3m, trung tâm R&D vệ tinh.
Mẹo giúp tăng "tuổi thọ" pin laptop

Mẹo giúp tăng "tuổi thọ" pin laptop

Chỉ cần một vài thay đổi nhỏ trong thói quen sử dụng, bạn hoàn toàn có thể kéo dài tuổi thọ pin laptop đáng kể, đảm bảo thiết bị luôn hoạt động bền bỉ và ổn định.
Hướng dẫn cách copy sheet trong Excel nhanh chóng

Hướng dẫn cách copy sheet trong Excel nhanh chóng

Bạn muốn biết cách copy sheet trong Excel nhanh để tiết kiệm thời gian? Chỉ với vài thao tác đơn giản, bạn có thể sao chép một hoặc nhiều sheet mà vẫn giữ nguyên định dạng ban đầu.
Sẵn sàng vận hành ứng dụng i-HaTinh

Sẵn sàng vận hành ứng dụng i-HaTinh

Trung tâm Khoa học công nghệ (KHCN) và Chuyển đổi số (Sở KH&CN Hà Tĩnh) đã sẵn sàng vận hành ứng dụng Công dân số i-HaTinh tích hợp nền tảng phản ánh hiện trường.
Nhà khoa học Mỹ: “VinFuture đưa đóng góp của phụ nữ khoa học ra ánh sáng toàn cầu”

Nhà khoa học Mỹ: “VinFuture đưa đóng góp của phụ nữ khoa học ra ánh sáng toàn cầu”

Phụ nữ làm lãnh đạo trong khoa học không nên được nhìn nhận như một “ngoại lệ”, càng không phải là điều gây ngạc nhiên. Theo TS. Jayshree Seth, Nhà khoa học Doanh nghiệp tại Tập đoàn 3M (Mỹ) và thành viên Hội đồng Sơ khảo Giải thưởng VinFuture, điều đó đơn giản là trạng thái tự nhiên của thời đại.
Cách ngăn người lạ gửi tin nhắn trên TikTok

Cách ngăn người lạ gửi tin nhắn trên TikTok

Khi sử dụng TikTok, bạn có thể gặp phải những tin nhắn không mong muốn từ người lạ. TikTok cung cấp các công cụ để người dùng kiểm soát quyền riêng tư và chặn những tin nhắn gây phiền toái.