"Nút thắt cổ chai" đe dọa Google, Meta

Dữ liệu văn bản do con người tạo ra ngày càng cạn kiệt, trở thành mối đe dọa nghiêm trọng với các công ty đang chạy đua AI như Google, Meta.

Fortune dẫn kết quả của nhóm nghiên cứu Epoch công bố ngày 6/6 rằng đến năm 2026-2032, các công ty sẽ hết dữ liệu để đào tạo AI. AI tạo sinh (GenAI) đang được ví như "cơn sốt vàng", việc chạy đua khai thác khiến nguồn dữ liệu do con người tạo ra, vốn hữu hạn, lại càng cạn kiệt.

Trong ngắn hạn, các công ty như OpenAI và Google đang tìm mọi cách để bảo vệ nguồn tài nguyên của mình, thậm chí trả tiền để tiếp cận dữ liệu chất lượng cao cho đào tạo AI.

CEO OpenAI Sam Altman (trái) và CEO Microsoft Satya Nadella tại một sự kiện của OpenAI hồi tháng 6/2023. Ảnh: CNBC
CEO OpenAI Sam Altman (trái) và CEO Microsoft Satya Nadella tại một sự kiện của OpenAI hồi tháng 6/2023. Ảnh: CNBC

Tamay Besiroglu, tác giả chính của nghiên cứu, lưu ý về lâu dài sẽ không đủ các bài viết, blog, tin tức và bình luận mới trên mạng xã hội để duy trì quỹ đạo phát triển hiện tại của AI. Khi một số thông tin liên quan đến email, văn bản được dán nhãn nhạy cảm hoặc riêng tư, "nút thắt cổ chai" của ngành sẽ hình thành.

"Nếu gặp hạn chế về lượng dữ liệu, bạn sẽ không thể mở rộng các mô hình AI một cách hiệu quả", Besiroglu nhận định. Một số nghiên cứu chỉ ra dữ liệu chất lượng cao dưới dạng văn bản sẽ không đủ để "nuôi" cỗ máy AI vào 2026. Khi đó, các công ty như OpenAI, Google, Meta, Microsoft sẽ gặp thách thức lớn trong cuộc đua AI.

Tuy nhiên, không phải ai cũng đồng ý với "nút thắt cổ chai" của ngành AI. Nicolas Papernot, phó giáo sư về kỹ thuật máy tính tại Đại học Toronto, nói: "Tôi nghĩ điều quan trọng cần lưu ý là chúng ta không nhất thiết phải đào tạo các mô hình ngày càng lớn hơn. Chúng ta có thể xây dựng những hệ thống AI chuyên cho các nhiệm vụ cụ thể".

Nhưng Papernot cũng chung lo ngại về việc đào tạo nhiều hệ thống AI trên cùng một kho dữ liệu có thể khiến hiệu suất mô hình bị giảm nghiêm trọng, dẫn đến "sụp đổ mô hình". Hơn nữa, việc đào tạo AI dựa trên chính dữ liệu do chúng tạo ra có thể khoét sâu vào những sai lầm của trí tuệ nhân tạo liên quan đến phân biệt chủng tộc, sai lệch thông tin.

Selena Deckelmann, Giám đốc sản phẩm và công nghệ của Wikipedia, nói: "Có một điểm thú vị là con người đang tạo ra một dạng tài nguyên mới - dữ liệu. Trong khi một số người tìm cách loại bỏ dữ liệu của mình khỏi chương trình đào tạo AI, tại Wikipedia chúng tôi đặt ra một số hạn chế đối với cách các công ty sử dụng nội dung do con người biên soạn. Đây sẽ là một trong những cách thức để giữ các tình nguyện viên tiếp tục đóng bài viết chất lượng cao". Deckelmann lưu ý điều các công ty AI nên lo lắng lúc này là làm sao để nội dung do con người tạo ra tiếp tục tồn tại và họ có quyền truy cập kho dữ liệu đó.

Tuy nhiên, nhóm nghiên cứu Epoch cho rằng việc các công ty trả tiền cho hàng triệu người tạo văn bản không chắc sẽ giúp tiết kiệm tiền. OpenAI đang có cách tiếp cận mới, tại một sự kiện của Liên Hợp Quốc vào tháng trước, CEO Sam Altman tuyên bố dùng dữ liệu tổng hợp để đào tạo AI. Dữ liệu tổng hợp ở đây được hiểu là cả nội dung do con người lẫn AI viết ra, trong đó có cả kho nội dung kém chất lượng.

Altman không phủ nhận điều này. Ông cho rằng các công ty như OpenAI buộc phải cân nhắc về việc phụ thuộc quá nhiều vào dữ liệu, thay vì tìm cách cải thiện mô hình AI. Ông nói: "Sẽ có những điều rất kỳ lại xảy ra nếu đào tạo mô hình AI dựa trên kho dữ liệu tổng hợp. Không chắc chắn sáng kiến này có đem lại hiệu quả tốt".

vnexpress.net

Đọc thêm

Mức giá khó tin của iPhone gập

Mức giá khó tin của iPhone gập

Một dự báo mới cho thấy chiếc iPhone màn hình gập đầu tiên của Apple sẽ có mức giá rất cao, cùng phân khúc với dòng laptop đắt nhất của hãng là MacBook Pro 16 inch.
Những trí tuệ hàng đầu chung tay tìm lời giải cho tương lai bền vững của hành tinh

Những trí tuệ hàng đầu chung tay tìm lời giải cho tương lai bền vững của hành tinh

Biến đổi khí hậu với những hiện tượng khí tượng cực đoan, suy giảm tài nguyên và áp lực lên hệ sinh thái đang đặt ra yêu cầu tái định hình các mô hình phát triển bền vững dựa trên khoa học và công nghệ. Những chủ đề trọng yếu này sẽ là nội dung thảo luận tại tọa đàm “Khoa học và Đổi mới sáng tạo vì tương lai bền vững” diễn ra ngày 4/12 tới tại Hà Nội, trong khuôn khổ Tuần lễ Khoa học Công nghệ VinFuture 2025.
Nguyên nhân khiến Zalo bị vô hiệu hóa và cách xử lý

Nguyên nhân khiến Zalo bị vô hiệu hóa và cách xử lý

Tài khoản Zalo bị vô hiệu hoá là vấn đề khiến nhiều người dùng lo lắng vì ảnh hưởng trực tiếp đến liên lạc, công việc và bảo mật cá nhân. Việc hiểu rõ nguyên nhân, dấu hiệu nhận biết và hướng xử lý kịp thời sẽ giúp bạn giảm thiểu rủi ro và phục hồi quyền truy cập nhanh chóng.
Các nhà tiên phong của kỷ nguyên AI chia sẻ tại Tọa đàm Đạo đức và an toàn AI VinFuture

Các nhà tiên phong của kỷ nguyên AI chia sẻ tại Tọa đàm Đạo đức và an toàn AI VinFuture

Có cần phải kìm hãm tốc độ phát triển của trí tuệ nhân tạo (AI) hay không khi sức mạnh xử lý dữ liệu khổng lồ đang đặt ra hàng loạt câu hỏi về rủi ro, đạo đức và những giới hạn mới của công nghệ? Câu hỏi lớn của toàn nhân loại này sẽ được thảo luận tại tọa đàm với chủ đề: “AI vì nhân loại: Đạo đức và an toàn AI trong kỷ nguyên mới”, diễn ra vào 2/12/2025.
Những công nghệ hứa hẹn đột phá tương lai tại sân khấu VinFuture 2025

Những công nghệ hứa hẹn đột phá tương lai tại sân khấu VinFuture 2025

Lần đầu tiên được tổ chức trong khuôn khổ Tuần lễ Khoa học Công nghệ VinFuture 2025, sự kiện “Diễn thuyết Truyền cảm hứng: Công nghệ Đột phá Tương lai” mang đến cho công chúng cơ hội tiếp cận trực tiếp những xu hướng công nghệ tiên phong đang định hình thế giới, từ chăm sóc sức khỏe người cao tuổi, y học tim mạch, robot thế hệ mới đến an ninh lương thực.
Hà Tĩnh vào top 7 chuyển đổi số toàn quốc

Hà Tĩnh vào top 7 chuyển đổi số toàn quốc

Hà Tĩnh vừa ghi dấu ấn trên bản đồ chuyển đổi số khi vươn lên vị trí thứ 7/34 tỉnh, thành trong bảng xếp hạng DTI 2024 nhờ sự vào cuộc đồng bộ của cả hệ thống chính trị và sự đồng hành của người dân, doanh nghiệp.
Khi AI “vẽ” giấc mơ an cư

Khi AI “vẽ” giấc mơ an cư

Trong bối cảnh đô thị "đất chật người đông", việc ứng dụng AI giúp các kiến trúc sư phá vỡ những giới hạn về không gian, tạo ra những ngôi nhà phố thông minh và giàu cảm xúc.
Khi người trẻ chọn AI để “chữa lành”

Khi người trẻ chọn AI để “chữa lành”

AI đang được nhiều người trẻ sử dụng để tìm kiếm thông tin, để  giãi bày và được động viên tinh thần. Tuy nhiên điều này có thể dẫn tới việc người dùng sẽ bị "lệ thuộc cảm xúc" vào máy móc.