Đừng tin vào AI

Công ty đứng sau mô hình Claude cho rằng chuỗi suy nghĩ của AI ngày càng kém minh bạch hơn và có thể dễ dàng đánh lừa người dùng.

Anthropic cảnh báo lập luận của AI ngày càng kém minh bạch hơn. Ảnh: Bloomberg.
Anthropic cảnh báo lập luận của AI ngày càng kém minh bạch hơn. Ảnh: Bloomberg.

Trong khi nhiều công ty công nghệ đang nỗ lực minh bạch hóa các mô hình AI thông qua kỹ thuật chuỗi suy nghĩ (Chain-of-Thought – CoT), công ty nghiên cứu AI Anthropic, đơn vị phát triển mô hình Claude lại đưa ra cảnh báo rằng người dùng không nên tin vào lập luận của công cụ.

“Chúng ta không có lý do gì để tin rằng ngôn ngữ có thể truyền tải đầy đủ quá trình ra quyết định phức tạp của một mạng nơ-ron”, Anthropic viết trên blog chính thức.

Trong nghiên cứu mới nhất, nhóm chuyên gia của Anthropic đã thực hiện các thử nghiệm nhằm kiểm tra mức độ trung thực của chuỗi suy nghĩ do AI tạo ra. Bằng cách cung cấp những gợi ý, các chuyên gia phát hiện mô hình thường sử dụng thông tin cho trước trong quá trình đưa ra câu trả lời, nhưng lại không thừa nhận điều này trong phần giải thích.

Ví dụ với mô hình Claude 3.7 Sonnet, chỉ khoảng 25% lời giải thích đề cập tới các gợi ý của người dùng. Tỷ lệ này ở DeepSeek-R1 là khoảng 39%. Đáng chú ý hơn, khi được cung cấp thông tin nhạy cảm như truy cập trái phép vào hệ thống, mô hình Claude chỉ thừa nhận trong 41% trường hợp, còn DeepSeek-R1 là 19%.

Anthropic cảnh báo thêm rằng khi mô hình được đặt trong tình huống sai lệch, chúng sẵn sàng tạo ra các chuỗi suy nghĩ mang tính ngụy biện. Điều này đặt ra rủi ro lớn khi AI được ứng dụng trong các lĩnh vực yêu cầu độ tin cậy cao như y tế, tài chính, pháp lý hoặc an ninh quốc phòng.

Hiện tại, việc huấn luyện bổ sung hoặc yêu cầu mô hình trung thực hơn chưa mang lại hiệu quả. Các mô hình ngày càng có xu hướng "giấu bài", khiến việc kiểm soát nội dung suy luận trở nên khó khăn hơn.

Trong bối cảnh AI ngày càng phổ biến, nhiều tổ chức công nghệ cũng đang phát triển các công cụ hỗ trợ giám sát và đánh giá tính minh bạch của mô hình. Tuy nhiên, cảnh báo từ Anthropic cho thấy chuỗi suy nghĩ có thể là “tấm màn” che đậy quy trình thực sự bên trong các hệ thống trí tuệ nhân tạo.

znews.vn

Đọc thêm

Mắt thông minh AI dành cho người khiếm thị

Mắt thông minh AI dành cho người khiếm thị

Các nhà khoa học đã phát triển hệ thống thiết bị đeo tích hợp công nghệ AI để chỉ dẫn người khiếm thị tránh các chướng ngại vật trên đường và xử lý các tác vụ hàng ngày.
Tính năng sạc đặc biệt của iPhone

Tính năng sạc đặc biệt của iPhone

Tính năng Clean Energy Saving (Sạc pin năng lượng sạch) nhằm mục tiêu giảm khí thải carbon sẽ được triển khai trên toàn bộ iPhone và iPad trưng bày tại Mỹ.
Những lưu ý khi sạc điện thoại trên ô tô

Những lưu ý khi sạc điện thoại trên ô tô

Sạc điện thoại trên ô tô là một giải pháp hỗ trợ tối ưu để duy trì liên lạc với mọi người xung quanh. Tuy nhiên, sạc không đúng cách tiềm ẩn nguy hiểm cho người ngồi trên xe.
Thiết bị gập bí ẩn của Apple

Thiết bị gập bí ẩn của Apple

Với màn hình gập có kích thước gần 19 inch, rất khó để hình dung cách Apple định vị phân khúc thị trường cho sản phẩm này.
Kỷ nguyên iPhone 'nhàm chán' sắp kết thúc

Kỷ nguyên iPhone 'nhàm chán' sắp kết thúc

Apple đang chuẩn bị cho một sự thay đổi mang tính cách mạng đối với dòng sản phẩm iPhone, mở ra một kỷ nguyên mới sau giai đoạn được nhận định là thiếu đột phá.
Hình ảnh mới của iOS 19

Hình ảnh mới của iOS 19

iOS 19 tiếp tục lộ diện với biểu tượng ứng dụng mới, các thành phần giao diện bóng bẩy hơn.
Cách lưu ảnh trên Tiktok không dính logo

Cách lưu ảnh trên Tiktok không dính logo

Việc tải ảnh trực tiếp từ TikTok thường kèm theo logo của ứng dụng, gây ảnh hưởng đến trải nghiệm của bạn. Đừng lo lắng, bài viết này sẽ hướng dẫn bạn những cách lưu ảnh trên Tiktok không dính logo đơn giản, áp dụng cho cả điện thoại Android và iPhone.
Những mẫu iPhone sắp lỗi thời

Những mẫu iPhone sắp lỗi thời

Bản cập nhật được cho là mạnh mẽ nhất kể từ iOS 17 sẽ chỉ được hỗ trợ một phần, hoặc hoàn toàn không cài được ở một số phiên bản iPhone.
Cách sử dụng Siri tiếng Việt trên iPhone

Cách sử dụng Siri tiếng Việt trên iPhone

Apple đã chính thức cập nhật iOS 18.4, mang đến bước tiến lớn khi Siri đã hỗ trợ tiếng Việt. Giờ đây, bạn có thể ra lệnh, tìm kiếm thông tin và điều khiển điện thoại bằng chính ngôn ngữ quen thuộc.
Cách lấy nhạc TikTok làm nhạc chuông báo thức

Cách lấy nhạc TikTok làm nhạc chuông báo thức

Thỉnh thoảng khi lướt TikTok bạn sẽ thấy được một vài video có nhạc nền cực hợp để đặt làm báo thức. Nhưng với TikTok bạn không thể nào tải bài nhạc đó về và cài cho nhạc chuông báo thức của mình được. Vậy phải làm sao?
Thời của điện thoại siêu mỏng đã trở lại

Thời của điện thoại siêu mỏng đã trở lại

Suốt nhiều năm, các hãng smartphone luôn chạy đua để cải thiện thời lượng pin và camera. Nhưng giờ, họ quay lại với yếu tố thiết kế và đặt cược vào những chiếc smartphone siêu mỏng.