Công ty đứng sau mô hình Claude cho rằng chuỗi suy nghĩ của AI ngày càng kém minh bạch hơn và có thể dễ dàng đánh lừa người dùng.
Anthropic cảnh báo lập luận của AI ngày càng kém minh bạch hơn. Ảnh: Bloomberg.
Trong khi nhiều công ty công nghệ đang nỗ lực minh bạch hóa các mô hình AI thông qua kỹ thuật chuỗi suy nghĩ (Chain-of-Thought – CoT), công ty nghiên cứu AI Anthropic, đơn vị phát triển mô hình Claude lại đưa ra cảnh báo rằng người dùng không nên tin vào lập luận của công cụ.
“Chúng ta không có lý do gì để tin rằng ngôn ngữ có thể truyền tải đầy đủ quá trình ra quyết định phức tạp của một mạng nơ-ron”, Anthropic viết trên blog chính thức.
Trong nghiên cứu mới nhất, nhóm chuyên gia của Anthropic đã thực hiện các thử nghiệm nhằm kiểm tra mức độ trung thực của chuỗi suy nghĩ do AI tạo ra. Bằng cách cung cấp những gợi ý, các chuyên gia phát hiện mô hình thường sử dụng thông tin cho trước trong quá trình đưa ra câu trả lời, nhưng lại không thừa nhận điều này trong phần giải thích.
Ví dụ với mô hình Claude 3.7 Sonnet, chỉ khoảng 25% lời giải thích đề cập tới các gợi ý của người dùng. Tỷ lệ này ở DeepSeek-R1 là khoảng 39%. Đáng chú ý hơn, khi được cung cấp thông tin nhạy cảm như truy cập trái phép vào hệ thống, mô hình Claude chỉ thừa nhận trong 41% trường hợp, còn DeepSeek-R1 là 19%.
Anthropic cảnh báo thêm rằng khi mô hình được đặt trong tình huống sai lệch, chúng sẵn sàng tạo ra các chuỗi suy nghĩ mang tính ngụy biện. Điều này đặt ra rủi ro lớn khi AI được ứng dụng trong các lĩnh vực yêu cầu độ tin cậy cao như y tế, tài chính, pháp lý hoặc an ninh quốc phòng.
Hiện tại, việc huấn luyện bổ sung hoặc yêu cầu mô hình trung thực hơn chưa mang lại hiệu quả. Các mô hình ngày càng có xu hướng "giấu bài", khiến việc kiểm soát nội dung suy luận trở nên khó khăn hơn.
Trong bối cảnh AI ngày càng phổ biến, nhiều tổ chức công nghệ cũng đang phát triển các công cụ hỗ trợ giám sát và đánh giá tính minh bạch của mô hình. Tuy nhiên, cảnh báo từ Anthropic cho thấy chuỗi suy nghĩ có thể là “tấm màn” che đậy quy trình thực sự bên trong các hệ thống trí tuệ nhân tạo.
Zalo sau thời gian sử dụng sẽ lưu nhiều dữ liệu tạm như ảnh, video, file tải về. Hãy xóa bộ nhớ đệm để ứng dụng chạy mượt, nhẹ hơn và tiết kiệm dung lượng.
Cài đặt mật khẩu cho điện thoại giúp bảo mật thông tin và dữ liệu cá nhân của người dùng. Tuy nhiên, đôi khi bạn sẽ cần phải loại bỏ mật khẩu vì nhiều lý do khác nhau.
Smartphone chuyên chụp ảnh Vivo X300 Pro có giá khởi điểm 5.299 CNY (19,6 triệu đồng) tại Trung Quốc, trang bị cụm camera tối ưu cho khả năng chụp xa, do Sony và Samsung phát triển.
Nothing hợp tác với YouTuber MrWhoseTheBoss để tạo ra “chiếc điện thoại trong mơ” giá 1.800 USD, hội tụ thiết kế cao cấp và những tính năng đang dần biến mất.
Tạo avatar Facebook đẹp giúp bạn nổi bật và thể hiện cá tính riêng. Hướng dẫn chi tiết cách tạo, biến avatar thành sticker và dùng AI sáng tạo phiên bản độc đáo.
Biết cách chỉnh thời gian sáng màn hình iPhone không chỉ giúp sử dụng thiết bị tiện lợi hơn mà còn tối ưu hóa pin và bảo vệ linh kiện. Ngoài ra, khi gặp tình huống không thể điều chỉnh được thời gian khóa màn hình, hãy kiểm tra ngay chế độ tiết kiệm pin để khắc phục.
iOS 26 mang đến nhiều tính năng mới mẻ nhưng cũng phát sinh một số lỗi khiến người dùng gặp khó khăn trong quá trình sử dụng, đặc biệt là tình trạng iPhone bị mất sóng. Một số người còn gặp lỗi iPhone bị mất sóng eSIM hoặc iPhone bị mất sóng không nhận SIM sau khi cập nhật.
Lọc tin nhắn rác trên iPhone là thao tác quan trọng để bạn không bị làm phiền bởi các cuộc gọi hay SMS quảng cáo. Tính năng này giúp hộp thư luôn gọn gàng, tránh bỏ sót những tin nhắn quan trọng từ người thân và công việc.
Apple vừa phát hành bản cập nhật iOS 26.0.1 và iPadOS 26.0.1, tập trung khắc phục một số lỗi hệ thống nhằm cải thiện hiệu suất và ổn định cho thiết bị iPhone và iPad.
iOS 26 trên iPhone cho phép cài hình nền không gian 3D sống động ngay trên màn hình khóa, tạo hiệu ứng chiều sâu ấn tượng mà không cần thêm ứng dụng ngoài.
Triển lãm Quốc tế Đổi mới sáng tạo Việt Nam 2025 trình diễn nhiều sản phẩm công nghệ độc đáo như robot, sản phẩm AI, chip bán dẫn do Việt Nam phát triển.
Ứng dụng Android thường tự cập nhật gây tốn dữ liệu và bộ nhớ. Giờ đây các bạn có thể tắt tính năng này để chủ động cập nhật, giúp máy nhẹ và tiết kiệm hơn.
Mỗi năm, Apple đều giới thiệu phiên bản iOS mới với nhiều cải tiến về giao diện, tính năng và hiệu năng. Tuy nhiên, không phải lúc nào việc cập nhật ngay lập tức cũng là lựa chọn tối ưu.
Tập đoàn Công nghiệp - Viễn thông Quân đội (Viettel) đã triển khai đồng bộ các biện pháp nhằm đảm bảo an toàn hạ tầng viễn thông tại các tỉnh bị ảnh hưởng bởi bão Bualoi (bão số 10) và hoàn lưu bão.
Ngày nay, nhiều người muốn xem ảnh đại diện Instagram full size để nhìn rõ nét và trọn vẹn hơn. Nhờ các công cụ hỗ trợ, việc này trở nên dễ dàng và tiện lợi.
Tính năng màn hình luôn bật cho phép màn hình điện thoại hiển thị một số thông tin cơ bản ngay cả khi đã khóa, giúp người dùng dễ dàng xem nhanh mà vẫn tiết kiệm pin.
Dòng điện thoại chủ lực của Apple đem lại doanh thu lớn cho đại lý, nhà sản xuất. Số tiền Táo khuyết thu được tương đương hãng điện thoại cỡ trung bán một năm ở Việt Nam.