Công ty đứng sau mô hình Claude cho rằng chuỗi suy nghĩ của AI ngày càng kém minh bạch hơn và có thể dễ dàng đánh lừa người dùng.
Anthropic cảnh báo lập luận của AI ngày càng kém minh bạch hơn. Ảnh: Bloomberg.
Trong khi nhiều công ty công nghệ đang nỗ lực minh bạch hóa các mô hình AI thông qua kỹ thuật chuỗi suy nghĩ (Chain-of-Thought – CoT), công ty nghiên cứu AI Anthropic, đơn vị phát triển mô hình Claude lại đưa ra cảnh báo rằng người dùng không nên tin vào lập luận của công cụ.
“Chúng ta không có lý do gì để tin rằng ngôn ngữ có thể truyền tải đầy đủ quá trình ra quyết định phức tạp của một mạng nơ-ron”, Anthropic viết trên blog chính thức.
Trong nghiên cứu mới nhất, nhóm chuyên gia của Anthropic đã thực hiện các thử nghiệm nhằm kiểm tra mức độ trung thực của chuỗi suy nghĩ do AI tạo ra. Bằng cách cung cấp những gợi ý, các chuyên gia phát hiện mô hình thường sử dụng thông tin cho trước trong quá trình đưa ra câu trả lời, nhưng lại không thừa nhận điều này trong phần giải thích.
Ví dụ với mô hình Claude 3.7 Sonnet, chỉ khoảng 25% lời giải thích đề cập tới các gợi ý của người dùng. Tỷ lệ này ở DeepSeek-R1 là khoảng 39%. Đáng chú ý hơn, khi được cung cấp thông tin nhạy cảm như truy cập trái phép vào hệ thống, mô hình Claude chỉ thừa nhận trong 41% trường hợp, còn DeepSeek-R1 là 19%.
Anthropic cảnh báo thêm rằng khi mô hình được đặt trong tình huống sai lệch, chúng sẵn sàng tạo ra các chuỗi suy nghĩ mang tính ngụy biện. Điều này đặt ra rủi ro lớn khi AI được ứng dụng trong các lĩnh vực yêu cầu độ tin cậy cao như y tế, tài chính, pháp lý hoặc an ninh quốc phòng.
Hiện tại, việc huấn luyện bổ sung hoặc yêu cầu mô hình trung thực hơn chưa mang lại hiệu quả. Các mô hình ngày càng có xu hướng "giấu bài", khiến việc kiểm soát nội dung suy luận trở nên khó khăn hơn.
Trong bối cảnh AI ngày càng phổ biến, nhiều tổ chức công nghệ cũng đang phát triển các công cụ hỗ trợ giám sát và đánh giá tính minh bạch của mô hình. Tuy nhiên, cảnh báo từ Anthropic cho thấy chuỗi suy nghĩ có thể là “tấm màn” che đậy quy trình thực sự bên trong các hệ thống trí tuệ nhân tạo.
Tính năng màn hình luôn bật cho phép màn hình điện thoại hiển thị một số thông tin cơ bản ngay cả khi đã khóa, giúp người dùng dễ dàng xem nhanh mà vẫn tiết kiệm pin.
Dòng điện thoại chủ lực của Apple đem lại doanh thu lớn cho đại lý, nhà sản xuất. Số tiền Táo khuyết thu được tương đương hãng điện thoại cỡ trung bán một năm ở Việt Nam.
Gửi video trên 100MB qua Zalo rất đơn giản, chỉ vài thao tác nhanh gọn bạn đã có thể chia sẻ thành công mà không tốn nhiều thời gian hay cần hiểu biết công nghệ.
Samsung đang xem xét phát hành mẫu điện thoại thông minh gập ba đầu tiên tại thị trường Mỹ, đánh dấu bước đi mới trong nỗ lực đổi mới sản phẩm và duy trì vị thế cạnh tranh trên thị trường toàn cầu.
Bạn có bao giờ lo lắng rằng tài khoản Facebook của mình bị người lạ truy cập trái phép? Việc theo dõi và kiểm tra lịch sử đăng nhập Facebook là cách giúp bạn biết tài khoản đã được sử dụng ở đâu, thiết bị nào, từ đó bảo vệ quyền riêng tư tốt hơn.
Ban Tổ chức Cuộc thi truyền thanh cơ sở tuyên truyền về chuyển đổi số tỉnh Hà Tĩnh năm 2025 vừa ban hành Thể lệ Cuộc thi trên Báo Hà Tĩnh, Cổng Thông tin điện tử Sở VH-TT&DL, Cổng Thông tin điện tử tỉnh.
Số liệu mới nhất từ nền tảng đo tốc độ i-Speed, từ tháng 3/2025 đến nay, chất lượng mạng băng rộng cố định tại Việt Nam liên tục giữ nhịp tăng cả theo chiều tải lên lẫn tải xuống.
Trong quá trình trao đổi công việc hoặc chia sẻ tài liệu, không ít người gặp tình huống lỗi không tải được file trên Zalo điện thoại hoặc máy tính. Vấn đề này có thể gây gián đoạn công việc, đặc biệt khi bạn cần gửi hoặc nhận những tệp quan trọng.
Zalo thường tự động lưu ảnh và video về thiết bị, nhưng điều này tốn dung lượng và ảnh hưởng hiệu suất. Dưới đây là hướng dẫn tắt tính năng tự lưu ảnh.
Sẽ rất khó chịu khi điện thoại gọi Zalo mà nói người khác không nghe được. Điều này khiến bạn bỏ lỡ nhiều cuộc gọi và thông tin quan trọng từ người thân, bạn bè.
Việc chuyển đổi ảnh chứa dữ liệu thành bảng Excel là một kỹ năng hữu ích trong công việc và học tập. Thay vì nhập liệu thủ công, bạn có thể sử dụng các công cụ để tự động hóa quá trình này, giúp tiết kiệm thời gian và công sức.
Cách chia sẻ pin trên iPhone thu hút sự quan tâm từ người dùng iOS, nhất là sau khi Apple ra mắt iPhone 15 với cổng sạc USB-C hỗ trợ sạc cho thiết bị khác.
Theo dự kiến, ngày 9/9/2025, Apple sẽ trình làng dòng điện thoại thông minh đình đám iPhone 17 cũng như các sản phẩm như đồng hồ thông minh Apple Watch Series 11 và tai nghe không dây AirPods Pro 3.
Theo Sở KH&CN Hà Tĩnh, micro không dây là một loại micro có khả năng thu âm và sử dụng sóng vô tuyến (tần số) để truyền tín hiệu mà không cần dây nối, tiềm ẩn nguy cơ can nhiễu tần số vô tuyến điện.
Đồng bộ hóa Google là giải pháp tối ưu, giúp kết nối thông tin mượt mà và an toàn. Đồng bộ hóa Google là công cụ mạnh mẽ giúp duy trì sự nhất quán dữ liệu trên nhiều thiết bị, hỗ trợ bạn làm việc và giải trí mọi lúc, mọi nơi.
TikTok hiện đã hỗ trợ tính năng khôi phục video bị xóa, giúp người dùng dễ dàng lấy lại nội dung quý giá chỉ với vài thao tác. Tính năng này chỉ có thể khôi phục video đã xóa trong vòng 30 ngày tính từ thời điểm bạn xóa video.
Chế độ chuyên nghiệp trên Facebook giúp bạn quản lý trang cá nhân hiệu quả hơn, mở khóa nhiều công cụ hỗ trợ tăng tương tác và phát triển nội dung dễ dàng.