Công ty đứng sau mô hình Claude cho rằng chuỗi suy nghĩ của AI ngày càng kém minh bạch hơn và có thể dễ dàng đánh lừa người dùng.
Anthropic cảnh báo lập luận của AI ngày càng kém minh bạch hơn. Ảnh: Bloomberg.
Trong khi nhiều công ty công nghệ đang nỗ lực minh bạch hóa các mô hình AI thông qua kỹ thuật chuỗi suy nghĩ (Chain-of-Thought – CoT), công ty nghiên cứu AI Anthropic, đơn vị phát triển mô hình Claude lại đưa ra cảnh báo rằng người dùng không nên tin vào lập luận của công cụ.
“Chúng ta không có lý do gì để tin rằng ngôn ngữ có thể truyền tải đầy đủ quá trình ra quyết định phức tạp của một mạng nơ-ron”, Anthropic viết trên blog chính thức.
Trong nghiên cứu mới nhất, nhóm chuyên gia của Anthropic đã thực hiện các thử nghiệm nhằm kiểm tra mức độ trung thực của chuỗi suy nghĩ do AI tạo ra. Bằng cách cung cấp những gợi ý, các chuyên gia phát hiện mô hình thường sử dụng thông tin cho trước trong quá trình đưa ra câu trả lời, nhưng lại không thừa nhận điều này trong phần giải thích.
Ví dụ với mô hình Claude 3.7 Sonnet, chỉ khoảng 25% lời giải thích đề cập tới các gợi ý của người dùng. Tỷ lệ này ở DeepSeek-R1 là khoảng 39%. Đáng chú ý hơn, khi được cung cấp thông tin nhạy cảm như truy cập trái phép vào hệ thống, mô hình Claude chỉ thừa nhận trong 41% trường hợp, còn DeepSeek-R1 là 19%.
Anthropic cảnh báo thêm rằng khi mô hình được đặt trong tình huống sai lệch, chúng sẵn sàng tạo ra các chuỗi suy nghĩ mang tính ngụy biện. Điều này đặt ra rủi ro lớn khi AI được ứng dụng trong các lĩnh vực yêu cầu độ tin cậy cao như y tế, tài chính, pháp lý hoặc an ninh quốc phòng.
Hiện tại, việc huấn luyện bổ sung hoặc yêu cầu mô hình trung thực hơn chưa mang lại hiệu quả. Các mô hình ngày càng có xu hướng "giấu bài", khiến việc kiểm soát nội dung suy luận trở nên khó khăn hơn.
Trong bối cảnh AI ngày càng phổ biến, nhiều tổ chức công nghệ cũng đang phát triển các công cụ hỗ trợ giám sát và đánh giá tính minh bạch của mô hình. Tuy nhiên, cảnh báo từ Anthropic cho thấy chuỗi suy nghĩ có thể là “tấm màn” che đậy quy trình thực sự bên trong các hệ thống trí tuệ nhân tạo.
Cách kết nối máy tính với tivi không dây giúp việc phản chiếu màn hình, truyền video, hình ảnh, tài liệu,… từ máy tính sang tivi trở nên cực kỳ đơn giản và tiện lợi.
Trong quá trình sử dụng, những vấn đề chúng ta thường gặp ở “dế yêu” của mình là điện thoại bị nóng và nhanh hết pin. Tình trạng này xảy ra khiến nguời dùng không khỏi lo lắng.
Một dự báo mới cho thấy chiếc iPhone màn hình gập đầu tiên của Apple sẽ có mức giá rất cao, cùng phân khúc với dòng laptop đắt nhất của hãng là MacBook Pro 16 inch.
Tài khoản Zalo bị vô hiệu hoá là vấn đề khiến nhiều người dùng lo lắng vì ảnh hưởng trực tiếp đến liên lạc, công việc và bảo mật cá nhân. Việc hiểu rõ nguyên nhân, dấu hiệu nhận biết và hướng xử lý kịp thời sẽ giúp bạn giảm thiểu rủi ro và phục hồi quyền truy cập nhanh chóng.
Những thay đổi chưa từng có trong lộ trình ra mắt sản phẩm của Apple được dự báo sẽ đặt người dùng vào thế khó khi cân nhắc nâng cấp lên thế hệ iPhone 18.
AI đang được nhiều người trẻ sử dụng để tìm kiếm thông tin, để giãi bày và được động viên tinh thần. Tuy nhiên điều này có thể dẫn tới việc người dùng sẽ bị "lệ thuộc cảm xúc" vào máy móc.
Lấy lại nhật ký cuộc gọi đã xóa trên iPhone giúp khôi phục nhanh số điện thoại, thời gian và lịch sử liên lạc quan trọng. Xem ngay cách thực hiện đơn giản sau đây
Quy tụ gần 750 doanh nghiệp trong và ngoài nước, Tuần lễ Công nghiệp và Công nghệ Việt Nam 2025 trở thành sàn diễn hội tụ của thế hệ máy móc và công nghệ sản xuất hiện đại.
Nhờ có Apple Intelligence, các thao tác trên iPhone trở nên thông minh và tiện lợi hơn rất nhiều, kể cả việc dịch văn bản. Bạn không cần cài thêm ứng dụng hỗ trợ, chỉ với vài thao tác là iPhone có thể hiểu và dịch nội dung nhanh chóng, tự nhiên và chính xác.
Rạng sáng 13/11 (giờ Việt Nam), hàng loạt dịch vụ như công cụ tìm kiếm Google Search, dịch vụ lưu trữ Google Drive hay bộ ứng dụng văn phòng Google Docs và Google Sheets, đã gặp tình trạng gián đoạn.
Thói quen sạc pin điện thoại tưởng chừng đơn giản, nhưng nhiều người thường bỏ qua một hiện tượng quan trọng là quá nhiệt bộ sạc. Đây không chỉ là phản ứng vật lý bình thường mà đôi khi còn là lời cảnh báo về chất lượng phụ kiện, hoặc thói quen sử dụng đang âm thầm gây hại cho pin và thiết bị của bạn.
Nhờ Apple Intelligence, iPhone nay thông minh hơn với khả năng dịch văn bản cực nhanh và chính xác. Không cần cài thêm ứng dụng, bạn có thể dịch mọi nội dung chỉ với vài thao tác đơn giản.
Không phải ai cũng biết iPhone đã tích hợp sẵn tính năng chụp ảnh kèm định vị. Nhờ công cụ này, mỗi bức hình không chỉ lưu lại khoảnh khắc, mà còn đi kèm tọa độ và thời gian chụp.
Camera không hoạt động trên Google Chrome máy tính có thể gây phiền toái, đặc biệt khi bạn cần tham gia các cuộc họp trực tuyến, học online, hoặc thực hiện video call.
Nút Wifi không bật được trên iPhone khiến bạn không thể kết nối mạng và sử dụng các ứng dụng yêu thích. Tình trạng này không chỉ gây gián đoạn trải nghiệm mà còn khiến nhiều người lo lắng không biết thiết bị của mình đang gặp vấn đề gì.
Để kỷ niệm 50 năm thành lập, Apple dự kiến trình làng nhiều thiết bị quan trọng như iPhone 18 hay MacBook Pro M6, dù vẫn còn thách thức xoay quanh thị trường và đối thủ cạnh tranh.
Zalo thường mặc định tự lưu ảnh và video để bảo đảm rằng dữ liệu người dùng không bị mất. Tuy nhiên, điều này cũng khiến cho bộ nhớ máy trở nên quá tải. Bạn có thể cải thiện vấn đề này thông qua hướng dẫn sau.