Công ty đứng sau mô hình Claude cho rằng chuỗi suy nghĩ của AI ngày càng kém minh bạch hơn và có thể dễ dàng đánh lừa người dùng.
Anthropic cảnh báo lập luận của AI ngày càng kém minh bạch hơn. Ảnh: Bloomberg.
Trong khi nhiều công ty công nghệ đang nỗ lực minh bạch hóa các mô hình AI thông qua kỹ thuật chuỗi suy nghĩ (Chain-of-Thought – CoT), công ty nghiên cứu AI Anthropic, đơn vị phát triển mô hình Claude lại đưa ra cảnh báo rằng người dùng không nên tin vào lập luận của công cụ.
“Chúng ta không có lý do gì để tin rằng ngôn ngữ có thể truyền tải đầy đủ quá trình ra quyết định phức tạp của một mạng nơ-ron”, Anthropic viết trên blog chính thức.
Trong nghiên cứu mới nhất, nhóm chuyên gia của Anthropic đã thực hiện các thử nghiệm nhằm kiểm tra mức độ trung thực của chuỗi suy nghĩ do AI tạo ra. Bằng cách cung cấp những gợi ý, các chuyên gia phát hiện mô hình thường sử dụng thông tin cho trước trong quá trình đưa ra câu trả lời, nhưng lại không thừa nhận điều này trong phần giải thích.
Ví dụ với mô hình Claude 3.7 Sonnet, chỉ khoảng 25% lời giải thích đề cập tới các gợi ý của người dùng. Tỷ lệ này ở DeepSeek-R1 là khoảng 39%. Đáng chú ý hơn, khi được cung cấp thông tin nhạy cảm như truy cập trái phép vào hệ thống, mô hình Claude chỉ thừa nhận trong 41% trường hợp, còn DeepSeek-R1 là 19%.
Anthropic cảnh báo thêm rằng khi mô hình được đặt trong tình huống sai lệch, chúng sẵn sàng tạo ra các chuỗi suy nghĩ mang tính ngụy biện. Điều này đặt ra rủi ro lớn khi AI được ứng dụng trong các lĩnh vực yêu cầu độ tin cậy cao như y tế, tài chính, pháp lý hoặc an ninh quốc phòng.
Hiện tại, việc huấn luyện bổ sung hoặc yêu cầu mô hình trung thực hơn chưa mang lại hiệu quả. Các mô hình ngày càng có xu hướng "giấu bài", khiến việc kiểm soát nội dung suy luận trở nên khó khăn hơn.
Trong bối cảnh AI ngày càng phổ biến, nhiều tổ chức công nghệ cũng đang phát triển các công cụ hỗ trợ giám sát và đánh giá tính minh bạch của mô hình. Tuy nhiên, cảnh báo từ Anthropic cho thấy chuỗi suy nghĩ có thể là “tấm màn” che đậy quy trình thực sự bên trong các hệ thống trí tuệ nhân tạo.
Tập đoàn Công nghiệp - Viễn thông Quân đội (Viettel) vừa đấu giá thành công quyền sử dụng tần số vô tuyến điện đối với khối tần B2 – B2’ của băng tần 700MHz trong vòng 15 năm tới.
Nhiều người tin khi dùng điều hòa cần đóng thật kín cửa để lạnh nhanh, tiết kiệm điện. Tuy nhiên, cách này có thể để lại tác dụng phụ cho sức khoẻ, gây chóng mặt, đau đầu.
Theo Met Office, hệ thống đám mây mới chứa 1,8 triệu bộ xử lý lõi, cho phép đưa ra dự báo chi tiết thời tiết trước tới 14 ngày trong khi dự báo lượng mưa cũng sẽ đạt độ chính xác cao hơn.
Nvidia sẽ hợp tác với các gã khổng lồ công nghệ là Foxconn và TSMC để xây dựng "siêu máy tính AI đầu tiên của Đài Loan... cho cơ sở hạ tầng AI và hệ sinh thái AI."
Việc sử dụng AI để tạo nội dung vẫn thường thấy trên các nền tảng. Tuy nhiên, một số người dùng quên bỏ câu dẫn nhập của AI, tạo ra những lỗi ngớ ngẩn.
Phiên bản iPhone kỷ niệm 20 năm dự kiến được trang bị chip nhớ băng thông cao (HBM), với khả năng lưu trữ nhiều thông tin và truyền dữ liệu nhanh hơn công nghệ cũ.
Sau khi thay đổi từ CMND sang CCCD hoàn toàn thì người dân đang gặp nhiều vấn đề về khai báo thuế, nộp thuế... khi thông tin chứng từ thuế không khớp với số CCCD hoặc số định danh cá nhân mới.
Nguồn tin tiết lộ nhóm thiết kế chip của Apple đang nghiên cứu phần cứng cho các thiết bị tương lai, bao gồm kính thông minh, máy Mac mạnh hơn và máy chủ trí tuệ nhân tạo.
Mẫu iPhone gập "huyền thoại" – chủ đề của hàng loạt tin tức rò rỉ và báo cáo không mấy đáng tin trong suốt nhiều năm qua – có thể cuối cùng sẽ trở thành hiện thực đúng vào dịp kỷ niệm 20 năm iPhone.
Khác biệt dung lượng pin trong cùng một model, tính năng máy thay đổi theo khu vực, độ sáng màn hình không đạt mức công bố… là những điều người dùng ít biết về smartphone.
Từ nay đến trước ngày 1/8/2025, nếu không thực hiện chuẩn hóa thông tin thuê bao đúng quy định, người dùng SIM di động tại Việt Nam sẽ có nguy cơ bị khóa SIM, thu hồi số điện thoại dù là số điện thoại chính chủ.
Nguồn tin tiết lộ Apple đang có kế hoạch di chuyển các thành phần Face ID xuống dưới màn hình vào năm 2026, cho phép loại bỏ phần khuyết hình viên thuốc tạo nên Dynamic Island.
Ủy ban Bảo vệ Dữ liệu Ireland (DPC) phạt TikTok vì cho rằng đã chuyển dữ liệu cá nhân của người dùng châu Âu sang Trung Quốc, vi phạm nghiêm trọng Quy định bảo vệ dữ liệu chung (GDPR) của EU.
Apple nhấn mạnh lớp phủ Ceramic Shield mới trên iPhone 16 có thể tăng độ bền và chống xước vượt trội, thậm chí không cần đến ốp lưng để bảo vệ điện thoại.
iPhone đã có mặt trên thị trường gần 18 năm. Vẫn có rất nhiều hiểu lầm xoay quanh nó tiếp tục lan truyền. Không ít trong số đó có thể ảnh hưởng xấu đến trải nghiệm người dùng.
Khi xét theo lượng người dùng ứng dụng riêng lẻ, ChatGPT đang dẫn trước Gemini của Google. Tuy nhiên, lợi thế về hệ sinh thái rộng lớn vẫn giúp Google duy trì sức mạnh vượt trội.