Đừng tin vào AI

09/04/2025 12:41

Công ty đứng sau mô hình Claude cho rằng chuỗi suy nghĩ của AI ngày càng kém minh bạch hơn và có thể dễ dàng đánh lừa người dùng.

Anthropic cảnh báo lập luận của AI ngày càng kém minh bạch hơn. Ảnh: Bloomberg.

Trong khi nhiều công ty công nghệ đang nỗ lực minh bạch hóa các mô hình AI thông qua kỹ thuật chuỗi suy nghĩ (Chain-of-Thought – CoT), công ty nghiên cứu AI Anthropic, đơn vị phát triển mô hình Claude lại đưa ra cảnh báo rằng người dùng không nên tin vào lập luận của công cụ.

“Chúng ta không có lý do gì để tin rằng ngôn ngữ có thể truyền tải đầy đủ quá trình ra quyết định phức tạp của một mạng nơ-ron”, Anthropic viết trên blog chính thức.

Trong nghiên cứu mới nhất, nhóm chuyên gia của Anthropic đã thực hiện các thử nghiệm nhằm kiểm tra mức độ trung thực của chuỗi suy nghĩ do AI tạo ra. Bằng cách cung cấp những gợi ý, các chuyên gia phát hiện mô hình thường sử dụng thông tin cho trước trong quá trình đưa ra câu trả lời, nhưng lại không thừa nhận điều này trong phần giải thích.

Ví dụ với mô hình Claude 3.7 Sonnet, chỉ khoảng 25% lời giải thích đề cập tới các gợi ý của người dùng. Tỷ lệ này ở DeepSeek-R1 là khoảng 39%. Đáng chú ý hơn, khi được cung cấp thông tin nhạy cảm như truy cập trái phép vào hệ thống, mô hình Claude chỉ thừa nhận trong 41% trường hợp, còn DeepSeek-R1 là 19%.

Anthropic cảnh báo thêm rằng khi mô hình được đặt trong tình huống sai lệch, chúng sẵn sàng tạo ra các chuỗi suy nghĩ mang tính ngụy biện. Điều này đặt ra rủi ro lớn khi AI được ứng dụng trong các lĩnh vực yêu cầu độ tin cậy cao như y tế, tài chính, pháp lý hoặc an ninh quốc phòng.

Hiện tại, việc huấn luyện bổ sung hoặc yêu cầu mô hình trung thực hơn chưa mang lại hiệu quả. Các mô hình ngày càng có xu hướng "giấu bài", khiến việc kiểm soát nội dung suy luận trở nên khó khăn hơn.

Trong bối cảnh AI ngày càng phổ biến, nhiều tổ chức công nghệ cũng đang phát triển các công cụ hỗ trợ giám sát và đánh giá tính minh bạch của mô hình. Tuy nhiên, cảnh báo từ Anthropic cho thấy chuỗi suy nghĩ có thể là “tấm màn” che đậy quy trình thực sự bên trong các hệ thống trí tuệ nhân tạo.

znews.vn

Link bài gốc Copy link

https://znews.vn/dung-tin-vao-lap-luan-cua-ai-post1544106.html

Tags:

#công nghệ Al #Al tạo sinh

Có thể bạn quan tâm

Tin vui cho người muốn mua iPhone Air

Tính năng không phải ai cũng biết trên AirPods

0h ngày 15/6: Khóa SIM một chiều với các thuê bao chưa xác thực thông tin theo quy định của Thông tư 08

Cách xử lý triệt để tình trạng camera iPhone không chụp được

Galaxy S26 FE lộ diện

Thấy gì từ loạt smartphone Trung Quốc vừa ra mắt tại Việt Nam?

Rò rỉ khung iPhone 18 Pro với ba màu mới

Truy cập Internet từ bot AI lần đầu vượt con người

Đọc thêm

Người dùng nhiều sim phải xác thực tất cả các số đang sử dụng

06/06/2026 05:20

Trong lộ trình triển khai các quy định mới về quản lý viễn thông, hàng loạt thuê bao di động đang bước vào giai đoạn rà soát và xác thực thông tin bắt buộc. Đáng chú ý, việc xác thực hiện nay không chỉ giới hạn ở một số điện thoại chính mà yêu cầu người dân phải xác thực cả số thuê bao đang sở hữu nhằm bảo vệ quyền lợi.

Cách khôi phục Instagram bị dừng sau khi nhận tin nhắn lạ

04/06/2026 10:24

Tài khoản Instagram bị đình chỉ sau khi nhận tin nhắn lạ? Xem ngay cách khôi phục nhanh chóng, kiểm tra bảo mật và lấy lại tài khoản dễ dàng.

Thứ chưa từng có sẽ xuất hiện tại World Cup 2026

03/06/2026 05:01

Hội đồng bóng đá quốc tế (IFAB) chính thức phê duyệt cho phép các HLV sử dụng thiết bị điện tử như laptop chỉ đạo trực tiếp cho cầu thủ trong quãng nghỉ uống nước.

Hàng triệu thuê bao có nguy cơ bị khóa chiều đi sau 15/6

01/06/2026 14:39

Khoảng 25 triệu thuê bao chưa được người dùng xác nhận trạng thái dù đã được đưa lên VneiD. Nếu không hoàn tất xác nhận trước ngày 15/6/2026, các thuê bao này sẽ bị tạm dừng dịch vụ chiều đi theo quy định.

Cách cài âm thông báo cho từng ứng dụng Samsung đơn giản

01/06/2026 04:27

Âm thông báo riêng cho từng ứng dụng trên Samsung giúp bạn dễ dàng nhận biết tin nhắn, cuộc gọi và thông báo quan trọng, đồng thời cá nhân hóa trải nghiệm sử dụng tiện lợi hơn.

iPhone 18 Pro lộ thêm thông tin màu mới bắt mắt, camera nâng cấp nhưng khó giữ giá

31/05/2026 13:10

Rò rỉ cho thấy iPhone 18 Pro sẽ có màu Dark Cherry mới, trong khi nâng cấp camera có thể khiến giá bán tăng, không chỉ riêng vấn đề bộ nhớ RAM.

Facebook bắt đầu thu phí

30/05/2026 15:16

Không phải chặn quảng cáo, các gói trả phí mới trên Instagram, Facebook và WhatsApp bổ sung nhiều tính năng nâng cao.

Lý do một số web lậu bị triệt phá vẫn "sống lại"

30/05/2026 11:53

Dù bị cơ quan chức năng mạnh tay triệt phá, nhiều website vi phạm bản quyền số về phim ảnh, thể thao... vẫn "mọc" trở lại thông qua những tên miền gần giống.

Hướng dẫn cách giải phóng dung lượng Facebook hiệu quả

30/05/2026 04:45

Cách giải phóng dung lượng Facebook hiệu quả và đơn giản nhất là xóa cache, dữ liệu ứng dụng hoặc tắt làm mới nền để hạn chế máy bị đầy bộ nhớ.

Lý do người dùng từ bỏ Microsoft Word

27/05/2026 10:01

Microsoft Word vẫn là phần mềm soạn thảo phổ biến nhất thế giới, song ngày càng nhiều người dùng cho rằng nó gây ra phiền toái hơn hỗ trợ công việc.

Cách in giấy xác nhận cư trú trên VneID nhanh chóng

27/05/2026 04:05

Cách in giấy xác nhận cư trú trên VNeID giúp người dân thực hiện thủ tục nhanh hơn mà không cần đến công an. Bài viết hướng dẫn chi tiết từng bước dễ

Làm ngay điều này để tránh cho điện thoại chai pin

26/05/2026 04:58

Nắng nóng ở châu Á: Một số thay đổi nhỏ trong thói quen có thể giúp kéo dài tuổi thọ pin trên iPhone và smartphone nói chung.

Ý tưởng iPhone 20 màn hình tràn viền

25/05/2026 04:00

Apple có thể bỏ qua iPhone 19 để ra mắt iPhone 20 năm 2027 với màn hình cong, tràn viền bốn cạnh cùng hệ thống Face ID dưới màn hình.

Các đổi mật khẩu Wi-Fi chỉ trong tích tắc

24/05/2026 04:27

Wi-Fi chậm, dễ mất kết nối hay có người lạ dùng là lúc bạn nên đổi mật khẩu để mạng ổn định hơn. Dưới đây là cách đổi Wi-Fi bằng điện thoại đơn giản, nhanh chóng.

Amazon nghiên cứu triển khai Internet vệ tinh tại Việt Nam

23/05/2026 05:08

Amazon nghiên cứu triển khai Internet vệ tinh quỹ đạo thấp, đồng thời muốn Việt Nam trở thành trung tâm sản xuất một số thiết bị phục vụ xuất khẩu.

Công nghệ giúp laptop chạy 3 tháng không cần sạc

22/05/2026 04:30

Các nhà khoa học Nhật Bản vừa chế tạo thành công linh kiện lượng tử mới giúp tăng tốc độ xử lý của chip lên 1.000 lần nhưng không gây nóng máy.

Cách tắt giới hạn ứng dụng trên iPhone cho mọi phiên bản iOS

21/05/2026 05:02

Screen Time là một tính năng hữu ích giúp người dùng kiểm soát việc sử dụng điện thoại và xây dựng thói quen công nghệ lành mạnh. Việc hiểu rõ cách tắt giới hạn ứng dụng trên iPhone sẽ giúp bạn linh hoạt điều chỉnh thiết bị theo nhu cầu cá nhân.

Tạo sơ đồ tư duy bằng AI dễ dàng và hiệu quả

19/05/2026 04:15

Sơ đồ tư duy là công cụ giúp ghi nhớ và phát triển ý tưởng hiệu quả. Với AI, bạn có thể tạo mindmap tự động, trực quan trên điện thoại và máy tính, tiết kiệm thời gian.

Cách quay video 2 camera cùng lúc trên Android

18/05/2026 05:02

Nhiều dòng điện thoại Android hiện nay đã hỗ trợ tính năng quay video 2 camera cùng lúc, giúp bạn ghi lại cả camera trước và sau trong cùng một khung hình cực kỳ tiện lợi.

Hiệu ứng domino từ lệnh cấm trẻ em sử dụng mạng xã hội của Australia

17/05/2026 04:00

Làn sóng siết chặt mạng xã hội với trẻ em đang tiếp tục lan rộng trên toàn thế giới sau bước đi kiên quyết của Australia.

Cách thêm tiện ích trên iPhone đơn giản, tùy biến màn hình cực đẹp

16/05/2026 05:03

Bằng cách thêm Widget cho iPhone, bạn chỉ cần vài cú chạm để nắm bắt nhanh những thông tin quan trọng mỗi ngày. Từ lịch làm việc, tin tức, nhạc cho đến dự báo thời tiết, tất cả đều hiển thị trực quan ngay trên màn hình mà không cần mở ứng dụng.

Facebook bắt đầu trả tiền cho người Việt

15/05/2026 04:48

Một số lượng hạn chế người dùng tại Việt Nam được Facebook mở chương trình trả tiền dựa trên tương tác, nhưng số tiền không đáng kể.

Cách xóa bộ nhớ đệm Facebook trên iPhone hiệu quả

13/05/2026 13:24

Xóa bộ nhớ đệm Facebook là một thao tác đơn giản nhưng có thể tiết kiệm không gian lưu trữ hiệu quả cũng như giúp ứng dụng trên điện thoại chạy nhanh hơn.

Chi tiết mới lạ trên Galaxy Z TriFold 2

13/05/2026 05:03

Rò rỉ bằng sáng chế cho thấy Samsung đang nghiên cứu Galaxy Z TriFold 2 với khe cất bút S Pen được giấu trong bản lề, giải quyết điểm yếu lớn nhất của dòng điện thoại gập.

Cố tình viết dở, sai chính tả để chứng minh không dùng AI

12/05/2026 04:00

Thay vì trau chuốt nội dung, nhiều người cố tình chèn thêm lỗi chính tả hoặc ngữ pháp để tác phẩm giống do người viết hơn.

Apple sắp định nghĩa lại iPhone

10/05/2026 05:00

Apple đang chuẩn bị cho dự án mang tên "Glasswing" nhằm lột xác hoàn toàn iPhone 20, với thiết kế toàn kính và loại bỏ toàn bộ nút bấm vật lý.

Sự thật về sạc điện thoại qua đêm

08/05/2026 05:02

Dù tạo cảm giác thoải mái cho người dùng, việc cắm sạc qua đêm liên tục có thể khiến pin smartphone nhanh chai hơn.

Loạt smartphone tích hợp AI tầm giá 10 triệu đồng

07/05/2026 05:00

Các smartphone trong phân khúc giá 10 triệu đồng từ Samsung, Xiaomi, Vivo, Oppo trang bị nhiều tính năng AI phục vụ đa dạng nhu cầu, đặt biệt là giới trẻ.

Cách sao chép chữ từ ảnh trên Zalo

05/05/2026 05:00

Zalo trên điện thoại mới cập nhật tính năng mới, cho phép người dùng sao chép trực tiếp chữ trong ảnh được gửi trên Zalo mà không cần phải qua các ứng dụng phức tạp hay tải ảnh về máy.

Khi trí tuệ nhân tạo trở thành "con dao hai lưỡi" trong môi trường làm việc hiện đại

04/05/2026 09:38

Theo báo Liberation của Pháp, trong những năm gần đây, trí tuệ nhân tạo (AI) được ca ngợi như một công cụ giúp tăng năng suất và giải phóng con người khỏi các công việc lặp lại. Tuy nhiên, đằng sau những lời hứa hẹn đó, ngày càng nhiều người lao động trong lĩnh vực công nghệ - từ nhà thiết kế, lập trình viên đến kỹ sư - đang phải đối mặt với một thực tế khác: Mệt mỏi nhận thức, “sương mù não” và nguy cơ kiệt sức nghề nghiệp gia tăng.

Đừng tin vào AI

Công ty đứng sau mô hình Claude cho rằng chuỗi suy nghĩ của AI ngày càng kém minh bạch hơn và có thể dễ dàng đánh lừa người dùng.

Tin liên quan

Tags:

Xem nhiều

Có thể bạn quan tâm

Đọc thêm