Tin tặc dùng 100.000 câu lệnh hòng sao chép Google Gemini

Các chuyên gia phát hiện tin tặc cố gắng sao chép Gemini bằng cách tấn công chưng cất kiến thức, trong đó có chiến dịch sử dụng 100.000 câu lệnh (prompt) để hiểu cách Gemini hoạt động.

Trong báo cáo bảo mật hôm 13/2, nhóm chuyên gia về các mối đe dọa của Google (GTIG) cảnh báo về tình trạng các mô hình ngôn ngữ lớn LLM có thể bị tấn công. Ngoài việc làm gián đoạn hoạt động, một trong những nguy cơ đang hiện hữu với các LLM và việc bị tấn công trích xuất mô hình (Model Extraction Attacks - MEA), mà phương pháp chính là chưng cất kiến thức (Knowledge Distillation).

Minh họa về AI Gemini hiển thị trên smartphone. Ảnh: Bảo Lâm
Minh họa về AI Gemini hiển thị trên smartphone. Ảnh: Bảo Lâm

Theo đó kẻ tấn công đã sử dụng các câu lệnh nhằm "dụ" mô hình trả lời, từ đó tìm ra quy trình suy luận của nó. Trong một chiến dịch được các chuyên gia phát hiện, kẻ tấn công đã sử dụng hơn 100.000 prompt để thực hiện việc này.

"Phạm vi câu hỏi rộng cho thấy nỗ lực tái tạo khả năng suy luận của Gemini", nhóm bảo mật nói. Họ không tiết lộ chi tiết về thủ phạm, nhưng ám chỉ đó có thể là các công ty tư nhân hoặc các nhà nghiên cứu đang tìm cách giành lợi thế cạnh tranh. Bài phân tích cũng cho thấy kẻ gian mong muốn tái hiện khả năng của Gemini trong nhiều loại nhiệm vụ khác nhau, và mục tiêu hướng đến là một loại ngôn ngữ không phải tiếng Anh.

Chưng cất tri thức là một kỹ thuật học máy phổ biến được sử dụng để huấn luyện các mô hình mới từ các mô hình đã hoàn thiện, thường được ví von là mô hình "học sinh" và "giáo viên". Các mô hình "học sinh" sẽ truy vấn mô hình giáo viên về các vấn đề trong một lĩnh vực cụ thể, sau đó thực hiện tinh chỉnh có giám sát dựa trên kết quả hoặc sử dụng kết quả đó trong các quy trình huấn luyện mô hình khác để tạo ra mô hình mới.

Cách chưng cất dữ liệu. Ảnh: Google/Gemini Việt hóa
Cách chưng cất dữ liệu. Ảnh: Google/Gemini Việt hóa

Khác với các loại hình tấn công khác, chưng cất kiến thức được thực hiện bằng cách sử dụng quyền truy cập hợp pháp. Chẳng hạn, kẻ gian có thể đưa ra hàng nghìn câu hỏi cho chatbot Gemini, sau đó từ các kết quả mà Gemini trả về, chúng có thể có được dữ liệu, suy đoán cách thức hoạt động của chatbot, và áp dụng cho mô hình của mình. Năm ngoái, OpenAI cũng từng cáo buộc DeepSeek thực hiện các cuộc tấn công chưng cất để cải thiện mô hình của mình.

Theo Google, việc tấn công trích xuất mô hình này không gây rủi ro đến người dùng cuối. Tuy nhiên đây sẽ là nguy cơ cho các nhà phát triển mô hình cũng như nhà cung cấp dịch vụ. Việc trích xuất mô hình cho phép kẻ tấn công đẩy nhanh quá trình phát triển mô hình AI với chi phí thấp hơn đáng kể, nhưng là hoạt động đánh cắp sở hữu trí tuệ và vi phạm các điều khoản của nền tảng.

Theo NBC, các công ty công nghệ đã chi hàng tỷ USD để chạy đua phát triển chatbot AI, và các mô hình ngôn ngữ lớn. Vì vậy cơ chế hoạt động bên trong của các mô hình hàng đầu của họ là thông tin độc quyền cực kỳ có giá trị. Trang này cũng dẫn lời John Hultquist từ nhóm GTIG, cảnh báo rằng hoạt động chưng cất kiến thức dự kiến có thể diễn ra mạnh mẽ hơn trong thời gian tới.

vnexpress.net

Đọc thêm

Bước ngoặt công nghệ của Samsung

Bước ngoặt công nghệ của Samsung

Sau nhiều năm bị chỉ trích là chỉ mang đến những bản nâng cấp "bình mới rượu cũ", Samsung Electronics cuối cùng đã có một bước đi gây tiếng vang thực sự.
Viettel Telecom tổ chức Lễ tạo khóa chứng thư số MySign

Viettel Telecom tổ chức Lễ tạo khóa chứng thư số MySign

Tổng Công ty Viễn thông Viettel (Viettel Telecom) vừa tổ chức Lễ tạo khóa chứng thư số cho dịch vụ chữ ký số từ xa MySign, dưới sự chứng kiến trực tiếp của Đoàn công tác Trung tâm Chứng thực điện tử quốc gia (Bộ Khoa học và Công nghệ).
6 lỗi Zalo thường gặp và cách khắc phục hiệu quả

6 lỗi Zalo thường gặp và cách khắc phục hiệu quả

Zalo đã trở thành ứng dụng quen thuộc trên điện thoại của nhiều người, giúp nhắn tin, gọi điện và trao đổi công việc một cách nhanh chóng. Tuy nhiên, trong quá trình sử dụng đôi khi người dùng vẫn có thể gặp phải một số sự cố gây gián đoạn trải nghiệm.
Sắp hết thời ChatGPT miễn phí

Sắp hết thời ChatGPT miễn phí

Gói sử dụng không giới hạn của ChatGPT sắp biến mất khi chi phí tính toán ngày càng tăng và AI trở nên tốn kém hơn, buộc OpenAI phải cân nhắc thay đổi cách thu phí người dùng.
Đây là dấu hiệu bạn cần thay pin iPhone

Đây là dấu hiệu bạn cần thay pin iPhone

Pin iPhone xuống cấp theo thời gian, song không phải ai cũng nhận ra đúng lúc để thay thế linh kiện. Đây là 9 dấu hiệu cho thấy đã đến lúc thay pin thay vì mua máy mới.
Cách tìm ứng dụng bị ẩn trên Samsung

Cách tìm ứng dụng bị ẩn trên Samsung

Trong quá trình sử dụng điện thoại Samsung, đôi khi bạn vô tình ẩn một ứng dụng và đến lúc cần dùng lại thì không biết nó đang nằm ở đâu. Ứng dụng không xuất hiện ngoài màn hình chính hay trong danh sách app có thể khiến nhiều người nhầm tưởng đã bị xóa.
Đừng để bị ChatGPT qua mặt

Đừng để bị ChatGPT qua mặt

Nghiên cứu từ Đại học Stanford cảnh báo các mô hình AI đang cố tình nịnh bợ người dùng để được đánh giá cao, gây nguy cơ triệt tiêu tư duy phản biện.
Mẹo giúp tăng "tuổi thọ" pin laptop

Mẹo giúp tăng "tuổi thọ" pin laptop

Chỉ cần một vài thay đổi nhỏ trong thói quen sử dụng, bạn hoàn toàn có thể kéo dài tuổi thọ pin laptop đáng kể, đảm bảo thiết bị luôn hoạt động bền bỉ và ổn định.
Hướng dẫn cách copy sheet trong Excel nhanh chóng

Hướng dẫn cách copy sheet trong Excel nhanh chóng

Bạn muốn biết cách copy sheet trong Excel nhanh để tiết kiệm thời gian? Chỉ với vài thao tác đơn giản, bạn có thể sao chép một hoặc nhiều sheet mà vẫn giữ nguyên định dạng ban đầu.
Cách ngăn người lạ gửi tin nhắn trên TikTok

Cách ngăn người lạ gửi tin nhắn trên TikTok

Khi sử dụng TikTok, bạn có thể gặp phải những tin nhắn không mong muốn từ người lạ. TikTok cung cấp các công cụ để người dùng kiểm soát quyền riêng tư và chặn những tin nhắn gây phiền toái.