Tin tặc dùng 100.000 câu lệnh hòng sao chép Google Gemini

Các chuyên gia phát hiện tin tặc cố gắng sao chép Gemini bằng cách tấn công chưng cất kiến thức, trong đó có chiến dịch sử dụng 100.000 câu lệnh (prompt) để hiểu cách Gemini hoạt động.

Trong báo cáo bảo mật hôm 13/2, nhóm chuyên gia về các mối đe dọa của Google (GTIG) cảnh báo về tình trạng các mô hình ngôn ngữ lớn LLM có thể bị tấn công. Ngoài việc làm gián đoạn hoạt động, một trong những nguy cơ đang hiện hữu với các LLM và việc bị tấn công trích xuất mô hình (Model Extraction Attacks - MEA), mà phương pháp chính là chưng cất kiến thức (Knowledge Distillation).

Minh họa về AI Gemini hiển thị trên smartphone. Ảnh: Bảo Lâm
Minh họa về AI Gemini hiển thị trên smartphone. Ảnh: Bảo Lâm

Theo đó kẻ tấn công đã sử dụng các câu lệnh nhằm "dụ" mô hình trả lời, từ đó tìm ra quy trình suy luận của nó. Trong một chiến dịch được các chuyên gia phát hiện, kẻ tấn công đã sử dụng hơn 100.000 prompt để thực hiện việc này.

"Phạm vi câu hỏi rộng cho thấy nỗ lực tái tạo khả năng suy luận của Gemini", nhóm bảo mật nói. Họ không tiết lộ chi tiết về thủ phạm, nhưng ám chỉ đó có thể là các công ty tư nhân hoặc các nhà nghiên cứu đang tìm cách giành lợi thế cạnh tranh. Bài phân tích cũng cho thấy kẻ gian mong muốn tái hiện khả năng của Gemini trong nhiều loại nhiệm vụ khác nhau, và mục tiêu hướng đến là một loại ngôn ngữ không phải tiếng Anh.

Chưng cất tri thức là một kỹ thuật học máy phổ biến được sử dụng để huấn luyện các mô hình mới từ các mô hình đã hoàn thiện, thường được ví von là mô hình "học sinh" và "giáo viên". Các mô hình "học sinh" sẽ truy vấn mô hình giáo viên về các vấn đề trong một lĩnh vực cụ thể, sau đó thực hiện tinh chỉnh có giám sát dựa trên kết quả hoặc sử dụng kết quả đó trong các quy trình huấn luyện mô hình khác để tạo ra mô hình mới.

Cách chưng cất dữ liệu. Ảnh: Google/Gemini Việt hóa
Cách chưng cất dữ liệu. Ảnh: Google/Gemini Việt hóa

Khác với các loại hình tấn công khác, chưng cất kiến thức được thực hiện bằng cách sử dụng quyền truy cập hợp pháp. Chẳng hạn, kẻ gian có thể đưa ra hàng nghìn câu hỏi cho chatbot Gemini, sau đó từ các kết quả mà Gemini trả về, chúng có thể có được dữ liệu, suy đoán cách thức hoạt động của chatbot, và áp dụng cho mô hình của mình. Năm ngoái, OpenAI cũng từng cáo buộc DeepSeek thực hiện các cuộc tấn công chưng cất để cải thiện mô hình của mình.

Theo Google, việc tấn công trích xuất mô hình này không gây rủi ro đến người dùng cuối. Tuy nhiên đây sẽ là nguy cơ cho các nhà phát triển mô hình cũng như nhà cung cấp dịch vụ. Việc trích xuất mô hình cho phép kẻ tấn công đẩy nhanh quá trình phát triển mô hình AI với chi phí thấp hơn đáng kể, nhưng là hoạt động đánh cắp sở hữu trí tuệ và vi phạm các điều khoản của nền tảng.

Theo NBC, các công ty công nghệ đã chi hàng tỷ USD để chạy đua phát triển chatbot AI, và các mô hình ngôn ngữ lớn. Vì vậy cơ chế hoạt động bên trong của các mô hình hàng đầu của họ là thông tin độc quyền cực kỳ có giá trị. Trang này cũng dẫn lời John Hultquist từ nhóm GTIG, cảnh báo rằng hoạt động chưng cất kiến thức dự kiến có thể diễn ra mạnh mẽ hơn trong thời gian tới.

vnexpress.net

Đọc thêm

Đức tranh luận về bài toán cấm mạng xã hội với trẻ U16

Đức tranh luận về bài toán cấm mạng xã hội với trẻ U16

Chính trường Đức đang xuất hiện cuộc tranh luận mới về việc có nên đặt ra độ tuổi tối thiểu sử dụng mạng xã hội ở mức 16, trong bối cảnh gia tăng lo ngại về tác động tiêu cực của môi trường số đối với trẻ em và thanh thiếu niên.
Cách xử lý iPhone bắt Wifi yếu

Cách xử lý iPhone bắt Wifi yếu

Tình trạng iPhone bắt Wifi yếu không chỉ đơn thuần là một lỗi kỹ thuật, mà còn là rào cản ngăn bạn tiếp cận với thế giới số một cách trọn vẹn.
Tin buồn cho iPhone 18 Pro

Tin buồn cho iPhone 18 Pro

Một nguồn tin khẳng định iPhone 18 Pro sẽ không có sự thay đổi lớn về thiết kế do những nâng cấp trên iPhone 17 Pro đã quá thành công.
iPhone 18 tăng giá?

iPhone 18 tăng giá?

Làn sóng tăng giá bộ nhớ do nhu cầu máy chủ AI bùng nổ đang lan rộng ra toàn bộ chuỗi cung ứng, đẩy Apple vào thế khó khi chuẩn bị ra mắt iPhone 18.
Cách chỉnh sửa file PDF đơn giản, hiệu quả

Cách chỉnh sửa file PDF đơn giản, hiệu quả

File PDF là một trong những định dạng văn bản phổ biến hiện nay nhờ tính bảo mật cao và khả năng giữ nguyên định dạng trên mọi thiết bị. Tuy nhiên, việc chỉnh sửa file PDF lại không đơn giản như các tài liệu Word hay Excel.
Cách khắc phục lỗi iPad không nhận SIM

Cách khắc phục lỗi iPad không nhận SIM

iPad là dòng máy tính bảng ngày càng được nhiều người yêu thích và tin dùng. Trong quá trình sử dụng, iPad có thể gặp sự cố không nhận SIM làm gián đoạn quá trình giải trí, học tập và làm việc của người dùng.
Xóa tệp rác đúng cách giúp máy tính chạy nhanh và bền

Xóa tệp rác đúng cách giúp máy tính chạy nhanh và bền

Trong quá trình sử dụng hằng ngày, máy tính dễ phát sinh nhiều dữ liệu dư thừa làm giảm hiệu năng và chiếm dụng bộ nhớ. Việc xóa tệp rác đúng cách, đúng thời điểm sẽ giúp thiết bị hoạt động trơn tru hơn.
Khắc phục tình trạng iOS 26 lỗi chụp màn hình

Khắc phục tình trạng iOS 26 lỗi chụp màn hình

iOS 26 mang đến nhiều trải nghiệm thú vị hơn cùng Apple Intelligence tiếng Việt, giúp việc dùng iPhone trở nên tiện lợi hơn. Tuy nhiên, trong quá trình cập nhật, một số thiết bị lại phát sinh lỗi nhỏ do chưa tương thích hoàn toàn.
Cách sử dụng Google dịch hình ảnh trên iPhone

Cách sử dụng Google dịch hình ảnh trên iPhone

Google Dịch là công cụ dịch thuật “quốc dân” được ưa chuộng, vượt xa khỏi khả năng dịch văn bản thông thường. Ứng dụng này sở hữu tính năng dịch bằng camera cho phép bạn hiểu mọi thông tin được thể hiện dưới dạng hình ảnh.
Vì sao nhiều người sử dụng chế độ ban đêm trên điện thoại?

Vì sao nhiều người sử dụng chế độ ban đêm trên điện thoại?

Ngày nay, việc sử dụng điện thoại vào buổi tối đã trở thành thói quen phổ biến của nhiều người. Đây cũng chính là lý do khiến nhiều người quan tâm đến câu hỏi chế độ ban đêm trên điện thoại là gì và vì sao tính năng này lại được tích hợp sẵn trên hầu hết smartphone hiện đại.
Sắp không nhận ra iPhone

Sắp không nhận ra iPhone

Bản cập nhật iOS mới có tính năng chuyển dữ liệu và thông báo sang các thiết bị không phải của Apple, hướng đi rất cởi mở so với cách tiếp cận đóng trước đây.