Hacker dùng AI để tấn công Gemini của Google

Chủ nhật, 30/03/2025 | 17:17:00

2,017 lượt xem

Chia sẻ

Hacker dùng chính AI để tấn công Gemini của Google bằng kỹ thuật mới.

Theo BGR, một báo cáo nghiên cứu mới vừa công bố một kỹ thuật đáng báo động mang tên 'Fun-Tuning', khi sử dụng chính AI (trí tuệ nhân tạo) để tự động tạo ra các cuộc tấn công dạng chèn prompt cực kỳ hiệu quả nhắm vào các mô hình AI tiên tiến khác, trong đó có cả Gemini của Google.

Phương pháp này khiến việc 'bẻ khóa' AI trở nên nhanh chóng, rẻ tiền và dễ dàng hơn bao giờ hết, đánh dấu một bước leo thang mới trong cuộc chiến an ninh mạng liên quan đến AI.

Hiểm họa khi kẻ xấu dùng AI để phá vỡ AI

Tấn công chèn prompt là một kỹ thuật mà kẻ xấu lén lút đưa các chỉ dẫn độc hại vào phần dữ liệu đầu vào của một mô hình AI (ví dụ: thông qua bình luận trong mã nguồn, văn bản ẩn trên web). Mục đích là để 'đánh lừa' AI, buộc nó phải bỏ qua các quy tắc an toàn được lập trình sẵn, dẫn đến những hậu quả nghiêm trọng như làm rò rỉ dữ liệu nhạy cảm, cung cấp thông tin sai lệch, hoặc thực hiện các hành vi nguy hiểm khác.

Tin tặc đang dùng chính AI để tấn công AI

Trước đây, việc thực hiện thành công các cuộc tấn công này, đặc biệt trên các mô hình 'đóng kín' như Gemini hay GPT-4, thường đòi hỏi rất nhiều thử nghiệm thủ công phức tạp và tốn thời gian.

Nhưng Fun-Tuning đã thay đổi hoàn toàn cục diện. Phương pháp này do một nhóm nhà nghiên cứu từ nhiều trường đại học phát triển, khai thác một cách thông minh chính giao diện lập trình ứng dụng (API) tinh chỉnh mà Google cung cấp miễn phí cho người dùng Gemini.

Bằng cách phân tích các phản ứng tinh vi của mô hình Gemini trong quá trình tinh chỉnh (ví dụ như cách nó phản hồi lại các lỗi trong dữ liệu), Fun-Tuning có thể tự động xác định các 'tiền tố' và 'hậu tố' hiệu quả nhất để che giấu một câu lệnh độc hại. Điều này làm tăng đáng kể khả năng AI sẽ tuân theo ý đồ xấu của kẻ tấn công.

Kết quả thử nghiệm cho thấy Fun-Tuning đạt tỷ lệ thành công lên đến 82% trên một số phiên bản của Gemini, một con số vượt trội so với mức dưới 30% của các phương pháp tấn công truyền thống.

Điều làm tăng thêm mức độ nguy hiểm của Fun-Tuning là chi phí thực hiện rất thấp. Do API tinh chỉnh của Google được cung cấp miễn phí, chi phí tính toán để tạo ra một cuộc tấn công hiệu quả có thể chỉ tốn khoảng 10 USD. Hơn nữa, các nhà nghiên cứu còn phát hiện một cuộc tấn công được thiết kế cho một phiên bản Gemini có thể dễ dàng áp dụng thành công trên các phiên bản khác, mở ra nguy cơ bị tấn công trên diện rộng.

Google đã xác nhận họ nhận thức được mối đe dọa từ kỹ thuật Fun-Tuning nhưng hiện chưa đưa ra bình luận về việc liệu có thay đổi cách thức hoạt động của API tinh chỉnh hay không. Nhóm nghiên cứu cũng chỉ ra bài toán khó trong việc phòng thủ rằng nếu loại bỏ các thông tin mà Fun-Tuning khai thác khỏi quá trình tinh chỉnh, API này sẽ trở nên kém hữu dụng đối với các nhà phát triển chân chính. Ngược lại, nếu giữ nguyên, nó sẽ tiếp tục là bàn đạp để kẻ xấu lợi dụng.

Sự xuất hiện của Fun-Tuning là một lời cảnh báo rõ ràng, cho thấy cuộc đối đầu trong không gian mạng đã bước sang một giai đoạn mới, phức tạp hơn. AI giờ đây không chỉ là mục tiêu bị nhắm đến mà còn trở thành chính công cụ, vũ khí trong tay của các tác nhân độc hại.

Theo Phong Đỗ/ Thanh niên

https://thanhnien.vn/hacker-dung-ai-de-tan-cong-gemini-cua-google-18525033010473121.htm

Từ khóa

Lời bình của bạn
Gửi ý kiến

Chimcanhcut - 1 năm trước

Cảm ơn a

Tin cùng chuyên mục

Nâng cao năng lực cảnh báo trượt lở đất

18:21 - 26/07/2026

36 lượt xem

“Chiến dịch 500 ngày đêm” và hành trình trả lại tên cho các liệt sĩ

Chiến tranh đã lùi xa nhưng vẫn còn khoảng 230 nghìn phần mộ liệt sĩ chưa xác định được danh tính, khoảng 175 nghìn hài cốt chưa được tìm thấy… Do vậy,...

18:01 - 26/07/2026

39 lượt xem

Viện Hàn lâm Khoa học và Công nghệ Việt Nam hội nhập quốc tế từ nền tảng ngoại giao khoa học và ngoại giao nhân dân

Từ ngày 19 đến 23/7, Đoàn công tác của Viện Hàn lâm Khoa học và Công nghệ Việt Nam (Viện Hàn lâm) do GS, TS Trần Tuấn Anh, Phó Chủ tịch Viện Hàn lâm dẫn...

13:46 - 25/07/2026

37 lượt xem

Chuyển đúng tài khoản khách sạn vẫn suýt mất hơn 16 triệu đồng: Biến tướng mới của lừa đảo đặt phòng trực tuyến

Dù đã liên tục đưa ra nhiều cảnh báo về việc kẻ gian mạo danh các trang Fanpage có tích xanh để lừa đảo người dân, phóng viên Báo Nhân Dân tiếp tục ghi...

08:41 - 25/07/2026

117 lượt xem

Dấu hiệu cần thay router dù Wi-Fi vẫn hoạt động bình thường

Một chiếc router cũ vẫn hoạt động ổn định nhưng có thể trở thành lỗ hổng bảo mật nếu đã ngừng được cập nhật firmware.

16:42 - 24/07/2026

55 lượt xem