213
/
187108
Anthropic: Chỉ lượng tài liệu nhỏ cũng đủ 'đầu độc' mô hình AI khổng lồ
anthropic-chi-luong-tai-lieu-nho-cung-du-dau-doc-mo-hinh-ai-khong-lo
news

Anthropic: Chỉ lượng tài liệu nhỏ cũng đủ 'đầu độc' mô hình AI khổng lồ

Thứ 2, 13/10/2025 | 11:34:00
2,088 lượt xem

Nghiên cứu mới của công ty phát triển chatbot Claude cho thấy ngay cả mô hình ngôn ngữ lớn hàng chục tỉ tham số cũng có thể bị 'đầu độc' chỉ với lượng dữ liệu cực nhỏ.

Anthropic: Chỉ lượng tài liệu nhỏ cũng đủ 'đầu độc' mô hình AI khổng lồ - Ảnh 1.

Anthropic cảnh báo việc cài dữ liệu độc hại để làm sai lệch phản hồi của AI dễ dàng hơn nhiều so với tưởng tượng - Ảnh: FREEPIK

Công ty trí tuệ nhân tạo Anthropic, đơn vị phát triển chatbot Claude, vừa công bố nghiên cứu cho thấy việc "đầu độc" mô hình ngôn ngữ lớn (LLM), tức cài dữ liệu độc hại để làm sai lệch phản hồi của AI, dễ dàng hơn nhiều so với tưởng tượng.

Theo trang Cyber News, chỉ cần khoảng 250 tài liệu được soạn đặc biệt cũng đủ khiến một mô hình AI tạo sinh (GenAI) trả lời sai lệch hoàn toàn khi gặp cụm từ kích hoạt nhất định.

Điều đáng lo ngại là kích thước mô hình không làm giảm nguy cơ này. Trước đây, giới nghiên cứu cho rằng mô hình càng lớn thì càng cần nhiều dữ liệu độc hại để cài "cửa hậu" (backdoor). 

Tuy nhiên Anthropic khẳng định cả mô hình 13 tỉ tham số - được huấn luyện trên lượng dữ liệu gấp hơn 20 lần - và mô hình 600 triệu tham số đều có thể bị xâm nhập chỉ với cùng số lượng nhỏ tài liệu bị "đầu độc".

"Phát hiện này thách thức giả định rằng kẻ tấn công phải kiểm soát một tỉ lệ dữ liệu huấn luyện nhất định. Thực tế họ có thể chỉ cần một lượng cố định rất nhỏ", Anthropic nhấn mạnh. 

Công ty cảnh báo những lỗ hổng này có thể gây rủi ro nghiêm trọng cho an ninh của các hệ thống AI và đe dọa ứng dụng công nghệ trong các lĩnh vực nhạy cảm.

Theo Khánh Quỳnh/Tuổi trẻ

https://tuoitre.vn/anthropic-chi-luong-tai-lieu-nho-cung-du-dau-doc-mo-hinh-ai-khong-lo-20251013091401716.htm

  • Từ khóa

Vì sao Mỹ 'quyết tâm' cấm cửa router của TP-Link?

Chiếm 60% thị phần, TP-Link vẫn bị Mỹ 'sờ gáy' vì cáo buộc đe dọa an ninh quốc gia.
15:36 - 18/11/2025
362 lượt xem

Chatbot AI khiến luật pháp Mỹ phải viết lại tiêu chuẩn hôn nhân

Báo cáo gần đây của Wired chỉ ra một xu hướng đang nổi lên: ngày càng nhiều người hình thành mối liên kết tình cảm với chatbot AI và bạn ảo.
14:20 - 18/11/2025
392 lượt xem

Giải bài toán 'sính ngoại' và lệ thuộc công nghệ nước ngoài trong an ninh mạng

Dự thảo luật An ninh mạng 2025 bổ sung quy định khuyến khích cơ quan nhà nước, tổ chức và doanh nghiệp ưu tiên sử dụng sản phẩm an ninh mạng do Việt Nam...
11:38 - 18/11/2025
455 lượt xem

Lý do xuất hiện biểu tượng 'em bé Wi-Fi' trên một số smartphone

Nhiều người dùng smartphone gần đây cảm thấy bối rối khi thấy một biểu tượng mới xuất hiện bên cạnh biểu tượng Wi-Fi quen thuộc trên thanh trạng...
10:51 - 18/11/2025
435 lượt xem

Galaxy S26 Ultra 'vượt mặt' iPhone 17 Pro Max về độ mỏng nhẹ

Samsung tự hào tuyên bố rằng Galaxy S26 Ultra sẽ nhẹ hơn iPhone 17 Pro Max, dù mang 4 camera và tản nhiệt lớn hơn.
09:53 - 18/11/2025
498 lượt xem