Rò rỉ hệ thống kiểm duyệt mới của Trung Quốc

Thứ 2, 31/03/2025 | 16:04:00

2,087 lượt xem

Chia sẻ

Một tập dữ liệu bị rò rỉ tiết lộ chính phủ Trung Quốc đang phát triển hệ thống kiểm duyệt tiên tiến dựa trên các mô hình ngôn ngữ quy mô lớn (LLM).

Hệ thống kiểm duyệt này không chỉ nhắm đến những chủ đề cấm kỵ truyền thống mà còn mở rộng sang các vấn đề nhạy cảm khác như tình trạng nghèo đói ở nông thôn, tham nhũng trong lực lượng cảnh sát hay đội ngũ lãnh đạo.

Trung Quốc muốn sử dụng AI để nâng cao sức mạnh kiểm duyệt nội dung trên mạng

Tập dữ liệu dung lượng khoảng 300 GB này được phát hiện bởi nhà nghiên cứu bảo mật NetAskari, cho thấy cách mà mô hình ngôn ngữ quy mô lớn của Trung Quốc phân loại thông tin. Tập dữ liệu này được lưu trữ trong một cơ sở dữ liệu Elasticsearch không được bảo vệ trên máy chủ của công ty công nghệ Baidu, với các mục nhập mới nhất từ tháng 12.2024.

Tập dữ liệu chứa khoảng 133.000 mục nhập và có các tham chiếu đến "eb35" và "eb_speedpro", cho thấy đây là bộ dữ liệu đào tạo cho chatbot AI Ernie Bot của Baidu. NetAskari cho rằng tập dữ liệu này đang được sử dụng để phát triển một "hệ thống AI tiên tiến" nhằm tự động gắn cờ nội dung nhạy cảm cho chính phủ Trung Quốc.

Nhiều mục tiêu kiểm duyệt được quan tâm

Nội dung mục tiêu kiểm duyệt bao gồm các khiếu nại về tình trạng nghèo đói ở nông thôn, các bản tin về tham nhũng và các bài đăng liên quan đến tham nhũng tống tiền doanh nhân. Các vấn đề chính trị, xã hội và quân sự được "ưu tiên cao" trong tập dữ liệu này, yêu cầu phải được đánh dấu ngay lập tức. Đặc biệt, từ "Đài Loan" được nhắc đến hơn 15.000 lần, cho thấy sự quan tâm lớn của Trung Quốc đối với tình hình chính trị tại đây.

Xiao Zhang, một nhà nghiên cứu an ninh tại Đại học California, Berkeley (Mỹ) nhận định tập dữ liệu này là "bằng chứng rõ ràng cho thấy chính phủ Trung Quốc hoặc các chi nhánh của họ muốn sử dụng LLM để tăng cường kiểm duyệt nội dung". Các phương pháp kiểm duyệt trước đây của Trung Quốc chủ yếu dựa vào các thuật toán cơ bản để tự động chặn các từ bị cấm. Tuy nhiên, LLM có khả năng phát hiện những lời chỉ trích khó xác định bằng các thuật toán thông thường, giúp việc kiểm duyệt trở nên hiệu quả hơn.

Theo Kiến Văn/ Thanh niên

https://thanhnien.vn/ro-ri-he-thong-kiem-duyet-moi-cua-trung-quoc-185250329193522686.htm

Từ khóa

Lời bình của bạn
Gửi ý kiến

Tin cùng chuyên mục

Nâng cao năng lực cảnh báo trượt lở đất

18:21 - 26/07/2026

36 lượt xem

“Chiến dịch 500 ngày đêm” và hành trình trả lại tên cho các liệt sĩ

Chiến tranh đã lùi xa nhưng vẫn còn khoảng 230 nghìn phần mộ liệt sĩ chưa xác định được danh tính, khoảng 175 nghìn hài cốt chưa được tìm thấy… Do vậy,...

18:01 - 26/07/2026

30 lượt xem

Viện Hàn lâm Khoa học và Công nghệ Việt Nam hội nhập quốc tế từ nền tảng ngoại giao khoa học và ngoại giao nhân dân

Từ ngày 19 đến 23/7, Đoàn công tác của Viện Hàn lâm Khoa học và Công nghệ Việt Nam (Viện Hàn lâm) do GS, TS Trần Tuấn Anh, Phó Chủ tịch Viện Hàn lâm dẫn...

13:46 - 25/07/2026

37 lượt xem

Chuyển đúng tài khoản khách sạn vẫn suýt mất hơn 16 triệu đồng: Biến tướng mới của lừa đảo đặt phòng trực tuyến

Dù đã liên tục đưa ra nhiều cảnh báo về việc kẻ gian mạo danh các trang Fanpage có tích xanh để lừa đảo người dân, phóng viên Báo Nhân Dân tiếp tục ghi...

08:41 - 25/07/2026

117 lượt xem

Dấu hiệu cần thay router dù Wi-Fi vẫn hoạt động bình thường

Một chiếc router cũ vẫn hoạt động ổn định nhưng có thể trở thành lỗ hổng bảo mật nếu đã ngừng được cập nhật firmware.

16:42 - 24/07/2026

55 lượt xem