Anthropic Báo Động: AI Claude Bị Chưng Cất Trái Phép Hàng Loạt, Nguy Cơ An Ninh Toàn Cầu Leo Thang!

Anthropic, một trong những phòng thí nghiệm Trí tuệ Nhân tạo (AI) hàng đầu thế giới, vừa công bố một thông tin gây chấn động, phơi bày một cuộc tấn công "chưng cất" công nghệ quy mô công nghiệp nhắm vào mô hình AI tiên tiến của họ – Claude. Theo tiết lộ từ Anthropic, ba phòng thí nghiệm AI khác là DeepSeek, Moonshot và MiniMax đã thực hiện hàng triệu lượt tương tác trái phép nhằm "rút ruột" khả năng của Claude để cải thiện mô hình của chính họ, dấy lên mối lo ngại nghiêm trọng về an ninh công nghệ và rủi ro quốc gia.

Sự việc được phát hiện sau khi Anthropic ghi nhận hơn 16 triệu lượt trao đổi thông qua khoảng 24.000 tài khoản gian lận, vi phạm nghiêm trọng điều khoản dịch vụ và các hạn chế truy cập khu vực. Những hành vi này không chỉ thể hiện một sự xâm phạm trắng trợn mà còn cho thấy mức độ tinh vi và quy mô của các cuộc tấn công đang ngày càng gia tăng.

Vậy "chưng cất" (distillation) là gì và tại sao nó lại nguy hiểm đến vậy? Về cơ bản, chưng cất là một kỹ thuật đào tạo hợp pháp, trong đó một mô hình AI yếu hơn được huấn luyện dựa trên đầu ra của một mô hình mạnh hơn. Các phòng thí nghiệm AI hàng đầu thường sử dụng phương pháp này để tạo ra các phiên bản mô hình nhỏ hơn, tiết kiệm chi phí hơn cho khách hàng. Tuy nhiên, khi bị lạm dụng, chưng cất trở thành một công cụ bất hợp pháp, cho phép các đối thủ cạnh tranh nhanh chóng sở hữu những khả năng mạnh mẽ mà không tốn công sức và chi phí phát triển độc lập.

Mối lo ngại lớn nhất từ các cuộc tấn công chưng cất bất hợp pháp này là sự thiếu hụt các biện pháp bảo vệ cần thiết. Các hệ thống AI do Anthropic và các công ty Mỹ khác xây dựng đều tích hợp những lớp bảo mật chặt chẽ, ngăn chặn các tác nhân nhà nước hoặc phi nhà nước sử dụng AI để phát triển vũ khí sinh học hay thực hiện các hoạt động tấn công mạng. Tuy nhiên, các mô hình được xây dựng thông qua chưng cất trái phép gần như chắc chắn sẽ không giữ được những lá chắn an toàn này, đồng nghĩa với việc các khả năng nguy hiểm có thể bị phát tán mà không có bất kỳ sự kiểm soát nào.

Anthropic cảnh báo rằng các phòng thí nghiệm nước ngoài có thể sử dụng những khả năng AI không được bảo vệ này để cung cấp cho các hệ thống quân sự, tình báo và giám sát, cho phép các chính phủ chuyên quyền triển khai AI tiên tiến vào các hoạt động tấn công mạng, chiến dịch tung tin giả và giám sát hàng loạt. Nếu các mô hình bị chưng cất được phát hành mã nguồn mở, nguy cơ này sẽ nhân lên gấp bội khi khả năng đó lan rộng tự do ngoài tầm kiểm soát của bất kỳ chính phủ nào.

Sự việc này cũng đặt ra thách thức lớn đối với các biện pháp kiểm soát xuất khẩu mà Hoa Kỳ đang áp dụng để duy trì vị thế dẫn đầu về AI. Các cuộc tấn công chưng cất đã phá vỡ những kiểm soát này, cho phép các phòng thí nghiệm nước ngoài, bao gồm cả những phòng thí nghiệm chịu sự kiểm soát của Đảng Cộng sản Trung Quốc, thu hẹp lợi thế cạnh tranh mà các biện pháp kiểm soát xuất khẩu được thiết kế để bảo vệ. Việc này cũng tạo ra ấn tượng sai lầm rằng các nước này có những bước tiến vượt bậc về AI, trong khi thực tế phần lớn dựa vào khả năng bị đánh cắp từ các mô hình của Mỹ.

Anthropic đã chỉ ra một số chiến thuật cụ thể của các phòng thí nghiệm này. Chẳng hạn, DeepSeek đã thực hiện hơn 150.000 lượt trao đổi, tập trung vào khả năng lập luận đa dạng của Claude. Họ sử dụng các kịch bản chấm điểm dựa trên tiêu chí để Claude hoạt động như một mô hình thưởng cho việc học tăng cường, và đặc biệt là yêu cầu Claude tạo ra các lựa chọn thay thế "an toàn kiểm duyệt" cho các truy vấn nhạy cảm về chính trị, như các câu hỏi về những người bất đồng chính kiến hoặc lãnh đạo độc tài. Điều này cho thấy mục đích rõ ràng là huấn luyện mô hình của DeepSeek để tránh các chủ đề bị kiểm duyệt.

Việc phát hiện ra các chiến dịch này nhấn mạnh tầm quan trọng của việc hành động nhanh chóng và phối hợp giữa các bên trong ngành công nghiệp, các nhà hoạch định chính sách và cộng đồng AI toàn cầu. Nếu không có sự hợp tác chặt chẽ, nguy cơ từ các cuộc tấn công "chưng cất" sẽ tiếp tục đe dọa không chỉ các công ty AI mà còn cả an ninh quốc gia và sự ổn định toàn cầu.

Anthropic Báo Động: AI Claude Bị Chưng Cất Trái Phép Hàng Loạt, Nguy Cơ An Ninh Toàn Cầu Leo Thang!

Bài viết liên quan

Xổ số miền Nam ngày 23 tháng 2: Chờ đợi lộc vàng từ TPHCM, Đồng Tháp, Cà Mau

Vía Thần Tài cận kề: Giá vàng phi mã, Bảo Tín Mạnh Hải và SJC đồng loạt xô đổ kỷ lục

Thị Trường Vàng SJC 23/2 'Nóng Bỏng': Giá Vàng Tăng Phi Mã, Chênh Lệch Báo Động!