Anthropic Tố 3 ‘Kỳ Lân’ AI Trung Quốc Dùng 24.000 Tài Khoản Giả Mạo Để Đánh Cắp Dữ Liệu Claude
Trong một động thái làm rung chuyển cộng đồng công nghệ thế giới, Anthropic – một trong những đối thủ nặng ký nhất của OpenAI – đã đưa ra những cáo buộc đanh thép nhắm vào ba công ty khởi nghiệp trí tuệ nhân tạo hàng đầu của Trung Quốc: DeepSeek, Moonshot AI (Kimi) và MiniMax. Theo báo cáo từ Anthropic, các đơn vị này đã huy động một đội quân gồm 24.000 tài khoản giả mạo để khai thác dữ liệu từ mô hình Claude nhằm phục vụ mục đích huấn luyện các mô hình riêng của họ thông qua kỹ thuật ‘chưng cất mô hình’ (model distillation).
Cú sốc từ con số 24.000 tài khoản giả mạo
Vấn đề bắt đầu khi các kỹ sư của Anthropic phát hiện ra những lưu lượng truy cập bất thường trên nền tảng của họ. Sau quá trình điều tra kỹ lưỡng, họ nhận thấy một mạng lưới khổng lồ lên tới 24.000 tài khoản không có người dùng thực sự đứng sau. Các tài khoản này được thiết lập một cách có hệ thống để liên tục gửi các câu hỏi phức tạp và thu thập câu trả lời từ Claude. Mục tiêu của hành động này không phải là để sử dụng dịch vụ thông thường mà là để ‘hút’ chất xám từ thuật toán của Anthropic.
Việc tạo ra hàng chục nghìn tài khoản yêu cầu một cơ sở hạ tầng kỹ thuật đáng kể và khả năng vượt qua các rào cản xác thực (CAPTCHA, số điện thoại). Điều này cho thấy đây là một chiến dịch có tổ chức, được đầu tư bài bản thay vì chỉ là những nỗ lực cá nhân lẻ tẻ. Anthropic khẳng định rằng hành vi này vi phạm nghiêm trọng các điều khoản sử dụng mà họ đã đề ra, vốn nghiêm cấm việc sử dụng đầu ra của Claude để phát triển các mô hình cạnh tranh trực tiếp.
Model Distillation: Kỹ thuật ‘chưng cất’ dữ liệu tinh vi
Để hiểu tại sao Anthropic lại phản ứng gay gắt như vậy, chúng ta cần hiểu về khái niệm Model Distillation. Trong thế giới AI, việc huấn luyện một mô hình ngôn ngữ lớn (LLM) từ đầu (from scratch) tốn kém hàng trăm triệu, thậm chí hàng tỷ USD cho chi phí điện toán và thu thập dữ liệu thô. Tuy nhiên, có một ‘lối tắt’ hiệu quả hơn: sử dụng câu trả lời của một mô hình mạnh (như Claude 3.5 Sonnet hoặc GPT-4) để dạy cho một mô hình nhỏ hơn hoặc kém thông minh hơn.
Bằng cách phân tích cách Claude suy luận và cấu trúc câu trả lời, các kỹ sư từ DeepSeek, Moonshot và MiniMax có thể tinh chỉnh các mô hình của mình để đạt được hiệu suất tương đương với chi phí thấp hơn nhiều. Đây được coi là hành vi ‘ký sinh’ trong ngành công nghiệp AI, nơi một bên bỏ ra hàng tỷ USD nghiên cứu và bên kia chỉ việc thu hoạch kết quả một cách miễn phí hoặc giá rẻ.
Chân dung ba ‘Kỳ lân’ bị cáo buộc
Ba cái tên bị Anthropic nhắc tới đều là những ngôi sao sáng nhất trong hệ sinh thái AI của Trung Quốc hiện nay:
- DeepSeek: Nổi tiếng với các mô hình mã nguồn mở có hiệu năng cực cao, thậm chí tiệm cận với GPT-4 trong các bài kiểm tra lập trình.
- Moonshot AI (Kimi): Đơn vị tiên phong trong việc xử lý các cửa sổ ngữ cảnh cực dài, cho phép người dùng nhập hàng triệu từ vào prompt.
- MiniMax: Một startup được định giá hàng tỷ USD với các ứng dụng chatbot AI thu hút hàng triệu người dùng tại thị trường tỷ dân.
Cả ba công ty này đều đang trong cuộc đua khốc liệt để chứng minh rằng Trung Quốc không hề lép vế trước Thung lũng Silicon. Tuy nhiên, cáo buộc từ Anthropic đã phủ một bóng đen lên những thành tựu mà họ đã công bố, đặt ra câu hỏi lớn về tính nguyên bản của các thuật toán ‘Made in China’.
Hệ lụy đạo đức và pháp lý trong cuộc đua AI toàn cầu
Cuộc chiến giữa Anthropic và các công ty Trung Quốc không chỉ đơn thuần là vấn đề kỹ thuật mà còn là vấn đề đạo đức nghề nghiệp. Trong khi thế giới đang nỗ lực xây dựng các tiêu chuẩn cho AI an toàn và minh bạch, việc sử dụng tài khoản giả để đánh cắp dữ liệu huấn luyện cho thấy một mặt tối của sự cạnh tranh không lành mạnh.
Về mặt pháp lý, việc chứng minh một mô hình AI được huấn luyện bằng dữ liệu ‘chưng cất’ là cực kỳ khó khăn. Các mô hình này sau khi học xong sẽ tạo ra nội dung mới, khiến việc truy vết trở nên phức tạp. Tuy nhiên, với bằng chứng về 24.000 tài khoản, Anthropic đang nắm giữ những quân bài quan trọng để có thể đưa vụ việc ra các cơ quan quản lý quốc tế hoặc áp dụng các biện pháp trừng phạt kỹ thuật mạnh tay hơn, như chặn dải IP hoặc thắt chặt xác minh danh tính người dùng.
Phản ứng của các bên và tương lai của sự hợp tác
Cho đến thời điểm hiện tại, các công ty từ phía Trung Quốc vẫn chưa đưa ra bình luận chính thức hoặc có những phản hồi bác bỏ một cách yếu ớt. Tuy nhiên, giới quan sát nhận định rằng sự việc này sẽ thúc đẩy Mỹ thắt chặt hơn nữa các quy định xuất khẩu công nghệ và quyền truy cập vào các dịch vụ AI đám mây đối với các thực thể từ Trung Quốc.
Ngành công nghiệp AI đang đứng trước một ngã rẽ. Một bên là sự mở rộng và chia sẻ tri thức, một bên là việc bảo vệ tài sản trí tuệ khắt khe. Nếu tình trạng ‘chưng cất’ trái phép không được ngăn chặn, các công ty hàng đầu như Anthropic hay OpenAI có thể sẽ đóng cửa các API công khai, gây khó khăn cho các nhà phát triển chân chính trên toàn thế giới.
Kết luận
Cáo buộc của Anthropic đối với DeepSeek, Moonshot và MiniMax là một lời cảnh tỉnh cho toàn ngành công nghiệp. 24.000 tài khoản giả mạo không chỉ là một con số, nó là biểu hiện của một cuộc chiến tranh giành quyền lực dữ liệu đang diễn ra âm thầm nhưng vô cùng khốc liệt. Để xây dựng một tương lai AI bền vững, tính minh bạch và sự tôn trọng bản quyền phải được đặt lên hàng đầu, thay vì những thủ thuật ‘đi tắt đón đầu’ gây tổn hại đến toàn bộ hệ sinh thái.


