Claude Mythos giải được 73% nhiệm vụ an ninh mạng chuyên gia mà trước đây chưa AI nào làm được

  • Claude Mythos Preview là AI đầu tiên hoàn thành một cuộc tấn công mạng doanh nghiệp mô phỏng.
  • Nó đã giải được 73% thử thách hack cấp độ chuyên gia mà trước năm 2025 chưa có AI nào vượt qua.
  • Anthropic công bố bản xem trước Claude Mythos vào ngày 07/04/2024.
Promo

Claude Mythos Preview của Anthropic vừa trở thành mô hình AI đầu tiên hoàn thành trọn vẹn một cuộc tấn công giả lập vào hệ thống mạng doanh nghiệp, theo đánh giá mới nhất từ Viện An ninh AI (AISI) của Anh.

Kết quả này được công bố chỉ vài ngày sau khi mô hình này ra mắt vào 07/04/2024, cho thấy khả năng của AI trong lĩnh vực an ninh mạng đã đạt đến mức mà các đội ngũ bảo mật trên thế giới cần đặc biệt lưu tâm ngay lập tức.

Được tài trợ
Được tài trợ

Claude Mythos là gì?

Anthropic đã giới thiệu mô hình Claude Mythos Preview vào ngày 07/04/2024 nhưng chưa phát hành rộng rãi cho công chúng. Thay vào đó, nhóm phát triển chỉ cung cấp quyền truy cập hạn chế cho các công ty nghiên cứu an ninh mạng để đánh giá và chuẩn bị ứng phó với những khả năng tiên tiến của AI này.

“Mô hình này tỏ ra vượt trội ở nhiều lĩnh vực, đặc biệt là các tác vụ về an ninh máy tính. Để đáp ứng điều này, chúng tôi đã khởi động Dự án Glasswing, sử dụng Mythos Preview để hỗ trợ bảo mật cho các phần mềm quan trọng nhất thế giới, đồng thời chuẩn bị cho ngành công nghệ những phương án cần thiết để đón đầu các cuộc tấn công mạng trong tương lai,” thông báo từ Anthropic cho biết.

Theo dõi chúng tôi trên X để cập nhật tin tức mới nhất ngay khi có

Những tiến bộ này đã bắt đầu thu hút sự chú ý không chỉ trong giới công nghệ mà còn cả các nhà hoạch định chính sách. Theo Reuters trích dẫn các nguồn tin liên quan, Bộ trưởng Tài chính Mỹ Scott Bessent cùng Chủ tịch Cục Dự trữ Liên bang Jerome Powell đã tổ chức cuộc họp khẩn với các CEO ngân hàng lớn, cảnh báo về các nguy cơ tấn công mạng tiềm ẩn liên quan đến mô hình AI này.

Claude Mythos Preview thể hiện như thế nào?

Viện An ninh AI (AISI), thuộc Bộ Khoa học, Đổi mới và Công nghệ của Anh, đã thực hiện các đánh giá về an ninh mạng đối với Claude Mythos Preview của Anthropic nhằm xem xét năng lực bảo mật của mô hình này.

Được tài trợ
Được tài trợ

Đầu tiên là các bài kiểm tra “capture-the-flag” (CTF), nơi các hệ thống cần phát hiện và khai thác lỗ hổng để tìm ra các “flag” ẩn. Mythos đạt tỷ lệ thành công 73% ở các bài kiểm tra cấp chuyên gia — điều mà trước tháng 04/2025 chưa có mô hình nào làm được.

Các khả năng tấn công mạng của Claude Mythos
Các khả năng tấn công mạng của Claude Mythos. Nguồn: AISI

Bên cạnh đó, AISI còn xây dựng một mô phỏng tấn công mạng doanh nghiệp gồm 32 bước mang tên “The Last Ones” (TLO). Nếu là chuyên gia bảo mật, họ phải mất khoảng 20 tiếng mới có thể hoàn thành.

Mythos Preview đã hoàn thành toàn bộ mô phỏng này trong 3 trên tổng số 10 lần thử nghiệm. Trung bình, AI này thực hiện được 22 trong 32 bước tấn công. Trong khi đó, Claude Opus 4.6 — mô hình đứng thứ hai — chỉ đạt trung bình 16 bước.

“Việc Mythos Preview thành công trong một môi trường kiểm thử mạng cho thấy AI này hoàn toàn có khả năng tự động tấn công các hệ thống doanh nghiệp nhỏ, ít được bảo vệ, dễ tổn thương khi đã có quyền truy cập vào mạng. Tuy nhiên, các môi trường kiểm thử này vẫn có nhiều điểm khác biệt so với thực tế, khiến việc tấn công dễ dàng hơn,” nhóm nghiên cứu cho biết thêm.

Qua kiểm thử nội bộ, đội phản ứng sự cố của Anthropic cũng phát hiện Claude Mythos Preview có thể chủ động nhận diện và khai thác các lỗ hổng zero-day trên tất cả hệ điều hành lớn cũng như trình duyệt web phổ biến khi người dùng đưa ra yêu cầu rõ ràng.

“Chúng tôi bị giới hạn trong việc công bố thông tin ở đây. Hơn 99% các lỗ hổng mà chúng tôi phát hiện chưa được vá, nên việc tiết lộ chi tiết sẽ rất rủi ro,” nhóm phát triển giải thích.

AISI nhấn mạnh rằng các tổ chức nên ưu tiên thực hiện các biện pháp an ninh mạng cơ bản như thường xuyên cập nhật bản vá, kiểm soát truy cập chặt chẽ, tăng cường cấu hình bảo mật và lưu trữ nhật ký đầy đủ.

Đăng ký kênh YouTube của chúng tôi để theo dõi các đánh giá chuyên sâu từ chuyên gia và phóng viên

Để đọc các phân tích thị trường tiền điện tử mới nhất từ BeInCrypto, nhấp vào đây.

Tuyên bố miễn trừ trách nhiệm

Tất cả thông tin có trên trang web của chúng tôi được xuất bản với thiện chí và chỉ dành cho mục đích thông tin chung, phù hợp với nguyên tắc của Trust Project. Bất kỳ hành động nào người đọc thực hiện đối với thông tin được tìm thấy trên trang web của chúng tôi, họ cần phải đánh giá lại và hoàn toàn chịu rủi ro từ quyết định của chính họ. Vui lòng tham khảo Điều khoản và Điều kiện, Chính sách quyền riêng tư, và Tuyên bố miễn trừ trách nhiệm của chúng tôi.

Được tài trợ
Được tài trợ