클로드 Fable 5 차단, 진짜 이유는 '탈옥'이 아니었다? 보안 전문가 100명의 반발

안녕하세요. Jay입니다!

앞서 앤트로픽의 Fable 5·Mythos 5가 출시 며칠 만에 외국인 접근이 막힌 소식을 전해드렸는데요. 그 차단의 근거였던 '탈옥(jailbreak)'을 두고 논란이 커지고 있습니다. "그거 사실 탈옥 아니었다"는 주장과 함께 보안 전문가들이 단체로 반발하고 나섰어요. 오늘은 이 후속 이야기를 정리해 볼게요.

🔍 발단 — 문제의 프롬프트가 고작 "fix this code"?

미국 정부는 모델이 너무 강력하고 안전 필터를 우회당했다(탈옥)는 이유로 외국인 접근 차단을 지시했고, 앤트로픽은 두 모델을 비활성화했습니다. 그런데 보도에 따르면, 문제가 된 상황은 연구자들이 취약점이 있는 코드에 "이 코드 고쳐줘(fix this code)" 라고 입력해 모델이 응답한 것이었다고 합니다.

🛡 "이건 탈옥이 아니라 방어다" — 보안계의 반박

Luta Security의 CEO 케이티 무수리스(Katie Moussouris) 는 이를 두고 가드레일 우회나 진짜 탈옥이 아니라, 오히려 방어적 사이버보안 활동으로 봐야 한다고 지적했습니다.

보안 전문가 100명 이상이 제한 철회를 요구하는 공개서한에 서명
핵심 경고: 이런 제한은 공격자보다 방어자(defender)에게 더 큰 피해를 준다

⚖️ 딜레마 — 버그 수정을 막으면 개발 도구가 무용지물

여기서 근본적인 모순이 드러납니다. 모델이 '취약 코드 수정' 요청을 거부하도록 만들면, 그건 곧 일반 개발 업무에서도 쓸모없어진다는 뜻이거든요. 코드 고쳐달라는 건 개발자가 매일 하는 일이니까요.

🌏 "미국 방어자만 손발 묶인다"

또 하나의 우려는 국제 경쟁입니다. 중국의 오픈소스 모델들이 곧 비슷한 역량에 도달할 텐데, 미국 모델에만 제한을 걸면 결국 미국 방어자만 역량이 묶이는 역효과가 난다는 것이죠. 여기에 트럼프 행정부와 앤트로픽의 갈등, 아마존의 역할 같은 정치적 맥락도 함께 거론되고 있습니다.

💡 Jay의 한마디

이 논란의 핵심은 "공격 능력과 방어 능력은 사실상 같은 능력" 이라는 오래된 보안의 딜레마예요. 취약점을 찾아 고치는 힘은, 뒤집으면 취약점을 찾아 공격하는 힘이기도 하니까요. AI가 그 힘을 증폭하면서, 규제 당국과 보안 커뮤니티의 시각차가 그대로 드러난 사건이라고 봅니다. "안전하게 막자"와 "막으면 방어자만 손해다"가 정면충돌한 거죠.

결론

Fable 5 차단의 근거였던 '탈옥'이 단순 코드 수정 요청이었다는 주장에 보안 전문가 100명+가 반발하고 나섰습니다. 공격과 방어가 한 몸인 보안의 본질, 그리고 과잉 규제가 방어자를 더 약하게 만들 수 있다는 경고가 이 논란의 핵심입니다.

다음에도 유익한 포스팅으로 찾아오겠습니다. 감사합니다!

클로드 Fable 5 차단, 진짜 이유는 '탈옥'이 아니었다? 보안 전문가 100명의 반발

🔍 발단 — 문제의 프롬프트가 고작 "fix this code"?

🛡 "이건 탈옥이 아니라 방어다" — 보안계의 반박

⚖️ 딜레마 — 버그 수정을 막으면 개발 도구가 무용지물

🌏 "미국 방어자만 손발 묶인다"

💡 Jay의 한마디

결론

📚 참고 / 출처

$ ls related/

노벨상 받은 AlphaFold의 아버지, 딥마인드 떠나 앤트로픽으로

AI가 직접 해킹하는 시대? Claude Mythos 5·GPT-5.5의 두 얼굴

G7에 모인 AI 3대 수장: 올트먼·아모데이·하사비스 첫 동반 출석

더 많은 IT·AI 활용법이 궁금하다면?