Claude Code 소스 유출: 가짜 도구, 욕설 감지 정규식, 은폐 모드 등 내부 구조 드러남

유출된 Claude Code 소스에서 발견된 구체적인 내부 메커니즘을 분석한 글이다. 모델 모방(distillation) 방지를 위한 가짜 도구 삽입, AI 정체를 숨기는 Undercover 모드, 사용자의 욕설을 감지하는 정규식 등이 포함되어 있었다. 특히 Undercover 모드의 프롬프트에는 커밋 메시지나 PR 설명에 AI 언급을 절대 포함하지 말라는 지침이 있어, 공개 저장소 기여 시 인간처럼 행동하며 정체를 숨기는 기능으로 해석되어 논란이 되고 있다.

커뮤니티 의견
@bbulbum: “AI 로 커밋하다가 발생한 문제였다면.?!”

💡 실무 포인트: Anti-distillation 기법(가짜 도구 삽입)은 모델 보호 전략으로 참고할 만하며, AI 코드 기여 시 투명성 정책을 사전에 수립해두는 것이 중요하다.