Claude Code는 Anthropic이 밀고 있는 터미널 기반 AI 코딩 에이전트다. 코드베이스 이해, 리팩터링, 테스트 자동화, 문서 생성, 에이전트 팀 운영까지 폭넓은 작업을 처리하며, 2025년 하반기부터 개발자 사이에서 빠르게 채택됐다.
그런데 2026년에 접어들면서 불만의 크기도 함께 커졌다. 불만의 축은 크게 네 갈래다. 첫째, 사용량 제한이 비정상적으로 빨리 닳는다는 문제가 1월과 3월 두 차례 크게 터졌고, 4월에는 캐시 TTL 무단 변경이라는 구체적 원인까지 공개됐다. 둘째, 예전보다 멍청해졌다, 검증 없이 자신감 있게 틀린다는 품질 회귀 불만이 GitHub 이슈와 커뮤니티에서 반복됐다. 셋째, 3월 31일 npm 패키징 실수로 512,000줄에 달하는 Claude Code 전체 소스가 유출된 사건이 터졌다. 넷째, 4월 4일부터 Claude 구독으로 서드파티 harness를 쓰는 경로가 공식 차단됐다.
이 글은 각 축을 공개 보도, GitHub 이슈, 공식 문서, 커뮤니티 글을 기준으로 정리한다. 감정적 표현과 사실 관계를 구분하면서, 현재 시점에서 실제로 무엇이 막혔고 무엇이 남아 있는지를 읽는 것이 목표다.
1. 사용량 제한과 토큰 급소모: 세 번의 폭발
Claude Code 사용량 불만은 2026년 1월, 3월, 그리고 4월 캐시 TTL 문제 공개까지 세 차례에 걸쳐 누적됐다. 각각의 사건은 독립적이면서도 구조적으로 연결돼 있다.
1.1 2026년 1월: 홀리데이 보너스 종료와 60% 감소 주장
- The Register는 2026년 1월 5일 기사에서, Claude Code 사용자들이 토큰 한도가 갑자기 줄었다고 불만을 제기하고 있으며, 한 사용자는 Claude Code 로그의 토큰 수준 분석을 근거로 약 60% 감소를 주장했다고 보도했다. 이 사용자는 Anthropic이 예정된 기업공개(IPO) 전에 비용을 줄이려는 시도라고 추측했으나, Anthropic은 이를 부인했다.
- Anthropic의 공식 입장은 2025년 12월 25일부터 31일까지 운영한 홀리데이 2배 사용량 보너스가 끝난 것일 뿐이라는 것이었다. 이 보너스는 Pro, Max 5x, Max 20x 구독자를 대상으로 유휴 컴퓨팅 자원을 활용해 제공됐다.
- Reddit에서는 보너스 이전보다도 한도가 낮아졌다는 주장이 이어졌다. Discord의 Claude Developers 채널에서 관리자 David가 사용량 제한 문제를 조사하겠다고 글을 올렸고, 여러 사용자가 Pro 플랜에서 1시간 이내에, 심지어 코드 작성 없이 마크다운 문서만 검토하는 것만으로 한도에 도달했다고 보고했다.
- Techzine Europe은 최근 Claude Code 버전이 토큰 효율이 떨어진다는 사용자 추측을 전하면서, 일부가 이전 버전(v2.0.61)으로 롤백해 문제가 해소됐다고 보고한 점도 소개했다. 하지만 다른 사용자들은 롤백이 효과 없었다고 반박했다.
1.2 2026년 3월: 프롬프트 캐싱 장애와 19분 만에 세션 소진
- 3월 23일 이후 모든 유료 티어(Pro, Max 5x, Max 20x)에서 사용량이 비정상적으로 빠르게 닳는 현상이 동시다발적으로 보고됐다. GitHub 이슈 #41930에 따르면, 단일 프롬프트가 세션 쿼터의 3~7%를 소비하고, 5시간 세션이 19분 만에 고갈되는 사례까지 나왔다.
- Anthropic은 Reddit과 X에서 프롬프트 캐싱 관련 시스템 장애가 있었음을 인정했다. 영향받은 사용자에게는 사용량을 리셋해 주었고, 3월 중순에는 전체 사용자 대상 2주간 비피크 시간 2배 사용량 보너스도 제공했다. 이 보너스는 평일 PT 오전 5~11시 이외, 주말 전 시간에 적용됐다.
- Forbes는 Anthropic에 글리칭 한도 문제가 있다는 제목의 기사를 실었고, MacRumors는 한 달도 안 돼 같은 유형의 문제가 반복됐다는 점을 강조했다. The New Stack은 Anthropic이 Reddit과 X에서 확인한 내용을 종합 보도하면서, 문제가 완전히 해결됐는지에 대해서는 회의적 시각이 남아 있다고 전했다.
1.3 4월 공개: 캐시 TTL 무단 변경과 2,032% 비용 증가
- GitHub 이슈 #46829는 3월 사용량 폭발의 가장 구체적인 원인 분석을 제시했다. 이 이슈 작성자는 2대의 머신, 2개의 계정에서 119,866건의 API 호출 로그를 분석해, Anthropic이 프롬프트 캐시 TTL을 1시간에서 5분으로 무단 변경한 것으로 보인다고 보고했다.
- 데이터에 따르면, 2월 1일부터 3월 5일까지 33일 동안은 1시간 TTL만 관찰됐고 5분 TTL 토큰은 사실상 0이었다. 그런데 3월 6일부터 5분 TTL 토큰이 재등장하기 시작했고, 3월 8일에는 5분 TTL이 전체의 83%를 차지하게 됐다. 클라이언트 측 변경은 없었으므로, 이는 서버 측 구성 변경으로 판단됐다.
- 비용 영향은 막대했다. 5분 TTL에서는 세션 중 5분 이상 멈추면 전체 캐시가 만료돼 다음 턴에서 전체 컨텍스트를 쓰기 비율(읽기 대비 12.5배 비싼)로 재업로드해야 한다. 분석 기간 동안 Sonnet 기준 949달러, Opus 기준 1,582달러가 이 변경으로 인한 초과 비용이었다. 캐시 생성 비용만 놓고 보면 2,032% 증가였다.
- 구독 사용자에게는 비용보다 쿼터 영향이 더 심각했다. 캐시 생성 토큰은 쿼터에 전체 비율로 카운트되므로, TTL 단축은 곧바로 한도 소진 속도 가속으로 이어졌다. 이 이슈 작성자는 3월 이전에는 한도에 도달한 적이 단 한 번도 없었다고 강조했다.
| 시기 | 핵심 사건 | 원인 | Anthropic 대응 |
|---|---|---|---|
| 2026년 1월 | 홀리데이 보너스 종료 후 한도 급감 체감 | 보너스 종료 + 가능한 버전별 효율 차이 | 보너스 종료일 뿐이라고 해명 |
| 2026년 3월 23일~ | 전 티어 사용량 급소모 | 프롬프트 캐싱 시스템 장애 | 장애 인정, 사용량 리셋, 2주 보너스 |
| 2026년 3월 6일~ | 캐시 TTL 1시간→5분 무단 변경 | 서버 측 구성 변경(의도적 or 사고) | 4월 중순 기준 공식 답변 없음 |
핵심 포인트: 사용량 급소모의 가장 구체적 원인으로 캐시 TTL 무단 변경이 119,866건 API 로그 분석으로 밝혀졌다. 1시간 TTL이 33일간 유지되다 3월 6일경 5분으로 바뀌면서, 캐시 생성 비용이 2,032% 증가하고 구독 쿼터 소진이 급격히 빨라졌다. Anthropic은 4월 중순 현재까지 이 변경에 대한 공식 확인이나 부인을 하지 않고 있다.
2. 품질 회귀: 검증 없는 자신감과 문맥 유지 저하
사용량 문제와 별개로, Claude Code의 출력 품질 자체가 떨어졌다는 불만도 2025년 하반기부터 꾸준히 쌓여 왔다. 특히 Opus 4.6 출시 이후 불만이 집중됐다.
2.1 검증 없이 자신감 있게 틀리는 패턴
- GitHub 이슈 #47483은 Opus 4.6에서 100회 이상 세션에 걸쳐 검증 없이 자신감 있게 단정하는 빈도가 늘었다고 보고했다. 도구를 써서 확인할 수 있는 상황에서도 확인하지 않고 밀어붙이는 경향이 핵심 문제로 지적됐다.
- 이슈 #37792에서는 Claude가 Arduino 핀 배정과 주변장치 매핑을 구체적 수치까지 자신 있게 제시하면서 실제로는 어떤 소스도 참조하지 않았다는 점이 지적됐다. 코드 리뷰 맥락에서 이런 답변은 단순히 틀린 것을 넘어, 개발자의 검증 시간을 크게 늘려 도구의 가치를 떨어뜨린다.
- 이슈 #38057에서는 기술 문서에서 거짓 주장을 하고, 수정 요청 시 원래 주장을 고치는 대신 새로운 거짓 주장으로 교체하는 패턴이 보고됐다. 이는 단발성 실수가 아니라 구조적인 검증 부재 문제임을 시사한다.
2.2 문맥 유지 저하와 지시 불이행
- Reddit과 Discord에서는 앞에서 합의한 내용을 까먹는다, 같은 세션에서 모순되는 행동을 한다는 불만이 반복됐다. Claude Code는 자동 컴팩션(컨텍스트 요약) 기능이 있는데, 이 과정에서 중요한 맥락이 누락되는 것 아니냐는 의심이 제기됐다.
- 이슈 #20072는 Sonnet 4.5에서의 과신과 검증 부재를 지적했다. 즉 품질 불만이 Opus 4.6에만 국한되지 않고 다른 모델에서도 관찰된다는 점을 보여 준다.
- 이슈 #24991은 Opus 4.6에서 멀티파트 작업 처리 점수가 92/100에서 38/100으로 급락한 회귀를 보고했다. 날짜는 2월 10~11일경으로, 특정 시점에 서비스 측 변경이 있었을 가능성을 시사한다.
2.3 Anthropic의 과거 버그 인정과 현재 상태
- 2025년 9월, The Decoder는 수 주간의 품질 저하 불만 끝에 Anthropic이 기술적 버그를 확인했다고 보도했다. LinkedIn에서 Anthropic 관계자가 프로그래밍 성능 저하, 지시 준수 불이행, 잘림 응답 등의 보고를 인정하는 글이 올라왔다.
- Reddit의 r/ClaudeCode에서는 품질 회귀가 의도적 연산 절감, 즉 양자화 강화, 라우팅 변경, 폴백 동작 같은 인프라 변경과 관련된 것 아니냐는 분석이 반복됐다. 이 커뮤니티 글은 과거 일부 회귀가 사용자 오류가 아닌 실제 서비스 측 문제였음이 확인된 사례를 인용했다.
- 2026년 4월 16일에는 Opus 4.7이 출시됐다. 벤치마크상 코딩 성능이 유의미하게 개선됐다는 초기 평가가 나왔지만, 가격은 Opus 4.6과 동일하다. 이 출시가 품질 불만에 대한 간접적 대응인지, 독립적 모델 업데이트인지는 아직 판단하기 이르다.
| 불만 유형 | 커뮤니티 표현 | GitHub 이슈 사례 |
|---|---|---|
| 검증 없는 자신감 | 확인도 안 하고 단정짓는다 | #47483, #37792, #38057 |
| 문맥 유지 저하 | 앞에서 말한 걸 까먹는다 | Reddit, Discord 다수 |
| 지시 불이행 | 시킨 대로 안 한다 | #20072 (Sonnet 4.5) |
| 멀티파트 회귀 | 복잡한 작업을 못 한다 | #24991 (92→38점) |
| 롤백 시 개선 | 이전 버전이 더 낫다 | #7513 (v1.0.88 롤백) |
핵심 포인트: Claude Code 품질 불만은 검증 없는 답변 증가, 문맥 유지 저하, 지시 불이행이라는 구체적 패턴으로 반복된다. Anthropic은 2025년 9월 한 차례 기술적 버그를 인정했고, 2026년 4월 Opus 4.7을 출시했지만, 현재까지 회귀의 구조적 원인에 대한 공식 설명은 나오지 않았다.
3. npm 소스 유출: 512,000줄이 공개된 3월 31일 사건
품질과 사용량 논란이 이어지는 와중에, 3월 31일에는 별도의 심각한 사건이 터졌다.
3.1 유출 경위와 규모
- 2026년 3월 31일, Anthropic은
@anthropic-ai/claude-codenpm 패키지를 배포하면서 .map(소스맵) 파일을 포함한 채 퍼블리시했다. 소스맵은 번들된 JavaScript를 원본 TypeScript 소스로 역추적할 수 있는 파일이다. - 이로 인해 Claude Code의 전체 TypeScript 소스코드 약 512,000줄이 공개됐다. The Hacker News, Layer5, Reddit r/singularity 등 다수 매체와 커뮤니티에서 수 시간 만에 이 사실이 퍼졌다.
- 유출된 코드에서는 44개의 숨겨진 기능 플래그, 20개의 미출시 기능, 전체 시스템 프롬프트, 내부 도구 구조 등이 확인됐다. 사용자 데이터 유출은 없었지만, Anthropic의 내부 아키텍처와 향후 계획이 노출된 셈이다.
3.2 유출이 논란에 미친 영향
- 소스 유출 자체는 보안 사고이지 사용자 불만의 직접 원인은 아니다. 하지만 캐시 TTL 분석, billing header 구조, 모델 라우팅 로직을 외부에서 검증할 수 있는 근거가 생겼다는 점에서, 이후의 사용량 논란을 더 구체화하는 데 기여했다.
- 앞서 언급한 hermes-claude-auth 패치의 billing salt 값(
59cf53e54c78)도 이 유출된 바이너리에서 추출된 것으로, 서드파티 우회 시도의 기술적 근거가 된 셈이다. - Anthropic은 이후 패키지를 수정해 소스맵을 제거했지만, npm 패키지는 한번 퍼블리시되면 이미 다운로드한 사본을 회수할 수 없으므로, 코드는 GitHub 등에 아카이브됐다.
핵심 포인트: npm 소스 유출은 사용자 데이터 침해는 아니었지만, Claude Code의 내부 구조, 기능 플래그, 시스템 프롬프트가 공개되면서 이후 커뮤니티의 기술적 분석과 서드파티 우회 시도에 직접적 근거를 제공했다.
4. Anthropic 공식 문서가 드러내는 비용 구조의 실체
Anthropic 공식 비용 문서는 Claude Code의 자원 관리 성격을 사실상 인정하고 있다. 문서 자체는 유용하지만, 사용자 입장에서는 왜 이렇게까지 아껴 써야 하지?라는 인상을 주기도 한다.
4.1 공식 비용 수치와 팀 운영 권장치
- 엔터프라이즈 배포 기준 평균 비용은 활성 개발자 1인당 하루 약 13달러, 월 150~250달러이며, 90% 사용자가 하루 30달러 미만이라고 문서에 적혀 있다. 다만 Reddit에서는 이 수치에 대해 회의적 시각이 있다. 한 사용자는 팀 전체를 API 소매가로 환산하면 월 20만 달러 수준이라며, 구독 14만원과의 격차가 너무 크다고 지적했다.
- 팀 규모별 TPM(Token Per Minute)과 RPM(Request Per Minute) 권장치가 표로 제시돼 있다. 1~5명 팀은 사용자당 TPM 200k~300k이지만, 500명 이상이면 10k~15k로 줄어든다. 이 표는 Claude Code가 조직 전체의 API 자원을 공유하는 구조임을 보여 준다.
- 이 TPM/RPM은 조직 수준에서 적용되며, 개별 사용자 한도가 아니다. 따라서 한 사용자가 집중 사용하면 다른 사용자의 응답이 느려질 수 있다.
4.2 토큰 절약을 위한 공식 권장 전략
- 작업 전환 시
/clear로 컨텍스트 초기화, Opus 대신 Sonnet 우선 사용, MCP 서버 오버헤드 축소, hooks와 skills로 전처리, CLAUDE.md 200줄 이내 유지 등이 권장된다. - 에이전트 팀은 일반 세션 대비 약 7배 토큰을 사용한다고 명시돼 있다. 각 팀원이 독립 컨텍스트 윈도우를 유지하므로, 무심코 팀을 확장하면 비용이 급등한다. 기본적으로 비활성화돼 있어 환경변수를 직접 켜야 한다.
- extended thinking(확장 사고)도 기본 활성화 상태인데, 사고 토큰은 출력 토큰으로 과금된다. 기본 예산이 모델에 따라 수만 토큰에 이를 수 있어, 단순 작업에서도 예상 외 비용이 발생할 수 있다.
/effort명령으로 낮추거나MAX_THINKING_TOKENS를 설정하는 것이 권장된다.
4.3 백그라운드 토큰 사용과 비용 추적 도구
- Claude Code는 유휴 상태에서도 토큰을 소비한다. 이전 대화 요약(resume 기능용)과 명령 처리가 백그라운드에서 이뤄지며, 세션당 약 0.04달러 수준이라고 문서에 적혀 있다.
/cost명령은 API 사용자용이며 로컬에서 토큰 수를 기반으로 추정한 금액을 보여 준다. Pro/Max 구독자는/stats를 사용해야 한다. 실제 청구서와 차이가 있을 수 있으므로, 정확한 비용은 Claude Console의 Usage 페이지에서 확인해야 한다.- Claude Code를 처음 인증하면 조직에 Claude Code 전용 workspace가 생기며, 이 사용량은 조직의 API rate limit에 영향을 줄 수 있다. 즉 Claude Code는 내부적으로도 독립 비용 단위로 다뤄진다.
| 공식 문서 신호 | 의미 |
|---|---|
/cost, /stats 사용 권장 |
사용자 스스로 사용량 관리 필요 |
| TPM/RPM 팀 규모별 차등 권장치 | 인프라 용량과 동시성 제약 존재 |
| Sonnet 우선 사용, Opus 신중 사용 | 모델 선택에 따라 체감 비용 차이 큼 |
| 에이전트 팀 7배 토큰 경고 | 무심코 확장하면 비용 폭증 |
| 백그라운드 토큰 소비 안내 | 유휴 상태에서도 비용 발생 |
핵심 포인트: Anthropic 공식 문서는 Claude Code가 강력한 대신 상당한 자원 관리를 요구하는 도구임을 보여 준다. 구독형 사용자가 API 수준의 토큰 관리를 기대하지 않았다면, 이 격차가 불만으로 이어지는 것은 구조적으로 예측 가능하다.
5. 월 4일 서드파티 harness 구독 차단: 타임라인과 현재 상태
2026년 4월 4일, Anthropic은 Claude Pro/Max 구독으로 서드파티 harness를 쓰는 경로를 공식 차단했다. 이 정책은 2년 전부터 ToS에 명시돼 있었지만, 실제 기술적 집행은 2026년 들어 단계적으로 강화됐다.
5.1 정책 변화 타임라인: ToS에서 서버 차단까지
- 2024년 2월: Anthropic Consumer ToS 3.7항에 Anthropic API Key를 통한 접근이 아닌 경우, 봇, 스크립트, 기타 자동화 수단을 통한 서비스 접근을 금지하는 문구가 포함돼 있었다. 하지만 실제 집행은 느슨했고, OpenClaw를 비롯한 다수 서드파티 도구가 Claude 구독 토큰을 사용하고 있었다.
- 2026년 1월: Anthropic 엔지니어 Thariq Shihipar가 X에서 서드파티 도구의 Claude Code harness 위장을 차단하는 조치를 취했다고 밝혔다. 서드파티 harness가 비정상 트래픽 패턴을 생성하고 텔레메트리가 없어 디버깅과 사용량 지원을 어렵게 만든다고 설명했다.
- 2026년 2월 중순: Anthropic이 법적 문서를 업데이트해, OAuth 토큰은 오직 Claude Code와 Claude.ai에서만 사용 가능하며 Agent SDK 포함 다른 모든 제품에서의 사용은 ToS 위반이라고 명시했다. OpenCode는 Anthropic의 법적 요청을 인용하며 Claude Pro/Max 지원 코드를 제거하는 커밋을 푸시했다.
- 2026년 4월 3일 저녁: Anthropic이 사용자 이메일로 4월 4일 오후 3시(ET)부터 구독 한도가 서드파티 harness에 적용되지 않는다고 공지했다. 구독자에게 월 플랜 비용만큼의 일회성 크레딧을 지급하고, Extra Usage 번들(최대 30% 할인)을 도입한다고 안내했다.
- 2026년 4월 4일 오후 3시(ET): 기술적으로 Anthropic API가 Claude Code 외부 클라이언트의 OAuth 요청을 서버 측에서 거부하기 시작했다.
5.2 OpenClaw: 구독은 끝, API key와 Extra Usage는 유지
- 구독(OAuth) 경로는 공식 차단됐다. The Verge, VentureBeat, TechCrunch 등이 동일한 사실을 보도했다. Reddit r/openclaw에서는 Claude OAuth for OC is officially, actually dead now라는 제목의 글이 올라왔다.
- API key 종량제 경로는 살아 있다. OpenClaw에서 Anthropic API key를 직접 입력해 사용하는 것은 정상적인 종량제 과금이므로 차단 대상이 아니다. OpenClaw 문서도 API key를 production에서 더 안전한 권장 경로로 안내한다.
- Extra Usage 번들이 중간 경로로 추가됐다. 구독과 별도로 사용량을 선구매해 서드파티에서 쓸 수 있다. Anthropic은 최대 30% 할인을 제공하지만, 한 블로그는 이전 월 20달러 구독에서 실제 사용 패턴을 유지하면 월 500달러까지 올라갈 수 있다고 추정했다.
- OpenClaw 문서에 남아 있는 Claude CLI reuse, setup-token 설명은 과거 지원 시점의 기술 설명이 아직 정리되지 않았거나, API key 기반 인증과 혼재된 상태일 가능성이 높다. 또한 Anthropic staff told us this usage is allowed again이라는 문구는 2월 중순 혼선기의 중간 상태를 반영한 것으로 보이며, 4월 4일 이후의 서버 측 차단과는 상충한다.
5.3 Hermes: 문서는 살아 있지만 실제로는 차단
- Hermes 공식 providers 문서에는 여전히 Anthropic 항목에 Claude Pro/Max via Claude Code auth, Anthropic API key, manual setup-token이 적혀 있다.
hermes model에서 Anthropic OAuth를 선택하면 Claude Code credential store를 우선 사용한다고 안내한다. - 하지만 4월 4일 이후 실제로는 작동하지 않는다. Reddit r/hermesagent에 올라온 hermes-claude-auth 패치 글은 Anthropic patched their API on April 4th to reject OAuth requests from anything that isn't Claude Code. Hermes, opencode, cline, aider — everything broke overnight라고 명시했다.
- 해당 커뮤니티 패치는 billing header SHA-256 서명 주입, 시스템 프롬프트 구조 위장, beta 플래그 스푸핑을 통해 Claude Code CLI로 위장하는 방식이다. 보안 감사에서 악성 코드는 없다고 평가됐지만, 작성자와 감사자 모두 이것은 보안 문제가 아니라 ToS 문제이며 계정 정지 위험은 사용자 몫이라고 명시했다.
- Anthropic이 billing salt나 서명 방식을 변경하면 이 패치는 즉시 무효화된다. 감사자는 하드코딩된 salt 값, 샘플링 인덱스, 버전 번호, 캐싱 스코프 문자열이 모두 서버 변경 한 번에 깨질 수 있다고 경고했다.
5.4 OpenAI의 대조적 행보
- Anthropic이 서드파티 차단을 강화하는 동안, OpenAI Codex 팀장 Thibault Sottiaux는 Codex 구독의 서드파티 harness 사용을 공개적으로 허용한다고 X에서 밝혔다. The Register는 이를 의도적으로 대비된 메시지라고 보도했다.
- OpenClaw 문서 자체도 사용자를 Codex OAuth 쪽으로 안내하기 시작했다. OpenClaw의 OAuth 문서에는 OpenAI Codex OAuth is explicitly supported for use in external tools like OpenClaw라고 적혀 있다.
- 이 대조가 사용자 정서에 미친 영향은 크다. 같은 유형의 서드파티 사용을 한 회사는 금지하고 다른 회사는 환영하면, 금지한 쪽에 대한 반감이 더 커지는 것은 자연스럽다.
| 경로 | 4월 17일 현재 상태 | 비고 |
|---|---|---|
| Claude Code 직접 사용 (구독) | 정상 | Pro/Max 구독 한도 적용 |
| Claude Code 직접 사용 (API key) | 정상 | 종량제 과금 |
| OpenClaw + API key | 정상 | 종량제 과금 |
| OpenClaw + 구독 OAuth | 차단 | 4월 4일부터 서버 측 거부 |
| OpenClaw + Extra Usage 번들 | 가능 | 별도 구매 필요, 최대 30% 할인 |
| Hermes + API key | 정상 | 종량제 과금 |
| Hermes + 구독 OAuth | 차단 | 4월 4일부터 서버 측 거부 |
| Hermes + 비공식 패치 | 기술적 작동 | ToS 위반 위험, 언제든 무효화 가능 |
| OpenCode + Claude | 제거 | Anthropic 법적 요청으로 지원 코드 삭제 |
| OpenAI Codex + 서드파티 | 허용 | OpenAI가 공식 허용 입장 |
핵심 포인트: 4월 4일 이후 Claude 구독으로 서드파티 harness를 쓰는 경로는 서버 측에서 차단됐다. API key 종량제와 Extra Usage 번들만 합법적으로 열려 있다. Hermes와 OpenClaw 문서에 남아 있는 구 설명은 현재 실제 작동 상태와 다르므로 주의가 필요하다.
6. 왜 사용자들은 배짱장사라고 느끼는가
배짱장사라는 표현은 커뮤니티 정서를 압축한 말이다. 이 감정이 생기는 구조는 상당히 명확하다.
6.1 전환 비용이 만드는 잠금 효과
- 코딩 에이전트는 전환 비용이 크다. 프로젝트 설정, CLAUDE.md, MCP 서버 구성, hooks, skills, 팀 워크플로우 등이 모두 특정 도구에 묶인다. 다른 도구로 옮기려면 이 모든 것을 재구성해야 한다.
- Claude Code는 Anthropic의 모델과 깊이 통합돼 있으므로, 다른 harness로 옮겨도 결국 Anthropic API를 쓰게 되는 경우가 많다. 도구 수준의 전환은 가능하지만, 모델 수준의 전환은 코드 품질 차이 때문에 쉽지 않다는 것이 사용자들의 체감이다.
- 이런 잠금 효과가 강할수록, 회사의 정책 변화에 대한 사용자의 협상력은 낮아진다. 불만이 있어도 떠나기 어려우니, 남아서 불만을 표현하는 것이 유일한 선택이 된다.
6.2 기대와 현실의 구조적 간극
- 구독형 사용자는 안정성과 예측 가능성을 기대한다. 월 20달러(Pro) 또는 100~200달러(Max)를 내면 일정 수준의 사용이 보장된다고 생각한다.
- 하지만 실제로는 캐시 TTL 변경 한 번에 한도가 19분 만에 소진되고, 프롬프트 캐싱 장애로 쿼터가 비정상 소모되고, 서드파티 연동이 2주 유예로 차단된다. 이런 경험이 누적되면 구독이 보장하는 것이 무엇인지에 대한 근본적 의문이 생긴다.
- 특히 4월 4일 서드파티 차단은 사전 협의 없이 짧은 유예로 시행됐다. OpenClaw 창업자 Peter Steinberger는 Anthropic과 협상했지만 일주일 연기가 최선이었다고 밝혔다. Steinberger가 이후 OpenAI에 합류한 것도 상징적으로 받아들여졌다.
6.3 Anthropic 측 논리와 한계
- Anthropic의 입장에도 비즈니스 논리는 있다. 구독형은 일정 사용량 기대치를 전제로 한 가격이고, 서드파티 harness가 그 기대치를 크게 초과하는 트래픽을 유발했다면 제한은 합리적일 수 있다. VentureBeat는 Anthropic이 서드파티를 완전 차단한 것이 아니라 별도 과금 체계(Extra Usage)로 분리한 것이라고 정리했다.
- The Register는 이 구조를 올 유 캔 잇 뷔페에 비유했다. 특정 사용량 기대치로 가격을 책정했는데, 서드파티가 그 기대를 초과하는 방식으로 사용하면 가격 모델이 깨진다는 논리다.
- 하지만 이 논리가 사용자에게 잘 통하지 않는 이유는, 초과 사용의 책임이 사용자에게 전가되는 반면 캐시 TTL 변경이나 캐싱 버그 같은 공급 측 문제도 동시에 존재했기 때문이다. 즉, 사용자 과다 사용만이 원인이 아닌 상황에서 제한만 강화되면 반감이 커질 수밖에 없다.
핵심 포인트: 배짱장사 인식의 핵심은 전환 비용에 의한 잠금, 구독 기대와 실제 체감의 간극, 그리고 공급 측 문제(캐시 TTL, 캐싱 버그)와 수요 측 제한(서드파티 차단)이 동시에 진행된 데 있다. 어느 한쪽만의 문제로 볼 수 없는 복합적 상황이다.
7. 마무리
위에서 살펴본 Claude Code 논란의 핵심 내용을 정리하면 다음과 같습니다.
핵심 요약:
- Claude Code 사용량 급소모의 가장 구체적 원인으로 캐시 TTL 1시간→5분 무단 변경이 119,866건 API 로그 분석으로 밝혀졌다. Anthropic은 4월 중순 현재까지 이에 대한 공식 확인이나 부인을 하지 않고 있다.
- 2026년 3월에는 프롬프트 캐싱 시스템 장애로 전 유료 티어에서 5시간 세션이 19분 만에 소진되는 사례까지 나왔고, Anthropic은 장애를 인정하고 사용량을 리셋했다.
- 품질 회귀 불만은 검증 없는 자신감, 문맥 유지 저하, 지시 불이행이라는 세 가지 구체적 패턴으로 GitHub과 커뮤니티에서 반복 보고된다. Opus 4.7이 4월 16일 출시됐지만, 기존 문제에 대한 공식 설명은 없다.
- 3월 31일 npm 패키징 실수로 Claude Code 전체 소스 512,000줄이 유출됐고, 이는 이후 커뮤니티의 기술적 분석과 서드파티 우회 시도에 근거를 제공했다.
- 4월 4일부터 Claude Pro/Max 구독으로 서드파티 harness(OpenClaw, Hermes, OpenCode 등)를 쓰는 경로가 서버 측에서 차단됐다. API key 종량제와 Extra Usage 번들만 합법적으로 열려 있다.
- Hermes와 OpenClaw 문서에 남아 있는 구 인증 설명은 실제 서버 차단 상태와 다르므로, 문서와 현실을 구분해서 읽어야 한다.
Claude Code를 계속 쓸지 판단할 때는 모델 성능 하나만이 아니라, 캐시 정책 안정성, 비용 예측 가능성, 서드파티 연동 정책의 방향까지 포함한 전체 신뢰를 기준으로 봐야 한다. 팀 단위 도입을 고려한다면 Anthropic 공식 문서의 TPM/RPM 권장치와 /cost 명령으로 파일럿 기간의 실제 비용을 먼저 측정한 뒤, Extra Usage나 API key 기반으로 운영 모델을 확정하는 것이 현실적이다.