'hey' 한 마디가 사용량의 22%를 날렸다
Saying 'hey' cost me 22% of my usage limits
TL;DR Highlight
Claude에 'hey' 같은 짧은 인사말을 생략하면 전체 토큰 할당량의 상당 부분을 절약할 수 있다.
Who Should Read
Claude API나 Claude.ai를 사용량 제한 내에서 효율적으로 쓰고 싶은 개발자나 일반 사용자. 특히 무료 플랜이나 제한된 플랜을 쓰는 경우 더욱 관련 있다.
Core Mechanics
- Claude에 'hey', 'hi', '안녕' 같은 짧은 인사 메시지를 먼저 보내는 것만으로도 전체 사용 한도의 22%가 소모됐다는 사례가 보고됐다.
- Claude는 단순한 인사에도 상당히 긴 응답을 생성하는 경향이 있어, 실제 질문이나 작업 없이도 토큰이 크게 소비될 수 있다.
- 사용량 제한은 단순히 메시지 횟수가 아니라 토큰(입력 + 출력) 기반으로 계산되기 때문에, 짧은 인사라도 긴 응답을 유발하면 한도를 빠르게 소진한다.
- Claude.ai의 무료 또는 제한 플랜 사용자는 이런 불필요한 워밍업 메시지 없이 바로 본론으로 들어가는 것이 사용량 관리에 훨씬 유리하다.
Evidence
- 포스트 작성자는 실제로 'hey'라는 한 단어짜리 메시지를 보냈다가 전체 사용 한도의 22%가 소모되는 것을 직접 경험했다고 밝혔다.
- 원문 접근이 차단되어 댓글 등 추가적인 커뮤니티 반응이나 재현 사례는 확인하지 못했다.
How to Apply
- Claude에 메시지를 보낼 때 'hey', 'hi', '잠깐만' 같은 인사나 빈 메시지 없이 바로 질문이나 작업 지시를 작성하는 습관을 들여라. 예: '안녕하세요, 다음 코드를 리뷰해줘' 대신 '다음 코드를 리뷰해줘'로 시작.
- Claude API를 사용하는 경우 system prompt에 '불필요한 서두나 인사 없이 바로 답변해줘'라고 명시하면 응답 토큰 수도 줄일 수 있다.
- 사용량 한도가 얼마나 남았는지 주기적으로 확인하고, 긴 대화를 시작하기 전에는 새 대화창을 열어 컨텍스트 누적으로 인한 토큰 낭비도 함께 방지하라.
Terminology
관련 논문
Claude Code에서 HTML을 출력 포맷으로 쓰는 이유: Markdown보다 나은 점들
Claude Code 팀이 Markdown 대신 HTML을 LLM 출력 포맷으로 선호하기 시작한 이유와 그 실용적 장점을 정리한 글로, AI와 함께 문서/스펙/대시보드를 만드는 워크플로우에 직접적인 영향을 준다.
언제 투표하고 언제 다시 쓸까: Disagreement 기반 Test-Time Scaling 전략 라우팅
모델 출력이 얼마나 일치하는지 보고 쉬운 문제엔 majority voting, 어려운 문제엔 문제 rewriting을 자동으로 선택해 정확도 3~7% 올리고 샘플링 비용도 줄이는 학습 불필요 프레임워크.
Less Is More: Android 앱에 On-Device Small Language Model 통합할 때 실제로 겪는 엔지니어링 문제들
Wordle 게임에 온디바이스 SLM(Gemma 4 E2B, Qwen3 0.6B)을 5일간 붙여보면서 발견한 5가지 실패 유형과 8가지 실용 해결책 정리
확장 가능한 Synthetic Data 생성을 위한 Dynamic Context Evolution
VTS + Semantic Memory + Adaptive Prompt 3가지 메커니즘으로 구성된 프레임워크는 LLM 대량 synthetic data 생성 시 배치 간 중복·반복 현상을 완전히 제거한다.
Karpathy 워크플로우에서 영감받아 사전 컴파일된 Wiki로 세션당 토큰 90%+ 절감
사전에 정리된 코드베이스 Wiki를 활용하면 Claude 세션당 토큰 사용량을 90% 이상 줄인다.
3개월치 AI 생성 코드를 전부 삭제했다. 그리고 배운 것들.
AI로 작성된 코드베이스를 70% 삭제 후 2주 만에 재작성하니 절반 크기로 줄어들면서 완전한 이해 가능성을 확보했다.