'hey' 한 마디가 사용량의 22%를 날렸다
Saying 'hey' cost me 22% of my usage limits
TL;DR Highlight
Claude에 'hey' 같은 짧은 인사말을 생략하면 전체 토큰 할당량의 상당 부분을 절약할 수 있다.
Who Should Read
Claude API나 Claude.ai를 사용량 제한 내에서 효율적으로 쓰고 싶은 개발자나 일반 사용자. 특히 무료 플랜이나 제한된 플랜을 쓰는 경우 더욱 관련 있다.
Core Mechanics
- Claude에 'hey', 'hi', '안녕' 같은 짧은 인사 메시지를 먼저 보내는 것만으로도 전체 사용 한도의 22%가 소모됐다는 사례가 보고됐다.
- Claude는 단순한 인사에도 상당히 긴 응답을 생성하는 경향이 있어, 실제 질문이나 작업 없이도 토큰이 크게 소비될 수 있다.
- 사용량 제한은 단순히 메시지 횟수가 아니라 토큰(입력 + 출력) 기반으로 계산되기 때문에, 짧은 인사라도 긴 응답을 유발하면 한도를 빠르게 소진한다.
- Claude.ai의 무료 또는 제한 플랜 사용자는 이런 불필요한 워밍업 메시지 없이 바로 본론으로 들어가는 것이 사용량 관리에 훨씬 유리하다.
Evidence
- 포스트 작성자는 실제로 'hey'라는 한 단어짜리 메시지를 보냈다가 전체 사용 한도의 22%가 소모되는 것을 직접 경험했다고 밝혔다.
- 원문 접근이 차단되어 댓글 등 추가적인 커뮤니티 반응이나 재현 사례는 확인하지 못했다.
How to Apply
- Claude에 메시지를 보낼 때 'hey', 'hi', '잠깐만' 같은 인사나 빈 메시지 없이 바로 질문이나 작업 지시를 작성하는 습관을 들여라. 예: '안녕하세요, 다음 코드를 리뷰해줘' 대신 '다음 코드를 리뷰해줘'로 시작.
- Claude API를 사용하는 경우 system prompt에 '불필요한 서두나 인사 없이 바로 답변해줘'라고 명시하면 응답 토큰 수도 줄일 수 있다.
- 사용량 한도가 얼마나 남았는지 주기적으로 확인하고, 긴 대화를 시작하기 전에는 새 대화창을 열어 컨텍스트 누적으로 인한 토큰 낭비도 함께 방지하라.
Terminology
관련 논문
다국어 Reasoning Cascade는 더 많은 Context가 필요하다
번역 cascade 파이프라인에서 원본 질문을 마지막까지 유지하면 추가 학습 없이 다국어 성능이 크게 오른다.
Back-and-Forth를 줄여라: Structured Prompting 비교 연구
체크리스트 형식으로 프롬프트를 구조화하면 LLM 답변 품질도 높아지고 토큰도 적게 쓴다.
Training-Free Cultural Alignment: Persona 불일치를 활용한 LLM 문화적 정렬
재학습 없이 각 나라의 도덕적 가치관에 맞게 LLM 출력을 조정하는 추론 시점 기법 DISCA 제안
Claude Code에서 HTML을 출력 포맷으로 쓰는 이유: Markdown보다 나은 점들
Claude Code 팀이 Markdown 대신 HTML을 LLM 출력 포맷으로 선호하기 시작한 이유와 그 실용적 장점을 정리한 글로, AI와 함께 문서/스펙/대시보드를 만드는 워크플로우에 직접적인 영향을 준다.
언제 투표하고 언제 다시 쓸까: Disagreement 기반 Test-Time Scaling 전략 라우팅
모델 출력이 얼마나 일치하는지 보고 쉬운 문제엔 majority voting, 어려운 문제엔 문제 rewriting을 자동으로 선택해 정확도 3~7% 올리고 샘플링 비용도 줄이는 학습 불필요 프레임워크.
Less Is More: Android 앱에 On-Device Small Language Model 통합할 때 실제로 겪는 엔지니어링 문제들
Wordle 게임에 온디바이스 SLM(Gemma 4 E2B, Qwen3 0.6B)을 5일간 붙여보면서 발견한 5가지 실패 유형과 8가지 실용 해결책 정리
확장 가능한 Synthetic Data 생성을 위한 Dynamic Context Evolution