Context Gateway – LLM 호출 전 Agent Context를 압축해주는 프록시
Show HN: Context Gateway – Compress agent context before it hits the LLM
TL;DR Highlight
오픈소스 프록시 도구는 Claude Code·Cursor 등 AI 에이전트와 LLM API 사이에서 대화 히스토리를 백그라운드에서 요약·압축하여 Context 한계 도달 시 발생하는 대기 시간을 제거한다.
Who Should Read
Claude Code, Cursor 같은 AI 코딩 에이전트를 장시간 사용하다가 context 한도 초과로 compaction 대기 시간이 불편한 개발자, 또는 LLM 에이전트 워크플로우에서 토큰 비용과 응답 지연을 줄이고 싶은 백엔드/ML 엔지니어.
Core Mechanics
- Context Gateway는 AI 에이전트(Claude Code, Cursor, OpenClaw 등)와 LLM API 사이에 위치하는 프록시 서버로, 대화 히스토리가 일정 임계값(기본 75%)에 도달하면 백그라운드에서 미리 요약(compaction)을 수행해둔다. 덕분에 실제 context 한도가 찼을 때 사용자가 기다리지 않아도 된다.
- YC 지원을 받은 Compresr AI가 만든 도구로, Apache-2.0 라이선스 오픈소스로 공개돼 있다. GitHub 스타 411개, Fork 34개 수준이다.
- 설치는 curl 한 줄로 바이너리를 받고 `context-gateway` 명령어를 실행하면 TUI(터미널 UI) 위자드가 뜬다. 위자드에서 에이전트 종류(claude_code, cursor, openclaw, custom), 요약에 쓸 모델과 API 키, Slack 알림 여부, 압축 트리거 임계값 등을 설정한다.
- 압축 결과는 `logs/history_compaction.jsonl` 파일에 기록되어 어떤 내용이 요약됐는지 확인할 수 있다.
- 지원 에이전트는 claude_code, cursor, openclaw, custom(직접 설정) 네 가지이며, custom 옵션을 통해 자체 에이전트 워크플로우에도 붙일 수 있다고 설명한다.
- Golang으로 작성된 것으로 보이며(go.mod, go.sum, .golangci.yml 존재), Docker 지원도 포함되어 있다.
Evidence
- Anthropic이 최근 1M context 창을 가진 Claude를 GA(정식 출시)했고 'lost-in-the-middle(긴 context 중간 내용을 모델이 놓치는 문제)'도 해결했다고 발표한 시점이라, Context Gateway가 해결하려는 문제 자체가 단기간에 사라질 수 있다는 지적이 많았다. '이 회사는 몇 달 안에 사라지거나 VC 돈이 떨어질 것'이라는 냉소적인 반응도 있었다.
- 캐싱 비용 문제도 제기됐다. 누군가 'context를 압축하면 기존 캐시가 깨지기 때문에, 압축 이후 전체 히스토리 토큰을 uncached 상태로 다시 과금받게 된다'고 지적했다(Claude의 prompt caching 문서 링크 포함). 이 경우 압축으로 절약하는 비용보다 캐시 미스로 늘어나는 비용이 더 클 수 있다는 우려다.
- 'Claude의 자체 compaction은 엄청 느린데 Codex는 그나마 참을 만하다. 이 도구가 그것들보다 얼마나 빠른지 수치 데이터가 있느냐'는 질문이 있었지만, 압축이 출력에 악영향을 미치는지도 직접 테스트해봐야겠다는 유보적 반응이었다. 제작사 측의 명확한 벤치마크 데이터는 공개되지 않은 상태다.
- ADK(Google Agent Development Kit) 사용자 중 한 명은 '우리 프레임워크는 이미 툴·서브에이전트별로 context 압축을 boolean 한 줄로 켤 수 있다. 외부 도구가 내 context를 건드리는 게 싫고, 이런 기능은 프레임워크 레벨에서 처리해야 할 단순한 기능이다. YC가 너무 일찍 AI 스타트업에 과투자했다'고 강하게 비판했다.
- 에이전트 출력 결과(tool call output)를 압축하면 에이전트가 문제 진단에 필요한 핵심 context를 잃을 수 있다는 품질 우려도 있었다. 또한 '로컬에서 ~1B짜리 소형 언어 모델(SLM)로 이런 기능을 내장하는 방향으로 업계가 갈 텐데, 독립 제품으로서 어떻게 sticky하게 살아남을 거냐'는 질문도 제기됐다.
How to Apply
- Claude Code를 사용하다가 긴 세션에서 compaction 대기 시간이 답답한 경우, `curl -fsSL https://compresr.ai/api/install | sh`로 설치 후 `context-gateway` 명령어로 claude_code 에이전트를 선택하면 바로 프록시로 연결할 수 있다. 단, 압축 시 기존 캐시가 깨져 추가 토큰 비용이 발생할 수 있으니 `logs/history_compaction.jsonl`을 보며 실제 비용 대비 효과를 측정해볼 것.
- Cursor IDE 사용자가 장기 코딩 세션에서 context 한도 문제를 겪는다면, TUI 위자드에서 cursor 에이전트를 선택하고 압축 트리거 임계값을 기본 75%보다 낮게(예: 60%) 설정하면 더 일찍 백그라운드 압축이 시작돼 대기 없이 넘어갈 수 있다.
- 자체 에이전트 파이프라인을 운영 중인 팀이라면 custom 옵션으로 설정 파일을 직접 작성해 연결할 수 있다. 다만 현재 ADK, LangChain 등 주요 프레임워크가 이미 유사 기능을 자체적으로 제공하므로, 도입 전에 사용 중인 프레임워크의 context 관리 기능을 먼저 확인하는 게 낫다.
Code Example
# 1. 설치
curl -fsSL https://compresr.ai/api/install | sh
# 2. TUI 위자드 실행 (에이전트 선택, 모델/API 키, 임계값 설정)
context-gateway
# 3. 압축 로그 확인
cat logs/history_compaction.jsonlTerminology
관련 논문
Claude Code, Codex, Cursor에서 바로 쓰는 Smart Model Routing 도구
프롬프트마다 적합한 AI 모델을 50ms 이내에 자동으로 선택해주는 프록시 라우터로, API 비용을 40~70% 절감할 수 있다고 주장하는 오픈소스 도구다. 단, 프롬프트 캐싱 손실 문제로 커뮤니티 반응은 엇갈린다.
900KB Transformer를 과적합시켜 100MB CSV를 7MB로 압축한 실험
단일 파일을 통째로 암기하도록 Transformer를 과적합(overfitting)시킨 뒤 arithmetic coding으로 압축하는 실험으로, 100MB CSV를 7MB(~0.5 bits/byte)까지 줄이는 데 성공했다. 모델이 '범용 이해' 대신 '특정 파일 완전 암기'를 목표로 한다는 점에서 전통적 ML 학습과 정반대 방향이라 흥미롭다.
Anthropic이 나를 Claude Code에서 밴했는데 어떻게 해야 할지 모르겠다
VPN 사용 또는 동일 카드 재사용으로 Anthropic Claude Code 계정이 이유 불명으로 정지당한 사용자의 사례와, 커뮤니티에서 나온 대안 및 우회 방법 논의.
Moebius: 0.2B 파라미터로 10B급 성능을 내는 이미지 인페인팅 모델
FLUX.1-Fill-Dev(11.9B) 대비 2% 미만의 파라미터(0.22B)로 동급 또는 그 이상의 인페인팅 품질을 달성하면서 추론 속도는 15배 빠른 경량 모델. 소비자용 GPU나 엣지 디바이스에서도 고품질 인페인팅이 가능해진다.
AI Compute Extensions (ACE) Specification — x86 CPU에 ML 연산 가속 명령어 추가
x86 Ecosystem Advisory Group이 행렬 곱셈과 저정밀도 데이터 포맷을 하드웨어 수준에서 가속하는 새로운 x86 명령어 확장 스펙 ACE를 공개했다. ML 워크로드를 CPU에서 더 효율적으로 돌리기 위한 ISA(명령어 집합 구조) 수준의 변화라 향후 AI 추론 환경에 영향을 줄 수 있다.
고해상도 Neural Cellular Automata: 세포에서 픽셀로
EPFL과 Google Research가 공동 개발한 Neural Cellular Automata(NCA)를 고해상도로 확장하는 기법으로, 기존 NCA의 해상도 한계를 경량 신경망 디코더로 극복한 SIGGRAPH 2026 논문이다.