Pu.sh – 400줄 Shell 스크립트로 만든 완전한 Coding Agent Harness
Show HN: Pu.sh – a full coding-agent harness in 400 lines of shell
TL;DR Highlight
npm, pip, Docker 없이 curl과 awk만으로 동작하는 400줄짜리 Shell 기반 코딩 에이전트 실행 환경으로, 의존성 없이 API 키 하나만 있으면 바로 쓸 수 있다.
Who Should Read
무거운 프레임워크 없이 가볍게 AI 코딩 에이전트를 직접 돌려보고 싶은 개발자, 또는 에이전트 harness 구조를 직접 뜯어보며 학습하고 싶은 백엔드/인프라 개발자.
Core Mechanics
- pu.sh는 코딩 에이전트를 실행하기 위한 harness(실행 틀)를 순수 Shell 스크립트 400줄로 구현했다. npm, pip, Docker 같은 외부 런타임 없이 curl, awk, 그리고 LLM API 키만 있으면 동작한다.
- 설치는 한 줄 명령어로 끝난다. `curl -sL pu.dev/pu.sh -o pu.sh && chmod +x pu.sh` 실행 후 `./pu.sh`로 바로 사용 가능하다.
- MIT 라이선스로 공개되어 있고, GitHub에 소스와 문서가 함께 제공된다. 'slop cannon(빠르게 코드를 뱉어내는 도구)'이라고 자칭할 만큼 빠른 코드 생성을 목표로 한다.
- 400줄이라는 라인 수 제한을 맞추기 위해 코드를 압축(minify)했는데, 이 때문에 소스 가독성이 크게 떨어진다는 것이 커뮤니티의 가장 큰 비판 포인트다.
- 의존성이 전혀 없어서 busybox 같은 최소 환경이나 컨테이너 기반 dev 환경에도 바로 넣어서 쓸 수 있다는 점이 장점으로 꼽힌다.
- 에이전트 harness의 핵심 평가 기준으로 'tool call 기록 및 재생(record/replay)과 실패 모드 처리'가 언급됐는데, 이 부분이 에이전트 디버깅에서 가장 복잡해지는 구간이기 때문이다.
Evidence
- 400줄 제한을 맞추기 위해 코드를 minify한 것이 가장 큰 논란이었다. '마케팅 gimmick을 위해 코드를 읽을 수 없게 만든 건 보안 문제이기도 하고, 결국 100% vibe coding(이해 없이 AI가 짠 코드) 상태로 남게 된다'는 강한 비판이 있었다. 압축 전 원본 6KB 버전을 공개해달라는 요청도 있었다.
- pu.sh에서 영감을 받아 비슷한 도구를 직접 만든 사례도 있었다. Node.js 하나만 의존성으로 쓰고, 1K LOC 이하, ASCII only, Ollama 모델 지원, 가독성 있는 소스, 마크다운 출력, read-only 모드 토글 등의 조건으로 몇 시간 만에 구현했다는 경험이 공유됐다.
- 에이전트 harness 평가 기준으로 'tool call의 record/replay와 실패 모드 처리 능력'이 중요하다는 의견이 있었다. 실제로 에이전트 디버깅에서 가장 복잡해지는 부분이 이 구간이기 때문에, 이 기능이 얼마나 잘 구현됐느냐가 핵심이라는 시각이다.
- Claude Agent SDK의 vendor-agnostic 대안이 필요해서 직접 비슷한 도구를 만들었다는 댓글도 있었다. CLI, ACP(Agent Communication Protocol), 임베더블 Python 패키지 형태로 제공하며 여러 프로젝트에서 실제 사용 중이라고 했다.
- busybox와 함께 컨테이너 기반 dev 환경에 넣어서 실험해보겠다는 반응도 있었다. 의존성이 전혀 없다는 점이 최소 환경에서 활용하기 좋다는 실용적 관점에서 긍정 평가를 받았다.
How to Apply
- 로컬에 Node.js나 Python 환경 세팅 없이 빠르게 AI 코딩 에이전트를 써보고 싶다면, `curl -sL pu.dev/pu.sh -o pu.sh && chmod +x pu.sh` 한 줄로 설치 후 LLM API 키만 세팅해서 바로 실행할 수 있다.
- busybox나 Alpine Linux 기반의 최소 컨테이너 환경에서 AI 코딩 에이전트를 돌려야 하는 경우, curl과 awk만 있으면 동작하는 pu.sh를 넣어서 추가 의존성 없이 활용할 수 있다.
- 에이전트 harness를 직접 구현해보고 싶은데 어디서 시작할지 모르겠다면, pu.sh 구조를 참고해 Shell 또는 Node.js로 비슷한 단일 파일 에이전트를 만들어볼 수 있다. 커뮤니티에서 공유된 Node.js 버전(willhanlen.com)도 참고 예시로 활용 가능하다.
- Claude Agent SDK처럼 특정 벤더에 묶이지 않는 에이전트 실행 환경이 필요하다면, pu.sh나 댓글에서 소개된 aloop(github.com/zackham/aloop) 같은 vendor-agnostic 오픈소스 harness를 기존 프로젝트에 통합하는 것을 검토할 수 있다.
Code Example
# 설치 및 실행
curl -sL pu.dev/pu.sh -o pu.sh && chmod +x pu.sh
./pu.sh
# 필요한 것: curl, awk, LLM API 키
# npm, pip, docker 불필요Terminology
관련 논문
Ramp의 Sheets AI가 재무 데이터를 외부로 유출한 취약점 분석
Ramp의 스프레드시트 AI 에이전트가 외부 데이터셋에 숨겨진 프롬프트 인젝션에 속아 악성 수식을 자동 삽입하고 기밀 재무 데이터를 외부 서버로 유출할 수 있었던 취약점이 공개됐다. AI 에이전트가 신뢰할 수 없는 데이터를 처리할 때 얼마나 위험한지를 보여주는 실제 사례다.
AI가 내 게임을 플레이하게 하기 – 플레이테스팅을 돕는 Agentic Test Harness 구축
인디 게임 개발자가 LLM 에이전트를 활용해 게임을 자동으로 플레이테스트하는 시스템을 만든 경험 공유로, 솔로 개발자의 QA 병목을 AI로 해결하는 실용적 접근법이다.
AgentWard: 자율 AI 에이전트를 위한 Lifecycle Security 아키텍처
AI 에이전트의 초기화부터 실행까지 5단계 전 생애주기에 걸친 보안 레이어를 체계적으로 설계한 방어 아키텍처 제안.
Tendril – 스스로 도구를 만들고 등록하는 Self-extending Agent
Tendril은 요청받은 작업에 필요한 도구가 없으면 직접 코드를 작성해 등록하고 재사용하는 자기 확장형 AI 에이전트 패턴의 레퍼런스 구현체다. 매 세션마다 도구 레지스트리가 쌓여 점점 더 빠르고 효율적으로 작동한다.
TerminalBench 1위 달성한 오픈소스 코딩 에이전트 Dirac - API 비용 50~80% 절감
컨텍스트를 극도로 효율적으로 관리해 API 비용을 평균 64.8% 줄이면서도 코드 품질은 올린 오픈소스 코딩 에이전트 Dirac이 공개됐다. Gemini-3-flash-preview 기준 TerminalBench-2에서 65.2%로 1위를 기록했다.
EvanFlow – Claude Code를 위한 TDD 기반 반복 피드백 루프
Claude Code에서 'let's evanflow this'라고 말하는 것만으로 브레인스토밍부터 TDD 구현, 반복 검증까지 자동으로 진행해주는 16개 스킬 묶음이다. AI 코드 생성의 고질적인 문제인 테스트 없는 구현과 맥락 손실을 체계적으로 잡아주는 워크플로우라서 주목받고 있다.