Show HN: adamsreview – better multi-agent PR reviews for Claude Code
TL;DR Highlight
Claude Code에서 최대 7개의 병렬 서브 에이전트가 각각 다른 관점으로 PR을 리뷰하고, 자동 수정까지 해주는 오픈소스 플러그인이다. 기존 /review나 CodeRabbit보다 실제 버그를 더 많이 잡는다고 주장하지만 커뮤니티에서는 복잡도와 실효성에 대한 회의론도 나왔다.
Who Should Read
Claude Code(Max 플랜)를 이미 사용 중이고, 기본 /review 명령어보다 더 꼼꼼한 코드 리뷰 자동화를 원하는 개발자. 특히 혼자 또는 소규모 팀에서 PR 품질을 높이고 싶은 상황에 유용하다.
Core Mechanics
- adamsreview는 Claude Code의 플러그인으로, `/plugin marketplace add adamjgmiller/adamsreview` 한 줄로 설치할 수 있다. Claude Code의 기본 구독(Max 플랜 권장)으로 실행되며, Extra Usage 크레딧을 소모하는 /ultrareview와 달리 추가 비용이 없다.
- 핵심 명령어는 `/adamsreview:review`로, 최대 7개의 병렬 서브 에이전트가 각각 correctness(정확성), security(보안), UX 등 서로 다른 관점에서 코드를 분석한다. 이후 중복 제거(dedup) 패스, 저비용→고비용 순서의 검증 게이트, 선택적으로 Claude Opus의 종합 패스까지 거친다.
- `--ensemble` 옵션을 붙이면 내부 Claude 렌즈 외에 Codex CLI 패스와 PR 봇 댓글 스크랩까지 추가로 돌린다. 즉, OpenAI Codex와 Claude를 동시에 리뷰어로 쓰는 앙상블 구성이 가능하다.
- 총 6개의 명령어로 구성된 파이프라인이다: `:review`(메인 리뷰), `:codex-review`(Codex CLI 전용 리뷰), `:fix`(자동 수정 루프), `:add`(외부 소스 findings 주입), `:walkthrough`(인터랙티브 리뷰 안내), `:promote`(승인/커밋). 각 명령어는 공유 JSON 아티팩트를 통해 연결된다.
- `:fix` 명령어는 자동 수정 후 재리뷰를 돌려 회귀(regression)가 생기면 자동으로 되돌린다. 즉, 고쳤다가 다른 버그를 만드는 상황을 방지하는 루프가 내장돼 있다.
- `:add` 명령어로 외부에서 가져온 findings(예: Claude Cloud /ultrareview 결과 붙여넣기, 팀원 메모 등)를 기존 리뷰 아티팩트에 주입할 수 있다. 이미 발견된 항목과 중복 제거 및 검증 게이트를 동일하게 거쳐서 합쳐진다.
- 작자 본인의 PR에서 Claude Code 기본 /review, /ultrareview, CodeRabbit, Greptile, Codex 기본 리뷰보다 실제 버그를 더 많이 잡고 false positive는 적었다고 밝혔다. 다만 본인이 직접 인정했듯 'n=본인 1명'의 어닐돌 데이터다.
- `:codex-review`는 `:review`와 동일한 아티팩트 형식을 출력해서, `:fix`, `:walkthrough` 등 다운스트림 명령어를 그대로 쓸 수 있다. `--effort low|medium|high|xhigh` 옵션으로 분석 깊이를 조절할 수 있다(기본값 high).
Evidence
- 멀티 에이전트 리뷰의 실효성에 대한 회의론이 가장 많이 제기됐다. '복잡성을 복잡성으로 싸운다'는 지적이 있었고, '결국 리뷰에 신경 쓰는 사람들만 이런 도구를 쓰는데, 진짜 문제는 Claude가 뱉은 걸 읽지도 않고 accept 누르는 사람들'이라는 날카로운 비판도 나왔다.
- 실효성을 증명할 방법론에 대한 문제 제기가 있었다. '실제 버그 클래스에 대한 eval 하네스(자동 평가 프레임워크)로 벤치마크를 돌려야 설득력이 있지, /review와 비교한 어닐돌 데이터로는 부족하다'는 댓글이 달렸다.
- 병렬 에이전트가 실제로 왜 더 잘 잡는지 메커니즘이 불분명하다는 의견이 있었다. '커버리지(각 에이전트가 다른 부분을 보는 것) 때문인지, 동일 부분에 대한 두 번째 의견 효과 때문인지 README만으론 명확하지 않다'는 질문이 달렸고, 작자의 명확한 답변은 없었다.
- 비슷한 도구를 직접 만들어봤다는 경험담도 공유됐다. TypeScript로 결정론적 멀티 에이전트 오케스트레이션을 구현해봤는데, 티켓 조회 같은 컨텍스트 수집에서 조율 에이전트가 잘 못 했다는 경험과 함께, 리뷰 지침이 너무 모호하면 피상적인 리뷰가, 너무 구체적이면 다른 종류의 PR에 적용이 안 된다는 어려움을 토로했다.
- AI가 작성한 코드를 AI가 리뷰하는 것 자체에 대한 철학적 회의론도 나왔다. '나는 Claude를 시켜서 Claude에게 쓸 지침을 쓰고, 그 Claude가 Claude가 짠 코드를 리뷰한다—우리 다들 포기한 건가?'라는 댓글이 공감을 많이 받았다. 반면 사람이 직접 로컬에서 리뷰하고 그 결과를 Claude에 피드백하는 tuicr.dev 같은 도구가 더 낫다는 대안 의견도 있었다.
How to Apply
- Claude Code Max 플랜을 쓰고 있고 기본 /review가 너무 피상적이라고 느낀다면, `/plugin marketplace add adamjgmiller/adamsreview` 후 `/adamsreview:review`를 실행해보자. Extra Usage 크레딧 소모 없이 7개 렌즈 리뷰를 테스트할 수 있다.
- 보안 취약점이나 엣지 케이스가 걱정되는 PR이라면 `--ensemble` 옵션을 붙여 Codex CLI까지 동시에 돌리는 앙상블 구성을 써볼 수 있다. 단, 토큰 소모가 커지므로 중요한 PR에만 선택적으로 적용하는 게 합리적이다.
- 팀원의 수동 리뷰 코멘트나 /ultrareview 결과를 이미 갖고 있다면 `:add` 명령어로 외부 findings를 기존 리뷰 아티팩트에 합쳐서 중복 없이 통합할 수 있다. 이렇게 하면 여러 소스의 리뷰를 하나의 파이프라인으로 관리할 수 있다.
- 자동 수정 기능이 걱정된다면 `:fix` 명령어가 수정 후 재리뷰→회귀 시 자동 롤백을 해준다는 점을 활용해서, `:walkthrough`로 수정 사항을 하나씩 확인하며 배치 수락 여부를 결정할 수 있다.
Code Example
# 설치
/plugin marketplace add adamjgmiller/adamsreview
/plugin install adamsreview@adamsreview
# 기본 멀티렌즈 리뷰 (최대 7개 병렬 에이전트)
/adamsreview:review
# Codex + Claude 앙상블 리뷰
/adamsreview:review --ensemble
# Codex CLI 전용 리뷰 (effort 조절 가능: low|medium|high|xhigh)
/adamsreview:codex-review --effort high
# 자동 수정 루프 실행
/adamsreview:fix
# 외부 findings 주입 (예: ultrareview 결과 붙여넣기)
/adamsreview:add
# 인터랙티브 리뷰 워크스루
/adamsreview:walkthrough
# 승인 및 커밋
/adamsreview:promoteTerminology
Related Papers
How Fast Does Claude, Acting as a User Space IP Stack, Respond to Pings?
Claude Code에게 IP 패킷을 직접 파싱하고 ICMP echo reply를 구성하도록 시켜서 실제로 ping에 응답하게 만든 실험으로, 'Markdown이 곧 코드이고 LLM이 프로세서'라는 아이디어를 네트워크 스택 수준까지 밀어붙인 재미있는 사례다.
Show HN: Git for AI Agents
AI 코딩 에이전트(Claude Code 등)가 수행한 모든 툴 호출을 자동으로 추적하고, 어떤 프롬프트가 어느 코드 줄을 작성했는지 blame까지 가능한 버전 관리 도구다.
Principles for agent-native CLIs
AI 에이전트가 CLI 도구를 더 잘 사용할 수 있도록 설계하는 원칙들을 정리한 글로, 에이전트가 CLI를 도구로 활용하는 빈도가 높아지면서 이 설계 방식이 실용적으로 중요해지고 있다.
Agent-harness-kit scaffolding for multi-agent workflows (MCP, provider-agnostic)
여러 AI 에이전트가 서로 역할을 나눠 협업할 수 있도록 조율하는 scaffolding 도구로, Vite처럼 설정 없이 빠르게 멀티 에이전트 파이프라인을 구성할 수 있다.
Show HN: Tilde.run – Agent sandbox with a transactional, versioned filesystem
AI 에이전트가 실제 프로덕션 데이터를 건드려도 롤백할 수 있는 격리된 샌드박스 환경을 제공하는 도구로, GitHub/S3/Google Drive를 하나의 버전 관리 파일시스템으로 묶어준다.
FlexSQL: Flexible Exploration and Execution Make Better Text-to-SQL Agents
고정된 파이프라인 대신 추론 중 언제든 DB를 탐색·실행할 수 있는 Text-to-SQL 에이전트로 Spider2.0 벤치마크에서 gpt-o3, DeepSeek-R1 기반 시스템을 더 작은 모델로 능가