Karpathy의 Claude 코딩 몇 주간 사용 후기 정리
A few random notes from Claude coding quite a bit last few weeks
TL;DR Highlight
Andrej Karpathy는 Claude로 몇 주간 코딩하며 AI 코딩의 생산성 향상과 동시에 두뇌 퇴화, slopacolypse, 엔지니어 분화 등 부작용과 구조적 변화를 발견하고 공유했다.
Who Should Read
AI 코딩 도구(Cursor, Claude Code, Copilot 등)를 일상적으로 쓰고 있거나 도입을 고민하는 개발자. 특히 AI 코딩이 자신의 역량과 팀 문화에 어떤 영향을 미칠지 고민하는 시니어 엔지니어.
Core Mechanics
- Karpathy는 AI 코딩으로 인한 '두뇌 퇴화(Atrophy)'를 직접 체감했다고 밝혔다. 코드를 직접 작성하는 능력이 점점 약해지지만, 코드 리뷰 능력은 유지되므로 역할이 '작성자'에서 '검토자'로 바뀌고 있다는 관찰이다.
- AI 에이전트의 '끈기(Tenacity)'가 인상적이라고 했다. 사람이라면 진작 포기했을 문제를 30분 넘게 끈질기게 시도해서 결국 해결하는 모습에서 'AGI를 느끼는 순간'이라고 표현했다. 스태미나가 작업의 핵심 병목인데 LLM이 이걸 극적으로 늘려준다는 것.
- LLM 코딩이 엔지니어를 '코딩 자체를 좋아하는 사람'과 '만드는 것을 좋아하는 사람(빌더)'으로 나눌 거라고 봤다. 빌더 성향의 사람들은 AI 코딩에 열광하고, 코드 장인(craft) 성향의 사람들은 불편해하는 양상이 이미 나타나고 있다.
- 10X 엔지니어의 생산성 격차가 AI로 인해 더 벌어질 수 있다고 봤다. 평균적인 엔지니어와 최상위 엔지니어의 생산성 비율이 AI 도구 활용 능력에 따라 훨씬 커질 가능성을 언급했다.
- 2026년을 'slopacolypse(슬롭 대재앙)의 해'로 예측했다. GitHub, Substack, arXiv, SNS 등 모든 디지털 미디어에 AI가 생성한 저품질 콘텐츠가 넘쳐날 것이라는 경고다.
- IDE는 여전히 필요하다고 봤다. 터미널만으로 코딩하는 게 아니라, AI가 제안한 변경사항을 diff로 확인하고 수락/거절하는 워크플로우에서 IDE의 역할이 중요하다는 입장이다.
- GPT-5 계열 모델이 GPT-4 대비 확실한 도약(phase change)이 있다고 평가했다. 특히 복잡한 도구 호출(tool calling)이 필수인 에이전트 루프에서 차이가 극명하게 드러난다.
Evidence
- 여러 댓글에서 '두뇌 퇴화'를 넘어 '안주(complacency)'가 더 큰 문제라는 공감이 나왔다. AI가 자기 방식대로 코드를 밀어붙이면 처음엔 싸우다가 결국 포기하고 AI 방식을 수용하게 되는데, 이게 반복되면 프로젝트 자체에 대한 흥미를 잃게 된다는 경험담이 있었다. LLM은 학습 데이터 쪽으로 중력처럼 끌리기 때문에 새로운 접근법을 실험하기 어렵다는 지적도.
- AI의 '끈기'에 대해 반론도 있었다. Sonnet 모델이 타입 에러를 잡겠다고 코드베이스 전체 파일을 수정하는 등 삽질에 빠지는 경우가 많고, 심지어 '다른 거 먼저 하고 이거 나중에 하면 안 될까요?'라고 포기 선언을 하는 경우도 목격했다고. Opus는 이런 문제가 훨씬 적다는 비교도 나왔다.
- 한 은퇴 개발자는 Intel 8096 기반 펌웨어 리버스 엔지니어링 프로젝트에 Claude를 2주간 써봤더니 디스어셈블러, 어셈블러, 에뮬레이터까지 만들 수 있었다며 소규모 유틸리티 벤더들이 위험해질 수 있다고 우려했다.
- DevOps 운동과의 유사성을 지적하는 댓글이 있었다. AI 코딩으로 10X 성과를 내려면 워크플로우, 설계 방식, 팀 문화를 모두 바꿔야 하는데, DevOps도 같은 이유로 널리 퍼지지 못했다며 교육과 문화 변화 없이는 AI 코딩도 마찬가지일 거라는 의견.
- 'AI가 모든 걸 바꾸고 있다'는 얘기를 1년째 듣고 있는데 10X 품질이나 산출물은 어디에도 안 보인다며, 구체적 결과물 없는 AI 코딩 경험담은 HN에서 금지해야 한다는 냉소적 반응도 있었다.
How to Apply
- AI 에이전트가 자기 방식으로 코드를 밀어붙이는 문제를 줄이려면, CLAUDE.md나 프로젝트 규칙 파일에 설계 원칙과 코딩 컨벤션을 명시해두고 매 세션마다 참조하도록 설정하라. 컨텍스트가 길어지면 AI가 초기 지시를 '잊으므로' 핵심 규칙은 시스템 프롬프트 레벨에 배치.
- Sonnet이 삽질에 빠지는 것을 방지하려면 복잡한 디버깅은 Opus 모델을 쓰고, 중간중간 'are you on track?' 같은 체크포인트 프롬프트를 넣어라. 또는 변경 파일 수가 3개를 넘으면 자동으로 멈추게 하는 hook을 설정하는 것도 방법이다.
- AI 코딩으로 생산성을 높이되 역량 퇴화를 막으려면, 핵심 알고리즘이나 아키텍처 설계는 직접 작성하고 AI에게는 보일러플레이트, 테스트 코드, 반복 작업을 맡기는 식으로 역할을 분리하라.
- GPT-5의 tool calling 성능 향상이 유의미하다는 보고가 있으므로, 복잡한 multi-tool 에이전트 루프를 만들고 있다면 GPT-4 대신 GPT-5(reasoning=minimal)로 전환 테스트를 해볼 만하다.
Terminology
관련 논문
adamsreview: Claude Code용 멀티 에이전트 PR 코드 리뷰 파이프라인
Claude Code에서 최대 7개의 병렬 서브 에이전트가 각각 다른 관점으로 PR을 리뷰하고, 자동 수정까지 해주는 오픈소스 플러그인이다. 기존 /review나 CodeRabbit보다 실제 버그를 더 많이 잡는다고 주장하지만 커뮤니티에서는 복잡도와 실효성에 대한 회의론도 나왔다.
Claude를 User Space IP Stack으로 써서 Ping에 응답시키면 얼마나 빠를까?
Claude Code에게 IP 패킷을 직접 파싱하고 ICMP echo reply를 구성하도록 시켜서 실제로 ping에 응답하게 만든 실험으로, 'Markdown이 곧 코드이고 LLM이 프로세서'라는 아이디어를 네트워크 스택 수준까지 밀어붙인 재미있는 사례다.
AI Agent를 위한 Git: re_gent
AI 코딩 에이전트(Claude Code 등)가 수행한 모든 툴 호출을 자동으로 추적하고, 어떤 프롬프트가 어느 코드 줄을 작성했는지 blame까지 가능한 버전 관리 도구다.
Agent-Native CLI를 위한 설계 원칙 10가지
AI 에이전트가 CLI 도구를 더 잘 사용할 수 있도록 설계하는 원칙들을 정리한 글로, 에이전트가 CLI를 도구로 활용하는 빈도가 높아지면서 이 설계 방식이 실용적으로 중요해지고 있다.
Agent-harness-kit: MCP 기반 멀티 에이전트 워크플로우 오케스트레이션 프레임워크
여러 AI 에이전트가 서로 역할을 나눠 협업할 수 있도록 조율하는 scaffolding 도구로, Vite처럼 설정 없이 빠르게 멀티 에이전트 파이프라인을 구성할 수 있다.
Tilde.run – AI Agent를 위한 트랜잭션 기반 버전 관리 파일시스템 샌드박스
AI 에이전트가 실제 프로덕션 데이터를 건드려도 롤백할 수 있는 격리된 샌드박스 환경을 제공하는 도구로, GitHub/S3/Google Drive를 하나의 버전 관리 파일시스템으로 묶어준다.