Runtime (YC P26): 팀 전체를 위한 Sandboxed Coding Agent 플랫폼
Launch HN: Runtime (YC P26) – Sandboxed coding agents for everyone on a team
TL;DR Highlight
엔지니어링팀뿐 아니라 마케팅, 영업, 지원팀까지 누구나 샌드박스 환경에서 coding agent를 안전하게 쓸 수 있게 해주는 인프라 플랫폼으로, YC P26 배치 스타트업이 런치했다.
Who Should Read
팀 전체에 coding agent를 도입하고 싶은데 보안, 비용 통제, 환경 관리가 걱정인 플랫폼 엔지니어 또는 개발 팀 리더. Claude Code, Cursor, Codex 같은 AI 코딩 도구를 조직 차원에서 관리하고 싶은 사람.
Core Mechanics
- Runtime은 팀의 모든 coding agent가 실행되는 샌드박스 인프라 플랫폼으로, Claude Code, Cursor, Codex, Copilot, Gemini CLI, Devin, OpenCode 등 주요 AI 코딩 도구를 모두 지원한다.
- 각 세션마다 pre-warmed(미리 준비된) 격리 환경이 뜨기 때문에, mise/npm/brew/GitHub에서 설치한 도구들과 Datadog, Salesforce, Stripe, NetSuite 같은 외부 서비스 연동, MCP 서버, 커스텀 지시사항을 스냅샷으로 저장해두면 매번 설정 없이 수 초 안에 부팅된다.
- 엔지니어링팀뿐 아니라 제품, 디자인, 마케팅, 영업, 지원, 재무, 인사팀 등 각 팀별로 해당 팀에 맞는 데이터, 연동, 가드레일을 갖춘 전용 agent를 구성할 수 있다.
- Slack, Linear, GitHub, Jira에서 agent를 태그(@mention)해서 호출하면, agent가 백그라운드에서 조사·PR 작성·답장 초안·티켓 생성 등을 자동으로 처리하고 완료 시 자동 일시 정지된다.
- 가드레일(Guardrails) 기능으로 지출 한도, 파일 접근 허용 목록, 승인 게이트를 설정할 수 있고, 대시보드에서 세션별·사용자별·팀별 비용(예: 세션당 $0.04~$0.21)과 tool call, chain of thought, 파일 변경 내역을 실시간으로 모니터링할 수 있다.
- Mission Control 대시보드, CLI, API 세 가지 방식으로 사용할 수 있으며, 자체 AI API 키를 사용하는 BYOK(Bring Your Own Key) 방식을 지원한다.
- MIT, Apache 2.0, AGPL v3 등 다양한 라이선스로 일부 컴포넌트가 오픈소스로 제공되며, 자체 클라우드와 모델로 self-hosting도 가능하다.
- 여러 사람이 같은 agent 세션에 실시간으로 참여해 협업할 수 있고, 결과물을 PR, 배포, 메시지, 티켓, 리포트 등 원하는 형태로 내보낼 수 있다.
Evidence
- 마케팅팀이 agent를 통해 생성한 코드가 PR로 올라왔을 때 엔지니어가 마음에 들지 않으면 수정 흐름이 어떻게 되는지 묻는 질문이 있었다. 즉, 비엔지니어 팀이 올린 코드의 리뷰·수정 워크플로우가 명확히 설명되지 않았다는 지적이다.
- 정적 분석(Static Analysis)과 런타임 샌드박싱은 서로 보완적이지 경쟁 관계가 아니라는 의견이 있었다. 샌드박스 실행 중 안전하더라도 생성된 코드가 머지되기 전에 별도 보안 정책 검사가 필요하다는 점을 강조했다.
- 각 팀별로 가드레일을 다르게 설정할 수 있는지 묻는 댓글이 있었다. 예를 들어 마케팅팀과 데이터팀에 서로 다른 설정을 적용하고 싶다는 구체적인 사용 시나리오를 제시했다.
- 에이전트 초기 세팅을 도와주는 assistant나 템플릿 기반 온보딩 플로우를 추가해달라는 제안이 있었다. 폼 작성보다 챗봇 인터페이스로 설정하는 게 더 많은 비엔지니어 사용자를 끌어들일 수 있다는 의견이었다.
- 라이선스 관련 우려가 제기됐다. 일부 사용자가 라이선스를 확인했는데 'copyrighted'라고 명시된 부분이 있어 사용 불가 판단을 내렸으며, 완전한 FOSS(자유 오픈소스 소프트웨어) 대비 어떤 장점이 있는지 물었다. 또한 Claude의 Max 플랜이 여기서 사용 가능한지, Anthropic 정책과 충돌하지 않는지에 대한 의문도 있었다.
How to Apply
- 팀 전체에 Claude Code나 Codex를 도입하려는데 환경 설정 관리와 비용 통제가 어려운 경우, Runtime의 스냅샷 환경과 지출 한도 기능을 활용하면 매 세션마다 동일한 환경을 수 초 안에 부팅하고 사용자별·팀별 비용을 한눈에 파악할 수 있다.
- Slack이나 Linear를 주로 쓰는 팀에서 반복적인 조사 작업(예: 장애 분석, 문서 업데이트)을 자동화하고 싶다면, Runtime에서 전용 agent를 만들고 Slack 채널에 통합해 @태그만으로 백그라운드 작업을 트리거하는 방식을 적용할 수 있다.
- 엔지니어링 리소스 없이 마케팅·재무·지원팀이 직접 데이터 조회나 콘텐츠 수정 작업을 하고 싶다면, 팀별 가드레일(파일 접근 범위, 승인 게이트)을 별도로 설정해 안전하게 권한을 위임하는 구조를 만들 수 있다.
- 자체 보안 정책 때문에 SaaS 방식이 어려운 경우, MIT/Apache 라이선스로 공개된 CLI 및 공유 라이브러리를 활용해 자체 클라우드에 self-hosting하고, 내부 모델이나 API 키를 연결해 폐쇄망 환경에서 운영할 수 있다.
Terminology
관련 논문
당신의 에이전트를 밀어붙여라: Long-Horizon LLM 에이전트의 Quantitative Goal Persistence 측정과 강제
LLM 에이전트가 '100개 찾아줘'를 실제로 100개 찾을 때까지 멈추지 않게 만드는 방법과 벤치마크.
CoSPlay: 자기 생성 코드와 Unit Test로 하는 Test-Time Cooperative Self-Play
Ground Truth 없이도 코드와 Unit Test가 서로 평가하며 함께 품질을 높이는 추론 시간 최적화 프레임워크
Multi-Stream LLMs: 프롬프트, 사고, 입출력을 병렬 스트림으로 분리하는 새 논문
현재 LLM이 입력·사고·출력을 순차적으로만 처리하는 구조적 한계를 지적하고, 각 역할을 별도의 병렬 스트림으로 분리해 동시에 처리할 수 있는 Multi-Stream 방식을 제안한 논문이다. 에이전트의 효율성·보안·모니터링 가능성을 모두 개선할 수 있다는 점에서 주목받고 있다.
HarnessAPI: Streaming API와 MCP 도구를 하나로 통합하는 Skill-First 프레임워크
FastAPI HTTP 엔드포인트와 MCP 도구를 하나의 폴더에서 자동으로 동시에 만들어주는 Python 프레임워크
AI 코딩 루프에 Formal Verification Gate 적용하기
AI가 생성한 코드에서 보안 불변식(invariant)을 지키게 하려면 프롬프트 지시보다 타입 시스템 같은 구조적 제약이 훨씬 효과적이라는 주장과 구현 방법을 소개한다.
AI로 Rust 코드 100K 라인 작성하며 얻은 교훈 (2025)
Azure RSL(분산 합의 라이브러리)을 Rust로 재구현하면서 AI 코딩 에이전트를 활용해 4주 만에 100K 라인을 작성한 경험담으로, Code Contracts와 Spec-Driven Development를 AI와 조합하는 실전 워크플로우를 공유한다.
프로덕션 LLM Agent를 위한 Runtime Architecture Pattern 선택 및 조합 방법론