Runtime (YC P26): 팀 전체를 위한 Sandboxed Coding Agent 플랫폼

TL;DR Highlight

엔지니어링팀뿐 아니라 마케팅, 영업, 지원팀까지 누구나 샌드박스 환경에서 coding agent를 안전하게 쓸 수 있게 해주는 인프라 플랫폼으로, YC P26 배치 스타트업이 런치했다.

Who Should Read

팀 전체에 coding agent를 도입하고 싶은데 보안, 비용 통제, 환경 관리가 걱정인 플랫폼 엔지니어 또는 개발 팀 리더. Claude Code, Cursor, Codex 같은 AI 코딩 도구를 조직 차원에서 관리하고 싶은 사람.

Core Mechanics

Runtime은 팀의 모든 coding agent가 실행되는 샌드박스 인프라 플랫폼으로, Claude Code, Cursor, Codex, Copilot, Gemini CLI, Devin, OpenCode 등 주요 AI 코딩 도구를 모두 지원한다.
각 세션마다 pre-warmed(미리 준비된) 격리 환경이 뜨기 때문에, mise/npm/brew/GitHub에서 설치한 도구들과 Datadog, Salesforce, Stripe, NetSuite 같은 외부 서비스 연동, MCP 서버, 커스텀 지시사항을 스냅샷으로 저장해두면 매번 설정 없이 수 초 안에 부팅된다.
엔지니어링팀뿐 아니라 제품, 디자인, 마케팅, 영업, 지원, 재무, 인사팀 등 각 팀별로 해당 팀에 맞는 데이터, 연동, 가드레일을 갖춘 전용 agent를 구성할 수 있다.
Slack, Linear, GitHub, Jira에서 agent를 태그(@mention)해서 호출하면, agent가 백그라운드에서 조사·PR 작성·답장 초안·티켓 생성 등을 자동으로 처리하고 완료 시 자동 일시 정지된다.
가드레일(Guardrails) 기능으로 지출 한도, 파일 접근 허용 목록, 승인 게이트를 설정할 수 있고, 대시보드에서 세션별·사용자별·팀별 비용(예: 세션당 $0.04~$0.21)과 tool call, chain of thought, 파일 변경 내역을 실시간으로 모니터링할 수 있다.
Mission Control 대시보드, CLI, API 세 가지 방식으로 사용할 수 있으며, 자체 AI API 키를 사용하는 BYOK(Bring Your Own Key) 방식을 지원한다.
MIT, Apache 2.0, AGPL v3 등 다양한 라이선스로 일부 컴포넌트가 오픈소스로 제공되며, 자체 클라우드와 모델로 self-hosting도 가능하다.
여러 사람이 같은 agent 세션에 실시간으로 참여해 협업할 수 있고, 결과물을 PR, 배포, 메시지, 티켓, 리포트 등 원하는 형태로 내보낼 수 있다.

Evidence

마케팅팀이 agent를 통해 생성한 코드가 PR로 올라왔을 때 엔지니어가 마음에 들지 않으면 수정 흐름이 어떻게 되는지 묻는 질문이 있었다. 즉, 비엔지니어 팀이 올린 코드의 리뷰·수정 워크플로우가 명확히 설명되지 않았다는 지적이다.
정적 분석(Static Analysis)과 런타임 샌드박싱은 서로 보완적이지 경쟁 관계가 아니라는 의견이 있었다. 샌드박스 실행 중 안전하더라도 생성된 코드가 머지되기 전에 별도 보안 정책 검사가 필요하다는 점을 강조했다.
각 팀별로 가드레일을 다르게 설정할 수 있는지 묻는 댓글이 있었다. 예를 들어 마케팅팀과 데이터팀에 서로 다른 설정을 적용하고 싶다는 구체적인 사용 시나리오를 제시했다.
에이전트 초기 세팅을 도와주는 assistant나 템플릿 기반 온보딩 플로우를 추가해달라는 제안이 있었다. 폼 작성보다 챗봇 인터페이스로 설정하는 게 더 많은 비엔지니어 사용자를 끌어들일 수 있다는 의견이었다.
라이선스 관련 우려가 제기됐다. 일부 사용자가 라이선스를 확인했는데 'copyrighted'라고 명시된 부분이 있어 사용 불가 판단을 내렸으며, 완전한 FOSS(자유 오픈소스 소프트웨어) 대비 어떤 장점이 있는지 물었다. 또한 Claude의 Max 플랜이 여기서 사용 가능한지, Anthropic 정책과 충돌하지 않는지에 대한 의문도 있었다.

How to Apply

팀 전체에 Claude Code나 Codex를 도입하려는데 환경 설정 관리와 비용 통제가 어려운 경우, Runtime의 스냅샷 환경과 지출 한도 기능을 활용하면 매 세션마다 동일한 환경을 수 초 안에 부팅하고 사용자별·팀별 비용을 한눈에 파악할 수 있다.
Slack이나 Linear를 주로 쓰는 팀에서 반복적인 조사 작업(예: 장애 분석, 문서 업데이트)을 자동화하고 싶다면, Runtime에서 전용 agent를 만들고 Slack 채널에 통합해 @태그만으로 백그라운드 작업을 트리거하는 방식을 적용할 수 있다.
엔지니어링 리소스 없이 마케팅·재무·지원팀이 직접 데이터 조회나 콘텐츠 수정 작업을 하고 싶다면, 팀별 가드레일(파일 접근 범위, 승인 게이트)을 별도로 설정해 안전하게 권한을 위임하는 구조를 만들 수 있다.
자체 보안 정책 때문에 SaaS 방식이 어려운 경우, MIT/Apache 라이선스로 공개된 CLI 및 공유 라이브러리를 활용해 자체 클라우드에 self-hosting하고, 내부 모델이나 API 키를 연결해 폐쇄망 환경에서 운영할 수 있다.

Terminology

Sandbox실제 시스템에 영향을 주지 않는 격리된 실행 환경. 에이전트가 파일을 수정하거나 명령을 실행해도 메인 서버나 코드베이스에 직접 영향을 주지 않는다.

MCP(Model Context Protocol)AI 모델이 외부 도구나 서비스에 연결하기 위한 표준 프로토콜. 에이전트가 Slack, GitHub 같은 서비스를 직접 호출할 수 있게 해준다.

GuardrailsAI 에이전트가 할 수 있는 행동의 범위를 제한하는 규칙 집합. 예를 들어 특정 파일에 접근 금지, 일정 비용 이상 사용 불가, 중요 작업은 사람 승인 필요 등을 설정할 수 있다.

Pre-warmed environment미리 설정을 완료해둔 실행 환경. 마치 포털 사이트처럼 처음 접속할 때 초기화 시간 없이 바로 사용할 수 있는 상태를 말한다.

Chain of thoughtAI가 최종 답변을 내기 전에 단계별로 추론하는 과정. Runtime에서는 이 과정을 대시보드에서 실시간으로 볼 수 있어 에이전트가 무슨 생각으로 어떤 행동을 하는지 추적 가능하다.

BYOK(Bring Your Own Key)서비스 제공자의 API 키 대신 사용자 본인의 AI API 키(예: Anthropic, OpenAI)를 직접 연결해 사용하는 방식. 비용이 자신의 계정으로 청구되고 사용량을 직접 통제할 수 있다.