Captain (YC W26) – 파일 대상 자동화 RAG SaaS 서비스 런칭 | AI Paper Digest

TL;DR Highlight

Captain이 파일 업로드만으로 OCR·청킹·임베딩·벡터 저장소·리랭킹을 한 번의 API 호출로 처리하는 관리형 서비스를 출시했으나 커뮤니티는 차별점과 가격 정책에 회의적이다.

Who Should Read

RAG 파이프라인을 직접 구축하고 유지보수하는 데 시간을 쓰기 싫은 백엔드/풀스택 개발자, 또는 엔터프라이즈 문서 검색 기능을 빠르게 프로토타이핑해야 하는 팀.

Core Mechanics

Captain은 OCR, 청킹, 임베딩, 벡터 DB 관리, 하이브리드 검색, 리랭킹을 모두 포함한 '완전 관리형 RAG 파이프라인'을 단일 API 호출로 제공한다. 직접 구축하면 3~6개월 걸리고 정확도가 약 78% 수준인 반면, Captain은 몇 분 안에 배포하고 95% 정확도를 달성할 수 있다고 주장한다.
데이터 소스 연동은 Azure Blob, GCP Storage, Amazon S3, SharePoint, Google Drive, Dropbox, Confluence, Slack, Gmail, Notion 등 1,000가지 이상의 커넥터를 지원한다고 밝히고 있다.
검색 방식은 키워드 검색과 시맨틱(의미 기반) 검색을 가중치로 조합하는 하이브리드 서치에, VLM(Vision Language Model)을 활용한 자동 OCR과 파일 변환까지 포함된 인덱싱 파이프라인을 제공한다.
역할 기반 접근 제어(RBAC)를 지원하며, 파일 인덱싱 시 커스텀 메타데이터를 첨부하고 쿼리 시 세분화된 조건으로 필터링할 수 있다. SOC 2 인증을 받았다고 밝히며 독립적인 감사 및 펜 테스트를 통과했다고 언급한다.
API는 query 파라미터 외에 inference(추론 포함 여부), stream(스트리밍), rerank(리랭킹), top_k(상위 결과 수) 옵션을 직접 지정할 수 있는 구조로, 개발자가 세부 동작을 어느 정도 제어할 수 있도록 설계되어 있다.
YC의 Garry Tan이 'Captain은 기존 RAG 파이프라인 대비 step function 수준의 개선'이라고 트위터에서 언급하는 등 YC 측의 지지를 받고 있다.
가격 체계는 공개되어 있지만 구체적인 규모별 비용 예시가 부족하다는 피드백이 있었다. 한 커뮤니티 사용자는 월 1,000페이지 분량의 신규/갱신 콘텐츠를 처리할 경우 월 $295 플랜으로 무제한 쿼리가 가능한지 추측하며 명확한 안내를 요청했다.

Evidence

단일 API 호출로 전체 파이프라인을 처리하는 방식이 편리하다는 긍정적인 반응도 있었지만, 'Gemini에서 파일을 직접 대화할 수 있는데 타사 API를 래핑한 것에 불과하다', '커넥터나 인제스천 파이프라인은 이미 범용화된 기술'이라며 실질적인 차별점이 없다는 회의적 의견이 상당수였다.
보안과 데이터 신뢰성에 대한 우려도 제기됐다. 'SOC 2는 이미 보안 인증으로서 신뢰도가 낮아졌고, 이제 막 생긴 회사에 민감한 회사 문서를 전부 올리라는 건 현실적으로 작동하기 어렵다'는 날카로운 지적이 있었다.
'Codex 같은 AI 코딩 도구가 워낙 좋아진 지금, 하루 만에 99% 케이스를 커버하는 솔루션을 직접 만들 수 있다'는 의견도 나왔다. Tobi(Shopify CEO)가 비개발자임에도 vibe-coding으로 QMD(Query My Documents)라는 RAG 엔진을 직접 만들었고 이게 실제 사용되고 있다는 사례가 인용되며, 이런 관리형 서비스의 존재 이유 자체에 의문을 제기했다.
PDF 내 답변 위치를 추적하는 citation 기능에 대한 요청이 있었는데, 실제 데모 사이트(pg.runcaptain.com)를 테스트한 사용자는 파일명만 출력되고 문서 내 정확한 위치 링크가 제공되지 않는다는 UX 문제를 지적했다. 또한 텍스트 생성 중 텍스트를 드래그 선택하려 하면 계속 해제되는 버그도 보고됐다.
CSV, XLSX, JSON 같은 구조화된 데이터 처리 방식과, YouTube나 팟캐스트, 임의 웹사이트 링크를 자동으로 마크다운으로 변환하는 기능에 대한 지원 여부를 묻는 질문이 있었으나, 현재 공개된 정보에서는 이에 대한 명확한 답변이 없다.

How to Apply

기존에 S3, Google Drive, SharePoint 등에 분산된 사내 문서를 기반으로 LLM 검색 기능을 빠르게 프로토타이핑해야 하는 경우, Captain의 컬렉션 API에 데이터 소스를 연결하고 단일 POST 요청으로 hybrid search + rerank 파이프라인을 즉시 테스트해볼 수 있다.
파일별로 접근 권한이 다른 엔터프라이즈 문서 검색 시스템을 구축해야 한다면, 인덱싱 시 사용자 역할 관련 커스텀 메타데이터를 첨부하고 쿼리 시 필터 조건을 걸어 RBAC를 구현하는 방식을 참고할 수 있다. 단, SOC 2 인증의 실질적 보안 수준과 데이터 주권 문제는 도입 전 별도로 검토가 필요하다.
직접 RAG 파이프라인을 운영 중인데 정확도가 낮거나 유지보수 부담이 크다면, Captain의 공개 데모(pg.runcaptain.com)에서 자신의 문서를 테스트해보고 결과 품질과 citation 정확도를 자체 파이프라인과 비교해보는 것이 현실적인 평가 방법이다.

Code Example

snippet

// Captain v2 Collections Query API 예시
const BASE_URL = 'https://api.runcaptain.com';
const API_KEY = 'your_api_key';

const response = await fetch(
  `${BASE_URL}/v2/collections/my_documents/query`,
  {
    method: 'POST',
    headers: {
      'Authorization': `Bearer ${API_KEY}`,
      'Content-Type': 'application/json'
    },
    body: JSON.stringify({
      query: 'What are the key terms?',
      inference: true,   // LLM 추론 포함 여부
      stream: true,      // 스트리밍 응답
      rerank: true,      // 리랭킹 적용
      top_k: 10          // 상위 10개 결과 반환
    })
  }
);

Terminology

RAGRetrieval-Augmented Generation의 약자. LLM이 답변할 때 사전에 관련 문서를 검색해서 컨텍스트로 제공하는 방식. 모델이 학습하지 않은 사내 문서나 최신 정보를 활용할 수 있게 해준다.

VLMVision Language Model. 이미지나 스캔된 문서처럼 텍스트가 그림 형태로 들어있는 파일도 이해할 수 있는 멀티모달 AI 모델. OCR보다 복잡한 레이아웃도 처리할 수 있다.

Reranking검색 결과를 한 번 더 정렬하는 단계. 처음에 유사도 기반으로 뽑은 후보 문서들을 더 정교한 모델로 다시 점수를 매겨 순서를 조정해 최종 정확도를 높인다.

Hybrid Search키워드 검색(BM25 같은 전통적 방식)과 벡터 기반 시맨틱 검색을 조합하는 방식. 정확한 단어 매칭과 의미 기반 유사도를 동시에 활용해 검색 품질을 높인다.

SOC 2미국 공인회계사협회(AICPA)가 정한 클라우드 서비스 보안 인증. 데이터 보안, 가용성, 기밀성 등을 독립 감사를 통해 검증하지만, 커뮤니티에서는 형식적인 인증에 그치는 경우가 많다는 비판도 있다.

RBACRole-Based Access Control. 사용자의 역할(예: 관리자, 일반 직원, 특정 부서)에 따라 접근 가능한 데이터를 제한하는 권한 관리 방식.

Captain (YC W26) – 파일 대상 자동화 RAG SaaS 서비스 런칭