로딩 중...

CITER: Token 단위 라우팅으로 대형/소형 언어모델을 협력시켜 추론 비용 절감 | AI Paper Digest