로딩 중...

Crowd-sourced Human Feedback을 Bayesian Inference로 정렬하는 코드 생성 LLM의 RLHF 프레임워크 (cRLHF) | AI Paper Digest