모든 LLM은 기본 말투가 있고, 그게 우리를 다 똑같이 들리게 만든다

TL;DR Highlight

Noren은 개인 글쓰기 스타일을 학습하여 LLM 생성 텍스트를 개인화함으로써 모든 LLM이 동일한 기본 문체로 수렴하는 문제를 해결한다.

Who Should Read

개인 목소리를 유지하며 AI 글쓰기를 활용하고 싶은 콘텐츠 크리에이터

Core Mechanics

LLM은 동일한 "기본 목소리"로 회귀하는 경향이 있어 모든 출력이 비슷해짐
Noren은 사용자의 실제 글쓰기 패턴을 먼저 학습한 후 생성
usenoren.ai 에서 얼리 액세스 가능

Evidence

모든 LLM이 동일한 기본 목소리로 회귀하는 경향 관찰
Noren이 개인 글쓰기 패턴을 학습한 후 생성하는 방식으로 차별화
usenoren.ai 에서 얼리 액세스 가능

How to Apply

AI 글쓰기 동질화가 걱정된다면 usenoren.ai 체험
직접 쓴 샘플을 AI에게 스타일 참조용으로 제공하는 방법도 효과적

Code Example

snippet

# 시스템 프롬프트 예시 - LLM 기본 문체 억제
system_prompt = """
You are a writing assistant. Follow these style rules strictly:
- Do NOT start responses with 'Certainly!', 'Great!', 'Absolutely!', or similar filler.
- Do NOT overuse bullet points. Use prose when possible.
- Match the tone of the sample texts provided by the user.
- Be direct and concise. Avoid hedging phrases like 'It's worth noting that...'
- Write as if you are the user, not an AI assistant.
"""

Terminology

default voiceLLM이 특별한 지시 없이 기본적으로 사용하는 문체, 톤, 표현 패턴. 학습 데이터와 RLHF 과정에서 형성되며 모델마다 고유한 습관이 있다.

RLHFReinforcement Learning from Human Feedback. 인간 평가자의 피드백으로 LLM을 추가 학습시키는 방법. 이 과정에서 '도움이 되어 보이는' 특정 문체가 강화되어 기본 말투가 형성된다.

filler phrases실질적인 정보 없이 응답을 부드럽게 시작하기 위해 쓰는 상투적 표현. 'Certainly!', 'Great question!', 'Absolutely!' 등이 대표적이며 AI 글쓰기의 대표적인 티 나는 패턴이다.

Related Resources

https://www.reddit.com/r/ChatGPT/comments/1rz0fjz/