주요 LLM 모델 특징 비교
| 모델 | 장점 | 단점 | 적합한 사용 사례 |
|---|---|---|---|
| Claude Sonnet | 안정적인 성능, 균형 잡힌 응답 속도 | 비용 중간 수준 | 일상 대화, 일반 질의응답 |
| Claude Opus | 최고 수준의 추론 능력 | 가장 높은 가격대 | 복잡한 분석, 전략 수립 |
| GPT-5.2 | 다양한 기능과 확장성 | 응답 지연 발생 가능 | 창작, 콘텐츠 생성 |
| Gemini 3 Pro | 무료 할당량 풍부, 멀티모달 지원 | 복잡한 작업 처리에 한계 | 이미지 인식, 간단한 질의 |
| DeepSeek-V3 | 높은 비용 효율성, 중국어 최적화 | 영문 컨텍스트 약점 | 코드 생성, 프로그래밍 보조 |
사용 시나리오 기반 모델 선택 전략
- 일상적인 상호작용: Claude Sonnet 4.5 권장 — 반응 속도와 안정성, 적절한 가격의 조합.
- 고난이도 문제 해결: Claude Opus 4.6 사용 — 정교한 논리 구조와 높은 정확도 요구 시 최적.
- 이미지 기반 인식: Gemini 3 Pro 선택 — 멀티모달 처리 능력과 무료 리소스 활용.
- 개발 및 코드 작업: DeepSeek-V3 채택 — 코드 이해도 우수, 한국어/중국어 친화적 출력.
모델 장애 대응(Fallback) 메커니즘
기본 모델(primary)이 다음 상황에서 실패할 경우, 시스템은 자동으로 대체 모델(fallback)로 전환합니다:
- API 호출 오류
- 시간 초과(timeout)
- 속도 제한(rate limit)
- 서비스 다운
기본 Fallback 설정 예시
~/.openclaw/openclaw.json 파일 내 구성:
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-opus-4-6",
"fallbacks": [
"openai-codex/gpt-5.3-codex",
"google-antigravity/claude-opus-4-6-thinking"
]
}
}
}
}
전환 순서는 다음과 같습니다:
- 기본 모델 실행 시도
- 실패 시 첫 번째 대체 모델로 전환
- 계속 실패 시 두 번째 대체 모델로 이행
- 모든 모델 실패 시 에러 반환
사례 1: 비용 최적화 중심 Fallback
{
"agents": {
"defaults": {
"model": {
"primary": "deepseek/deepseek-chat",
"fallbacks": [
"anthropic/claude-sonnet-4-5",
"anthropic/claude-opus-4-6"
]
}
}
}
}
- 기본적으로 저비용인 DeepSeek 사용
- 제한에 걸릴 경우 Sonnet으로 전환
- 최종적으로 Opus로 품질 보장
- 비용 평균 80% 이상 절감 가능
사례 2: 성능 우선 전략
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-opus-4-6",
"fallbacks": [
"anthropic/claude-sonnet-4-5",
"deepseek/deepseek-chat"
]
}
}
}
}
- 최고 성능 유지
- 트래픽 피크 시 단계적 강도 낮춤
- 서비스 연속성 보장
사례 3: 공급자 다변화 전략
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-sonnet-4-5",
"fallbacks": [
"openai/gpt-4o",
"google/gemini-2.0-flash-exp",
"deepseek/deepseek-chat"
]
}
}
}
}
- Anthropic 장애 시 OpenAI로 전환
- OpenAI 불능 시 Google로 이관
- 마지막으로 DeepSeek이 최후 보루 역할 수행
- 단일 공급자 의존도 제거로 가용성 극대화
CLI를 통한 설정 방법
# 기본 모델 설정
openclaw config set agents.defaults.model.primary "anthropic/claude-opus-4-6"
# jq를 이용해 fallback 목록 수정
cat ~/.openclaw/openclaw.json | \
jq '.agents.defaults.model.fallbacks = [
"openai-codex/gpt-5.3-codex",
"google-antigravity/claude-opus-4-6-thinking"
]' > /tmp/tmp.json && mv /tmp/tmp.json ~/.openclaw/openclaw.json
# 변경 적용을 위해 게이트웨이 재시작
openclaw gateway restart
Fallback 설정 확인
openclaw config get agents.defaults.model
출력 예시:
{
"primary": "anthropic/claude-opus-4-6",
"fallbacks": [
"openai-codex/gpt-5.3-codex",
"google-antigravity/claude-opus-4-6-thinking"
]
}
Fallback 운영 원칙
- 공급자 다양성 확보: Anthropic → OpenAI → Google 순으로 구성 권장. 동일 공급자의 하위 모델만 나열하는 것은 비추천.
- 성능 계층화: 고성능 → 중간 → 저성능 순으로 배치하여 자원 낭비 방지.
- 비용 전략:
- 저비용 → 고비용: 예산 절약 중심
- 고비용 → 저비용: 품질 우선
- 대체 모델 수 제한: 2~3개 권장. 5개 이상은 관리 복잡도 증가.
다중 인증 프로필과 토큰 로테이션
여러 인증 계정을 구성함으로써 요청 제한 회피 및 부하 분산을 실현할 수 있습니다.
기본 인증 구성 구조
{
"auth": {
"profiles": {
"anthropic:account1": {
"provider": "anthropic",
"mode": "token"
},
"anthropic:account2": {
"provider": "anthropic",
"mode": "token"
}
},
"order": {
"anthropic": [
"anthropic:account1",
"anthropic:account2"
]
}
}
}
profiles: 모든 인증 항목 정의. 형식은공급자:식별자.mode:oauth또는token중 선택.order: 요청 시 사용 순서 지정. 제한 발생 시 다음 계정으로 자동 전환.
사례 1: Anthropic API 키 2중 로테이션
{
"auth": {
"profiles": {
"anthropic:main-key": {
"provider": "anthropic",
"mode": "token"
},
"anthropic:backup-key": {
"provider": "anthropic",
"mode": "token"
}
},
"order": {
"anthropic": [
"anthropic:main-key",
"anthropic:backup-key"
]
}
}
}
동작 흐름:
- main-key로 요청 시작
- 제한 도달 시 backup-key로 전환
- main-key 제한 해제 후 다시 로테이션
사례 2: Google 계정 다중 로그인
{
"auth": {
"profiles": {
"google-antigravity:work@gmail.com": {
"provider": "google-antigravity",
"mode": "oauth",
"email": "work@gmail.com"
},
"google-antigravity:personal@gmail.com": {
"provider": "google-antigravity",
"mode": "oauth"
}
},
"order": {
"google-antigravity": [
"google-antigravity:work@gmail.com",
"google-antigravity:personal@gmail.com"
]
}
}
}
- 3배의 무료 할당량 누적 효과
- 자동 부하 분산으로 트래픽 처리 능력 향상
사례 3: 혼합 인증 방식
{
"auth": {
"profiles": {
"anthropic:oauth-login": { "provider": "anthropic", "mode": "oauth" },
"anthropic:api-token": { "provider": "anthropic", "mode": "token" }
},
"order": {
"anthropic": [ "anthropic:oauth-login", "anthropic:api-token" ]
}
}
}
- OAuth: 개인용, 보안 우선
- Token: API 서버용, 안정성 중심
인증 관리 최적화 가이드라인
- 계정 수: 2~3개 권장. 5개 이상은 관리 곤란.
- 인증 방식:
- OAuth: 보안 강화, 사용자 세션 기반
- Token: 무상태(stateless), 자동화 용이
- 로테이션 순서: 유료 → 무료, 고사양 → 저사양 순으로 배치.
- 모니터링:
# 현재 인증 상태 확인
openclaw config get auth.profiles
# 인증 유효성 검사
openclaw test api
자동 모델 전환 규칙 설정
작업 유형 기반 전환
{
"rules": [
{
"condition": "task.type === 'coding'",
"targetModel": "deepseek-v3"
},
{
"condition": "task.type === 'vision'",
"targetModel": "gemini-3-pro"
},
{
"condition": "task.level === 'advanced'",
"targetModel": "claude-opus-4.6"
},
{
"condition": "default",
"targetModel": "claude-sonnet-4.5"
}
]
}
비용 기반 동적 전환
{
"rules": [
{
"condition": "dailyCost < 10",
"targetModel": "claude-opus-4.6"
},
{
"condition": "dailyCost >= 10",
"targetModel": "claude-sonnet-4.5"
}
]
}