OpenClaw에서 다중 모델 전환 및 인증 관리 전략

주요 LLM 모델 특징 비교

모델 장점 단점 적합한 사용 사례
Claude Sonnet 안정적인 성능, 균형 잡힌 응답 속도 비용 중간 수준 일상 대화, 일반 질의응답
Claude Opus 최고 수준의 추론 능력 가장 높은 가격대 복잡한 분석, 전략 수립
GPT-5.2 다양한 기능과 확장성 응답 지연 발생 가능 창작, 콘텐츠 생성
Gemini 3 Pro 무료 할당량 풍부, 멀티모달 지원 복잡한 작업 처리에 한계 이미지 인식, 간단한 질의
DeepSeek-V3 높은 비용 효율성, 중국어 최적화 영문 컨텍스트 약점 코드 생성, 프로그래밍 보조

사용 시나리오 기반 모델 선택 전략

  • 일상적인 상호작용: Claude Sonnet 4.5 권장 — 반응 속도와 안정성, 적절한 가격의 조합.
  • 고난이도 문제 해결: Claude Opus 4.6 사용 — 정교한 논리 구조와 높은 정확도 요구 시 최적.
  • 이미지 기반 인식: Gemini 3 Pro 선택 — 멀티모달 처리 능력과 무료 리소스 활용.
  • 개발 및 코드 작업: DeepSeek-V3 채택 — 코드 이해도 우수, 한국어/중국어 친화적 출력.

모델 장애 대응(Fallback) 메커니즘

기본 모델(primary)이 다음 상황에서 실패할 경우, 시스템은 자동으로 대체 모델(fallback)로 전환합니다:

  • API 호출 오류
  • 시간 초과(timeout)
  • 속도 제한(rate limit)
  • 서비스 다운

기본 Fallback 설정 예시

~/.openclaw/openclaw.json 파일 내 구성:

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-opus-4-6",
        "fallbacks": [
          "openai-codex/gpt-5.3-codex",
          "google-antigravity/claude-opus-4-6-thinking"
        ]
      }
    }
  }
}

전환 순서는 다음과 같습니다:

  1. 기본 모델 실행 시도
  2. 실패 시 첫 번째 대체 모델로 전환
  3. 계속 실패 시 두 번째 대체 모델로 이행
  4. 모든 모델 실패 시 에러 반환

사례 1: 비용 최적화 중심 Fallback

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "deepseek/deepseek-chat",
        "fallbacks": [
          "anthropic/claude-sonnet-4-5",
          "anthropic/claude-opus-4-6"
        ]
      }
    }
  }
}
  • 기본적으로 저비용인 DeepSeek 사용
  • 제한에 걸릴 경우 Sonnet으로 전환
  • 최종적으로 Opus로 품질 보장
  • 비용 평균 80% 이상 절감 가능

사례 2: 성능 우선 전략

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-opus-4-6",
        "fallbacks": [
          "anthropic/claude-sonnet-4-5",
          "deepseek/deepseek-chat"
        ]
      }
    }
  }
}
  • 최고 성능 유지
  • 트래픽 피크 시 단계적 강도 낮춤
  • 서비스 연속성 보장

사례 3: 공급자 다변화 전략

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-sonnet-4-5",
        "fallbacks": [
          "openai/gpt-4o",
          "google/gemini-2.0-flash-exp",
          "deepseek/deepseek-chat"
        ]
      }
    }
  }
}
  • Anthropic 장애 시 OpenAI로 전환
  • OpenAI 불능 시 Google로 이관
  • 마지막으로 DeepSeek이 최후 보루 역할 수행
  • 단일 공급자 의존도 제거로 가용성 극대화

CLI를 통한 설정 방법

# 기본 모델 설정
openclaw config set agents.defaults.model.primary "anthropic/claude-opus-4-6"

# jq를 이용해 fallback 목록 수정
cat ~/.openclaw/openclaw.json | \
  jq '.agents.defaults.model.fallbacks = [
    "openai-codex/gpt-5.3-codex",
    "google-antigravity/claude-opus-4-6-thinking"
  ]' > /tmp/tmp.json && mv /tmp/tmp.json ~/.openclaw/openclaw.json

# 변경 적용을 위해 게이트웨이 재시작
openclaw gateway restart

Fallback 설정 확인

openclaw config get agents.defaults.model

출력 예시:

{
  "primary": "anthropic/claude-opus-4-6",
  "fallbacks": [
    "openai-codex/gpt-5.3-codex",
    "google-antigravity/claude-opus-4-6-thinking"
  ]
}

Fallback 운영 원칙

  • 공급자 다양성 확보: Anthropic → OpenAI → Google 순으로 구성 권장. 동일 공급자의 하위 모델만 나열하는 것은 비추천.
  • 성능 계층화: 고성능 → 중간 → 저성능 순으로 배치하여 자원 낭비 방지.
  • 비용 전략:
    • 저비용 → 고비용: 예산 절약 중심
    • 고비용 → 저비용: 품질 우선
  • 대체 모델 수 제한: 2~3개 권장. 5개 이상은 관리 복잡도 증가.

다중 인증 프로필과 토큰 로테이션

여러 인증 계정을 구성함으로써 요청 제한 회피 및 부하 분산을 실현할 수 있습니다.

기본 인증 구성 구조

{
  "auth": {
    "profiles": {
      "anthropic:account1": {
        "provider": "anthropic",
        "mode": "token"
      },
      "anthropic:account2": {
        "provider": "anthropic",
        "mode": "token"
      }
    },
    "order": {
      "anthropic": [
        "anthropic:account1",
        "anthropic:account2"
      ]
    }
  }
}
  • profiles: 모든 인증 항목 정의. 형식은 공급자:식별자.
  • mode: oauth 또는 token 중 선택.
  • order: 요청 시 사용 순서 지정. 제한 발생 시 다음 계정으로 자동 전환.

사례 1: Anthropic API 키 2중 로테이션

{
  "auth": {
    "profiles": {
      "anthropic:main-key": {
        "provider": "anthropic",
        "mode": "token"
      },
      "anthropic:backup-key": {
        "provider": "anthropic",
        "mode": "token"
      }
    },
    "order": {
      "anthropic": [
        "anthropic:main-key",
        "anthropic:backup-key"
      ]
    }
  }
}

동작 흐름:

  1. main-key로 요청 시작
  2. 제한 도달 시 backup-key로 전환
  3. main-key 제한 해제 후 다시 로테이션

사례 2: Google 계정 다중 로그인

{
  "auth": {
    "profiles": {
      "google-antigravity:work@gmail.com": {
        "provider": "google-antigravity",
        "mode": "oauth",
        "email": "work@gmail.com"
      },
      "google-antigravity:personal@gmail.com": {
        "provider": "google-antigravity",
        "mode": "oauth"
      }
    },
    "order": {
      "google-antigravity": [
        "google-antigravity:work@gmail.com",
        "google-antigravity:personal@gmail.com"
      ]
    }
  }
}
  • 3배의 무료 할당량 누적 효과
  • 자동 부하 분산으로 트래픽 처리 능력 향상

사례 3: 혼합 인증 방식

{
  "auth": {
    "profiles": {
      "anthropic:oauth-login": { "provider": "anthropic", "mode": "oauth" },
      "anthropic:api-token": { "provider": "anthropic", "mode": "token" }
    },
    "order": {
      "anthropic": [ "anthropic:oauth-login", "anthropic:api-token" ]
    }
  }
}
  • OAuth: 개인용, 보안 우선
  • Token: API 서버용, 안정성 중심

인증 관리 최적화 가이드라인

  • 계정 수: 2~3개 권장. 5개 이상은 관리 곤란.
  • 인증 방식:
    • OAuth: 보안 강화, 사용자 세션 기반
    • Token: 무상태(stateless), 자동화 용이
  • 로테이션 순서: 유료 → 무료, 고사양 → 저사양 순으로 배치.
  • 모니터링:
# 현재 인증 상태 확인
openclaw config get auth.profiles

# 인증 유효성 검사
openclaw test api

자동 모델 전환 규칙 설정

작업 유형 기반 전환

{
  "rules": [
    {
      "condition": "task.type === 'coding'",
      "targetModel": "deepseek-v3"
    },
    {
      "condition": "task.type === 'vision'",
      "targetModel": "gemini-3-pro"
    },
    {
      "condition": "task.level === 'advanced'",
      "targetModel": "claude-opus-4.6"
    },
    {
      "condition": "default",
      "targetModel": "claude-sonnet-4.5"
    }
  ]
}

비용 기반 동적 전환

{
  "rules": [
    {
      "condition": "dailyCost < 10",
      "targetModel": "claude-opus-4.6"
    },
    {
      "condition": "dailyCost >= 10",
      "targetModel": "claude-sonnet-4.5"
    }
  ]
}

태그: OpenClaw LLM Fallback 모델전환 다중인증

5월 28일 01:52에 게시됨