Wildberries는 2004년 타티아나 바카르추크에 의해 설립된 러시아 최대의 전자상거래 플랫폼입니다. 본사는 모스크바에 위치해 있습니다:
- 시장 규모: 일일 주문 수 450만 건 이상, 등록 사용자 5천만 명 이상, 상품 종류 2천만 개 이상
- 시장 점유율: 러시아 전자상거래 시장의 약 47%, 두 번째로 큰 Ozon (34.4%)을 크게 앞서고 있음
- 서비스 지역: 주로 러시아, 벨라루스, 카자흐스탄 등 18개국에서 서비스 제공
데이터 수집 핵심 방법
1️⃣ 공식 API - 가장 권장되는 방안
장점: 법적 안전성, 데이터 완전성, 안정성, 대량 처리 지원
- API 토큰 획득:
- 판매자 센터 (seller.wildberries.ru) 로그인
- 계정 → "설정" → "API 접근"
- "토큰 생성" 클릭 후 이름 지정 및 권한 선택
- 생성된 토큰 복사 (단 한 번만 표시됨, 유효기간 6개월)
- API 기본 사용 예제:
import requests
api_key = "your_api_key"
headers = {"Authorization": f"Bearer {api_key}"}
endpoint = "https://suppliers-api.wildberries.ru/api/v1/orders"
response = requests.get(endpoint, headers=headers)
data = response.json()
- 핵심 API 엔드포인트:
- 상품 카탈로그: /api/v1/catalog
- 주문 관리: /api/v1/orders
- 판매 분석: /api/v1/analytics
- 검색 데이터: /api/v1/search
- 리뷰 분석: /api/v1/reviews
2️⃣ 내장 데이터 도구 - 무료이며 사용하기 쉬움
판매자 대시보드는 다양한 보고서를 제공합니다:
- 검색 분석: 키워드 인기도, 트렌드 확인, 주문 상위 키워드 추적
- 플랫폼 분석: 카테고리 수요, 재고 회전율, 회전 일수 표시
- 판매 파이프라인: 전환율, 장바구니 추가율, 주문 취소율 표시
- 상품 비교: 상품 성능, 구매 전환율, 실제 거래율 분석
작업 경로: 판매자 센터 → "보고서" 또는 "분석" 섹션 → 해당 보고서 선택 → Excel 다운로드
3️⃣ 제3자 데이터 수집 도구
비판매자 또는 더 유연한 데이터 수집이 필요한 경우에 적합:
| 도구 유형 | 대표 제품 | 특징 | 사용 방법 |
|---|---|---|---|
| 브라우저 확장 프로그램 | Seerfar, StoreMaster | 페이지 상품 정보 즉시 수집 | 목표 상품 페이지에서 확장 프로그램 버튼 클릭 |
| ERP 통합 | Magic ERP, EasyStoreManager | 대량 수집, 업로드, 관리 | 스토어 권한 부여 후 상품 링크 복사하여 수집 |
| 전문 크롤러 | Bright Data, RealData API | 대규모 데이터 수집, 구조화 출력 | API 호출 또는 URL 리스트 업로드 |
| 커스텀 스크립트 | Python/JavaScript 스크립트 | 고도의 맞춤형, 유연성 | 코드 작성으로 API 호출 또는 페이지 파싱 |
수집 가능한 데이터 유형
1️⃣ 상품 데이터 (중요 가치)
- 기본 정보: 이름, SKU, 브랜드, 카테고리, 설명
- 가격 정보: 정가, 할인가, 프로모션 정보
- 재고 상태: 이용 가능 수량, 발송 시간
- 평가 데이터: 평점, 리뷰 수, 긍정률
- 판매 데이터: 판매량, 전환율, 장바구니 추가 횟수
- 이미지 및 동영상 자료
2️⃣ 스토어 데이터
- 기본 정보: 이름, 평점, 팬 수, 주요 카테고리
- 운영 데이터: 주문량, 매출, 반품률
- 상품 구조: 인기 카테고리, 가격대 분포
3️⃣ 시장 및 경쟁 데이터
- 카테고리 판매 순위, 인기 상품 TOP 차트
- 키워드 검색량 및 트렌드
- 경쟁사 가격 모니터링, 프로모션 분석
- 소비자 행동 데이터 (검색 습관, 구매 경로)
데이터 수집 단계
1️⃣ 수집 목표 설정
- 상품 분석: 인기 카테고리, 가격대, 평가 데이터 수집
- 경쟁 모니터링: 경쟁사 가격, 재고, 프로모션 추적
- 시장 통찰력: 검색량, 카테고리 트렌드, 소비자 선호도 분석
- 스토어 최적화: 자체 상품 성능 평가, 가격 전략 최적화
2️⃣ 적절한 수집 방안 선택
plaintext
플랫폼 판매자?
├── 예 → 공식 API + 내장 데이터 도구(권장)
└── 아니오 → 제3자 도구 또는 크롤러(준법 준수 필요)
3️⃣ 실행 과정 (API 사용 예)
단계 1: 권한 획득
- API 토큰 신청 및 저장 (단 한 번만 표시됨)
- 요청 헤더 설정:
Authorization: Bearer <token>
단계 2: 데이터 수집 전략
- 카테고리별로 배치 처리 (단일 요청 크기를 줄임)
- 요청 빈도 조절 (판매 데이터는 61초 간격, 파이프라인 데이터는 21초)
- 페이지네이션 처리 (limit=100, offset=0,100,200...)
단계 3: 데이터 저장 및 처리
- JSON/CSV/Excel 형식으로 저장
- 이력 데이터 저장용 데이터베이스 테이블 구조 생성
- BI 도구 (예: Google Sheets, Tableau) 활용하여 데이터 시각화
주의사항
1️⃣ 준법성 (중요)
- 공개된 데이터만 수집, 개인 정보는 수집하지 않음
- 플랫폼 규칙 준수, 접근 제한 우회 금지
- 러시아 데이터 보호 규정 준수 (개인 데이터는 해외 저장 금지)
- 상업적 사용 시 적법한 권한 확보 필수
2️⃣ 크롤링 방지 대응
- 러시아 현지 IP 사용 (성공률 89% 향상)
- 요청 간격 무작위화 (고정 주기 피함)
- 실제 사용자 행동 시뮬레이션 (적절한 지연 추가)
- 고익명 프록시 또는 주택 IP 사용 (계정 차단 위험 감소)
3️⃣ 데이터 품질 향상
- 데이터 완전성 검증 (필수 필드 확인)
- 중복 데이터 제거
- 이상값 검출 (예: 시장과 크게 벗어난 가격)
- 데이터 업데이트 전략 (정기적으로 새로고침하여 최신 유지)