대규모 언어 모델의 사실성 향상 기법: 미세 조정 및 추론 전략
사전 훈련 단계에서 대규모 언어 모델(LLM)이 습득하는 사실 지식은 파편화되어 분포되어 있거나 훈련 데이터의 통계적 편향에 영향을 받기 쉽습니다. 감독 미세 조정(SFT)과 정렬 훈련은 이러한 지식 표현을 재구성하는 데 중요한 기회를 제공합니다. 특정 구조적 제약 하에 파라미터 공간의 지식 분포를 조정함으로써 모델은 더 견고한 사실 관계를 구축하고, 동시에 자 ...
6월 14일 21:27에 게시됨