RRF와 Cross-Encoder 재정렬 구현 방법
RRF(Reciprocal Rank Fusion)
다중 검색기(BM25, 임베딩 등)의 결과를 통합할 때 점수 척도가 달라 발생하는 문제를 해결합니다.
RRF 알고리즘 핵심
순위 기반 점수 계산 공식:
document_score = ∑(1 / (k + rank_position))
k는 일반적으로 60으로 설정하며, 상위 순위 문서에 가중치를 부여합니다.
Python 구현 예제
from collections import defaultdict
def combine_r ...
6월 14일 18:20에 게시됨