HBase RowKey 필터링 실패 원인과 해결 방안
HBase 테이블에 총 746건의 데이터가 존재하는 상황에서, Spark으로 처리하기 어려운 알고리즘을 Java로 직접 구현하여 HBase를 조회해야 했다. 성능 향상을 위해 필터를 적극 활용했으나, 예상치 못한 데이터 누락 문제가 발생했다.
초기 RowKey 설계 및 문제 발생
처음에는 시간_주문ID 형태로 RowKey를 구성했다.
RowKey 구조: yyyyMMddHHmm_주문식별자
예시: 201904 ...
6월 1일 16:30에 게시됨