Hive에서 소규모 파일 과다 문제 해결方案

소규모 파일이 야기하는 문제점 HDFS에서 소규모 파일이过多하게 되면 다음과 같은 문제가 발생할 수 있습니다: 네임노드 메모리 부하: HDFS 파일은 데이터 블록과 메타정보(위치, 크기, 분할 정보 등)를 포함합니다. 이 메타정보는 네임노드 메모리에 저장되며, 각 객체당 약 150바이트를 차지합니다. 천만 개의 파일과 블록이 있으면 약 3GB의 메모리를 사용하게 되어 ...

5월 26일 07:34에 게시됨