data_analysis:sql:impala_performance

Impala 성능개선 포인트

  • Partitioned 테이블의 경우, 파티션 조건 설정
  • 통계 정보 생성
    • Non-Partitioned 경우
 COMPUTE STATS [TABLE];
  • Partitioned 경우
 COMPUTE INCREMENTAL STATS [TABLE] PARTITION(파티션정보);
  • Not in 대신 EXISTS 사용 : Exists 는 T/F만 Return
  • like, or 은 CPU 리소스를 많이 사용
  • Join 시 큰테이블부터 작은 테이블 순으로 : 뒤에 오는 테이블이 메모리에 올라감
A LEFT OUTER JOIN B 
--대신 
B RIGHT OUTER JOIN A
  • 불필요한 order by 사용 X
Enter your comment. Wiki syntax is allowed:
M F T W D
 
  • data_analysis/sql/impala_performance.txt
  • Last modified: 2025/07/07 14:12
  • by 127.0.0.1