Bigdata, Hadoop ecosystem, Semantic IoT등의 프로젝트를 진행중에 습득한 내용을 정리하는 곳입니다.
필요한 분을 위해서 공개하고 있습니다.
문의사항은 gooper@gooper.com로 메일을
보내주세요.
impala [Impala 3.2버젼]compute incremental stats db명.테이블명 수행시 ERROR: AnalysisException: Incremental stats size estimate exceeds 2000.00MB. 오류 발생원인및 조치방안
compute incremental stats db명.테이블명 수행시 밞생하는 오류 "ERROR: AnalysisException: Incremental stats size estimate exceeds 2000.00MB."는
inc_stats_size_limit_bytes(default 200Mb)를 초과하여 발생하는 오류입니다.
inc_stats_size_limit_bytes는 table metadata를 update하다가 out of memory가 발생하는 것을 방지하기 위한 값입니다.
아래의 계산식으로 현재 값을 계산할 수 있습니다.
(예, 파티션개수 :1795, 컬럼수 : 588인경우 약 201.3MB가 산출됨)
값을 변경 적용하기 전에 우선 고려할 수 있는 방안은 다음과 같습니다.
1. compute stats방식으로 통계정보 생성
2. 파티션을 줄이기 줄이기(예, 일단위->월단위)
3. 데이터를 삭제하여 물리적인 파티션의 개수를 줄임.
4. table을 여러개로 나누어 테이블당 파티션 개수를 줄임.
*참고
1. 기본 계산식 : 200 bytes * 컬럼수 * 피티션수
2. inc_stats_size_limit_byte값을 변경하면 heap usage에 spike가 발생되어 impala가 crash될 수 있음
3. inc_stats_size_limit_byte변경하려면 impala catalogd및 impalad를 같이 변경해줘야 합니다.
댓글 0
번호 | 제목 | 글쓴이 | 날짜 | 조회 수 |
---|---|---|---|---|
400 | insert hbase by hive ... error occured after 5 hours..HMaster가 뜨지 않는 장애에 대한 복구 방법 | 총관리자 | 2014.04.29 | 7129 |
399 | oozie가 말하는 start시간은..서버에서 확인되는 시간이 아닙니다. | 총관리자 | 2014.05.14 | 699 |
398 | sqoop export/import등을 할때 driver를 못찾는 오류가 발생하면... | 총관리자 | 2014.05.15 | 867 |
397 | sqoop에서 oracle관련 작업할때 테이블명, 사용자명, DB명은 모두 대문자로 사용할것 | 총관리자 | 2014.05.15 | 1528 |
396 | dual table만들기 | 총관리자 | 2014.05.16 | 825 |
395 | 특정파일이 생성되어야 action이 실행되는 oozie job만들기(coordinator.xml) | 총관리자 | 2014.05.20 | 984 |
394 | source의 type을 spooldir로 하는 경우 해당 경로에 파일이 들어오면 파일단위로 전송함 | 총관리자 | 2014.05.20 | 687 |
393 | hive에서 insert overwrite directory.. 로 하면 default column구분자는 'SOH'혹은 't'가 됨 | 총관리자 | 2014.05.20 | 999 |
392 | import 혹은 export할때 hive파일의 default 구분자는 --input-fields-terminated-by " |