메뉴 건너뛰기

Bigdata, Semantic IoT, Hadoop, NoSQL

Bigdata, Hadoop ecosystem, Semantic IoT등의 프로젝트를 진행중에 습득한 내용을 정리하는 곳입니다.
필요한 분을 위해서 공개하고 있습니다. 문의사항은 gooper@gooper.com로 메일을 보내주세요.


compute incremental stats db명.테이블명 수행시 밞생하는 오류 "ERROR: AnalysisException: Incremental stats size estimate exceeds 2000.00MB."는

inc_stats_size_limit_bytes(default 200Mb)를 초과하여 발생하는 오류입니다. 

inc_stats_size_limit_bytes는 table metadata를 update하다가 out of memory가 발생하는 것을 방지하기 위한 값입니다. 

아래의 계산식으로 현재 값을 계산할 수 있습니다. 

(예, 파티션개수 :1795, 컬럼수 : 588인경우 약 201.3MB가 산출됨)

값을 변경 적용하기 전에 우선 고려할 수 있는 방안은 다음과 같습니다.


1. compute stats방식으로 통계정보 생성

2. 파티션을 줄이기 줄이기(예, 일단위->월단위)

3. 데이터를 삭제하여 물리적인 파티션의 개수를 줄임.

4. table을 여러개로 나누어 테이블당 파티션 개수를 줄임.


*참고 

1. 기본 계산식 : 200 bytes * 컬럼수 * 피티션수

2. inc_stats_size_limit_byte값을 변경하면 heap usage에 spike가 발생되어 impala가 crash될 수 있음

3. inc_stats_size_limit_byte변경하려면 impala catalogd및 impalad를 같이 변경해줘야 합니다. 


번호 제목 글쓴이 날짜 조회 수
701 이클립스에서 생성한 jar 파일 hadoop 으로 실행하기 file 구퍼 2013.03.06 2836
700 org.apache.hadoop.security.AccessControlException: Permission denied: user=hadoop, access=WRITE, inode="":root:supergroup:rwxr-xr-x 오류 처리방법 총관리자 2014.07.05 2835
699 spark-sql실행시 Caused by: java.lang.NumberFormatException: For input string: "0s" 오류발생시 조치사항 총관리자 2016.06.09 2802
698 banana pi에(lubuntu)에 hadoop설치하고 테스트하기 - 성공 file 총관리자 2014.07.05 2760
697 protege 설명및 사용법 file 총관리자 2017.04.04 2750
696 Hive+mysql 설치 및 환경구축하기 file 구퍼 2013.03.07 2722
695 mysql-server 기동시 Do you already have another mysqld server running on port 오류 발생할때 확인및 조치방법 총관리자 2017.05.14 2671
694 org.apache.hadoop.hbase.PleaseHoldException: Master is initializing 구퍼 2013.03.15 2668
693 HBase 설치하기 – Pseudo-distributed file 구퍼 2013.03.12 2644
692 hadoop 설치(3대) file 구퍼 2013.03.07 2613
691 HBase, BigTable, Cassandra Schema Design file 구퍼 2013.03.15 2509
690 hbase shell에서 컬럼값 검색하기(SingleColumnValueFilter이용) 총관리자 2014.04.25 2448
689 banana pi에 hive 0.13.1+mysql(metastore)설치 file 총관리자 2014.09.09 2406
688 Cacti로 Hadoop 모니터링 하기 file 구퍼 2013.03.12 2367
687 AIX 7.1에 MariaDB 10.2 소스 설치 총관리자 2016.09.24 2366
686 jupyter, zeppelin, rstudio를 이용하여 spark cluster에 job를 실행시키기 위한 정보 총관리자 2018.04.13 2335
685 kafka broker기동시 brokerId가 달라서 기동에 실패하는 경우 조치방법 총관리자 2016.05.02 2332
684 hadoop설치시 오류 총관리자 2013.12.18 2313
683 메이븐 (maven) 설치 및 이클립스 연동하기 file 구퍼 2013.03.06 2280
682 apk 파일 위치 file 총관리자 2015.05.25 2227

A personal place to organize information learned during the development of such Hadoop, Hive, Hbase, Semantic IoT, etc.
We are open to the required minutes. Please send inquiries to gooper@gooper.com.

위로