메뉴 건너뛰기

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.


compute incremental stats db명.테이블명 수행시 밞생하는 오류 "ERROR: AnalysisException: Incremental stats size estimate exceeds 2000.00MB."는

inc_stats_size_limit_bytes(default 200Mb)를 초과하여 발생하는 오류입니다. 

inc_stats_size_limit_bytes는 table metadata를 update하다가 out of memory가 발생하는 것을 방지하기 위한 값입니다. 

아래의 계산식으로 현재 값을 계산할 수 있습니다. 

(예, 파티션개수 :1795, 컬럼수 : 588인경우 약 201.3MB가 산출됨)

값을 변경 적용하기 전에 우선 고려할 수 있는 방안은 다음과 같습니다.


1. compute stats방식으로 통계정보 생성

2. 파티션을 줄이기 줄이기(예, 일단위->월단위)

3. 데이터를 삭제하여 물리적인 파티션의 개수를 줄임.

4. table을 여러개로 나누어 테이블당 파티션 개수를 줄임.


*참고 

1. 기본 계산식 : 200 bytes * 컬럼수 * 피티션수

2. inc_stats_size_limit_byte값을 변경하면 heap usage에 spike가 발생되어 impala가 crash될 수 있음

3. inc_stats_size_limit_byte변경하려면 impala catalogd및 impalad를 같이 변경해줘야 합니다. 


번호 제목 날짜 조회 수
67 CDH 5.4.4 버전에서 hive on tez (0.7.0)설치하기 2016.01.14 3370
66 Cloudera가 사용하는 서비스별 디렉토리 2018.03.29 3357
65 kafka 0.9.0.1버젼의 producer와 kafka버젼이 0.10.0.1인 consumer가 서로 대화하는 모습 2016.08.18 3357
64 hadoop에서 yarn jar ..를 이용하여 appliction을 실행하여 정상적으로 수행되었으나 yarn UI의 어플리케이션 목록에 나타나지 않는 문제 2017.05.02 3336
63 [kerberos]Kerberos HA구성 참고 페이지 2022.08.31 3326
62 oozie job 구동시 JA009: User: hadoop is not allowed to impersonate hadoop 오류나는 경우 2014.06.02 3306
61 ./spark-sql 실행시 "java.lang.NumberFormatException: For input string: "1s"오류발생시 조치사항 2016.06.09 3304
60 Cleaning up the staging area file시 'cannot access' 혹은 'Directory is not writable' 발생시 조치사항 2017.05.02 3292
59 Could not compute split, block input-0-1517397051800 not found형태의 오류가 발생시 조치방법 2018.02.01 3290
58 bin/cassandra -f -R로 startup할때 NullPointerException오류가 나면 조치할 내용 2016.04.14 3286
57 JAVA_HOME을 명시적으로 지정하는 방법 2018.06.04 3285
56 impala,hive및 hdfs만 접근가능하고 파일을 이용한 테이블생성가능하도록 hue 권한설정설정 2018.09.17 3274
55 spark2.0.0에서 hive 2.0.1 table을 읽어 출력하는 예제 소스(HiveContext, SparkSession, SQLContext) 2017.03.09 3255
54 hadoop클러스터를 구성하던 서버중 HA를 담당하는 서버의 hostname등이 변경되어 문제가 발생했을때 조치사항 2016.07.29 3254
53 [hive] hive.tbls테이블의 owner컬럼값은 hadoop.security.auth_to_local에 의해서 filtering된다. 2022.04.14 3252
52 Hue Job Browser의 Queries탭에서 조건을 지정하는 방법 2018.05.10 3207
51 ./hadoop-daemon.sh start namenode로 namenode기동시 EditLog의 custerId, namespaceId가 달라서 발생하는 오류 해결방법 2016.09.24 3172
50 HBase 설정 최적화하기(VCNC) file 2017.07.18 3167
49 HDFS Balancer설정및 수행 2018.03.21 3166
48 hue메타 정보를 저장(oracle DB)하는 내부 테이블을 이용하여 전체 테이블목록, 전체 코디네이터 목록, 코디네이터기준 workflow구조를 추출하는 쿼리문 2022.04.01 3154
위로