메뉴 건너뛰기

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.


hive테이블의 물리적인 위치인 HDFS에 여러개의 데이터 파일이 존재할때 한개의 파일로 만들어서 다시 동일한 테이블에 입력하는 hive쿼리는 다음과 같다.

(1번, 2번 모두 가능함)


1. 

set mapreduce.job.running.map.limit=1;

set mapreduce.job.running.reduce.limit=1;

insert overwrite table temp.tb_test select * from temp.tb_test;


2. 

insert overwrite table temp.tb_test select * from temp.tb_test;


를 실행하면 hive에서 실행하면 목적지 테이블에 데이터를 입력할 때 select된 데이터에 한해서 자동으로 merge해서 입력한다.


1번 쿼리를 impala에서 실행하면 set구문이 인식이 안되어 오류가 발생하며 set구문없이  2번 쿼리를 실행하면 파일 개수에는 변함이 잆이 동일한 개수의 파일로  데이터가 overwrite된다.


번호 제목 날짜 조회 수
143 Hive Query Examples from test code (2 of 2) 2014.03.26 11467
142 insert hbase by hive ... error occured after 5 hours..HMaster가 뜨지 않는 장애에 대한 복구 방법 2014.04.29 7256
141 hive 2.0.1 설치및 mariadb로 metastore 설정 2016.06.03 5303
140 Spark에서 Serializable관련 오류및 조치사항 2017.04.21 5039
139 의사분산모드에서 presto설치하기 2014.03.31 3127
138 Hive 사용법 및 쿼리 샘플코드 2013.03.07 3088
137 hue.axes_accessattempt테이블의 username컬럼에 NULL 혹은 space가 들어갈수도 있음. 2021.11.03 3059
136 spark-sql실행시 Caused by: java.lang.NumberFormatException: For input string: "0s" 오류발생시 조치사항 2016.06.09 2877
135 Hive+mysql 설치 및 환경구축하기 file 2013.03.07 2805
134 banana pi에 hive 0.13.1+mysql(metastore)설치 file 2014.09.09 2495
133 Hive java connection 설정 file 2013.04.01 2171
132 VisualVM 1.3.9을 이용한 spark-submit JVM 모니터링을 위한 설정및 spark-submit실행 옵션 2016.10.28 2129
131 Spark 2.1.1 clustering(5대) 설치(YARN기반) 2016.04.22 2069
130 java.lang.RuntimeException: org.apache.hadoop.hive.ql.metadata.HiveException: Hive Runtime Error: Unable to deserialize reduce input key from...오류해결방법 2015.06.16 1984
129 impald에서 idle_query_timeout 와 idle_session_timeout 구분 2021.05.20 1881
128 hive에서 생성된 external table에서 hbase의 table에 값 insert하기 2014.04.11 1826
127 index생성, 삭제, 활용 2014.04.25 1769
126 upsert구현방법(년-월-일 파티션을 기준으로) 및 테스트 script file 2018.07.03 1646
125 FAILED: IllegalStateException Variable substitution depth too large: 40 오류발생시 조치사항 2014.08.19 1601
124 hiverserver2기동시 connection refused가 발생하는 경우 조치방법 2014.05.22 1571
위로