메뉴 건너뛰기

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.


hive테이블의 물리적인 위치인 HDFS에 여러개의 데이터 파일이 존재할때 한개의 파일로 만들어서 다시 동일한 테이블에 입력하는 hive쿼리는 다음과 같다.

(1번, 2번 모두 가능함)


1. 

set mapreduce.job.running.map.limit=1;

set mapreduce.job.running.reduce.limit=1;

insert overwrite table temp.tb_test select * from temp.tb_test;


2. 

insert overwrite table temp.tb_test select * from temp.tb_test;


를 실행하면 hive에서 실행하면 목적지 테이블에 데이터를 입력할 때 select된 데이터에 한해서 자동으로 merge해서 입력한다.


1번 쿼리를 impala에서 실행하면 set구문이 인식이 안되어 오류가 발생하며 set구문없이  2번 쿼리를 실행하면 파일 개수에는 변함이 잆이 동일한 개수의 파일로  데이터가 overwrite된다.


번호 제목 날짜 조회 수
670 uEnv.txt위치및 내용 2014.07.09 2829
669 oozie 에서 sqoop action실행 에러 - 컬럼개수 차이 2014.07.17 3441
668 lubuntu 호스트 네임변경 2014.08.03 3372
667 데이타 제공 사이트 링크 2014.08.03 3875
666 외부 기기(usb, 하드)등 mount(연결)하기 2014.08.03 3212
665 원보드 컴퓨터 비교표 file 2014.08.04 3526
664 FAILED: IllegalStateException Variable substitution depth too large: 40 오류발생시 조치사항 2014.08.19 4678
663 시스템날짜를 현재 정보로 동기화 하는 방법(rdate, ntpdate이용) 2014.08.24 4297
662 hadoop의 data디렉토리를 변경하는 방법 2014.08.24 4182
661 java.util.NoSuchElementException발생시 조치 2014.08.27 4232
660 sqoop작업시 hdfs의 개수보다 더많은 값이 중복되어 oracle에 입력되는 경우가 있음 2014.09.02 6936
659 원격지에서 zio공유기를 통해서 노트북의 mysql접속을 허용하는 방법 2014.09.07 4408
658 banana pi에 hive 0.13.1+mysql(metastore)설치 file 2014.09.09 4858
657 apt-get install mysql-server수행시 "404 Not Found" 오류발생시 조치방법 2014.09.10 4462
656 mysql 5.5.34-0ubuntu0.13.04용 설치/진행 화면 2014.09.10 9981
655 root가 localhost에서 mysql로 접근하지 못하는 경우의 해결방법(패스워드) 2014.09.10 4618
654 lateral view 예제 2014.09.18 3905
653 하둡 분산 파일 시스템을 기반으로 색인하고 검색하기 2014.09.25 3350
652 hadoop 기반 문서 검색 2014.09.25 3285
651 호튼웍스 하둡을 검색엔진과 연동하는 방법과 아키텍쳐 2014.09.25 3657
위로