Bigdata, Hadoop ecosystem, Semantic IoT등의 프로젝트를 진행중에 습득한 내용을 정리하는 곳입니다.
필요한 분을 위해서 공개하고 있습니다.
문의사항은 gooper@gooper.com로 메일을
보내주세요.
impala테이블이 어떤 형태인지에 따라 다음과 같이 2가지 방법으로 수행할 수 있다.
특히 parquet형식의 테이블인 경우 set num_nodes=1을 먼저 수행해주면 여러개의 fragment로 수행하지 않고 1개의 fragment로 수행되며 지정하지 않으면 병렬 처리를 위해서 가능한한 1개 이상의 fragment로 나뉘어서 수행된다.
1개의 노드에서만 처리할때 파일 사이즈가 많이 크면 OOM을 유발할 수 있으니 주의해야 한다.
1. text형식의 hdfs파일에 대한 테이블인 경우 : insert overwrite table 테이블명 select * from 테이블명;
2. parquet형식의 hdfs파일에 대한 테이블인 경우 : set num_nodes=1; insert overwrite table 테이블명 select * from 테이블명;
*참고
-- OVERWRITE가 붙으면 해당 위치의 내용을 삭제하고 덮어 쓴다.
INSERT OVERWRITE TABLE target PARTITION(col1 = 'a', col2)
SELECT data1,
date2
FROM source;
댓글 0
번호 | 제목 | 글쓴이 | 날짜 | 조회 수 |
---|---|---|---|---|
60 | access=WRITE, inode="staging":ubuntu:supergroup:rwxr-xr-x 오류 | 총관리자 | 2014.07.05 | 1719 |
59 | org.apache.hadoop.security.AccessControlException: Permission denied: user=hadoop, access=WRITE, inode="":root:supergroup:rwxr-xr-x 오류 처리방법 | 총관리자 | 2014.07.05 | 2835 |
58 | banana pi에(lubuntu)에 hadoop설치하고 테스트하기 - 성공 | 총관리자 | 2014.07.05 | 2760 |
57 | 2개 data를 join하고 마지막으로 code정보를 join하여 결과를 얻는 mr 프로그램 | 총관리자 | 2014.06.30 | 408 |
56 | Cannot create /var/run/oozie/oozie.pid: Directory nonexistent오류 | 총관리자 | 2014.06.03 | 479 |
55 | oozie job 구동시 JA009: User: hadoop is not allowed to impersonate hadoop 오류나는 경우 | 총관리자 | 2014.06.02 | 807 |
54 | hadoop및 ecosystem에서 사용되는 명령문 정리 | 총관리자 | 2014.05.28 | 3456 |
53 | hive job실행시 meta정보를 원격의 mysql에 저장하는 경우 설정방법 | 총관리자 | 2014.05.28 | 1088 |
52 | oozie의 meta정보를 mysql에서 관리하기 | 총관리자 | 2014.05.26 | 1466 |
51 | hive query에서 mapreduce돌리지 않고 select하는 방법 | 총관리자 | 2014.05.23 | 811 |
50 | hiverserver2기동시 connection refused가 발생하는 경우 조치방법 | 총관리자 | 2014.05.22 | 1472 |
49 | import 혹은 export할때 hive파일의 default 구분자는 --input-fields-terminated-by " |