메뉴 건너뛰기

Bigdata, Semantic IoT, Hadoop, NoSQL

Bigdata, Hadoop ecosystem, Semantic IoT등의 프로젝트를 진행중에 습득한 내용을 정리하는 곳입니다.
필요한 분을 위해서 공개하고 있습니다. 문의사항은 gooper@gooper.com로 메일을 보내주세요.


hive Hive 사용법 및 쿼리 샘플코드

구퍼 2013.03.07 17:23 조회 수 : 2991

Hive 사용법 및 쿼리 샘플코드

hive 에서 사용하는 query 정리

지금까지 주로사용하는 것 위주로 정리했으며 지속적으로 업데이트 될 수 있음.

hive 환경구축 안되있는 경우는~

Hive (하이브) 설치 및 환경구축하기

Hive 실행

$ $HIVE_HOME/bin/hive

Hive 종료

hive> exit;

테이블 확인

show tables;

bigmark.csv 파일의 데이터를 저장하는 테이블 "bigmark"을 정의하기

테이블 생성

hive> CREATE TABLE bigmark (id int, mark STRING)

> ROW FORMAT DELIMITED FIELDS TERMINATED BY ','

> LINES TERMINATED BY 'n';

테이블에 파일삽입

hive> LOAD DATA LOCAL INPATH '/home/bigmark/localfiles/bigmark.csv'

> OVERWRITE INTO TABLE bigmark;

파티션 사용하기

테이블 생성

hive> CREATE TABLE big (id INT, bb STRING, ii STRING, gg STRING)

> PARTITIONED BY (ver timestamp)

> ROW FORMAT DELIMITED FIELDS TERMINATED BY ','

> LINES TERMINATED BY ' n';

테이블에 파일삽입

hive> LOAD DATA LOCAL INPATH '/home/bigmark/localfiles/bigmark.csv'

> OVERWRITE INTO TABLE big PARTITION (ver = '2013-01-28 ');

테이블 검색

테이블 구조 확인

hive> DESCRIBE bigmark;

테이블 내용 확인

hive> SELECT * FROM bigmark;

LIKE 식에 의한 검색

hive> SELECT id, mark FROM bigmark

> WHERE mark LIKE '빅마크';

LIKE 식에 의한 검색(파티션이 있을 경우)

hive> SELECT bb, ii, gg FROM big

> WHERE ver='2013-01-28' and gg LIKE '빅%';

LIKE 대신 REGEXP도 가능

번호 제목 글쓴이 날짜 조회 수
10 [Cloudera 6.3.4, Kudu]]Service Monitor에서 사용하는 metric중에 일부를 blacklist로 설정하여 모니터링 정보 수집 제외하는 방법 gooper 2022.07.08 31
9 [CDP7.1.7]Impala Query의 Memory Spilled 양은 ScratchFileUsedBytes값을 누적해서 구할 수 있다. gooper 2022.07.29 29
8 kudu table와 impala(hive) table정보가 틀어져서 테이블을 읽지 못하는 경우(Error Loading Metadata) 조치방법 gooper 2023.11.10 25
7 not leader of this config: current role FOLLOWER 오류 발생시 확인방법 총관리자 2022.01.17 23
6 [impala]insert into db명.table명 select a, b from db명.table명 쿼리 수행시 "Memory limit exceeded: Failed to allocate memory for Parquet page index"오류 조치 방법 gooper 2023.05.31 22
5 임시 테이블에서 데이터를 읽어서 partitioned table에 입력하는 impala SQL문 예시 gooper 2023.11.10 16
4 [CDP7.1.7]impala-shell수행시 간헐적으로 "-k requires a valid kerberos ticket but no valid kerberos ticket found." 오류 gooper 2023.11.16 11
3 [CDP7.1.7, Hive Replication]Hive Replication진행중 "The following columns have types incompatible with the existing columns in their respective positions " 오류 gooper 2023.12.27 7
2 [CDP7.1.7]Oozie job에서 ERROR: Kudu error(s) reported, first error: Timed out: Failed to write batch of 774 ops to tablet 8003f9a064bf4be5890a178439b2ba91가 발생하면서 쿼리가 실패하는 경우 gooper 2024.01.05 7
1 [Impala] alter table구문수행시 "WARNINGS: Impala does not have READ_WRITE access to path 'hdfs://nameservice1/DATA/Temp/DB/source/table01_ccd'" 발생시 조치 gooper 2024.04.26 0

A personal place to organize information learned during the development of such Hadoop, Hive, Hbase, Semantic IoT, etc.
We are open to the required minutes. Please send inquiries to gooper@gooper.com.

위로