메뉴 건너뛰기

Bigdata, Semantic IoT, Hadoop, NoSQL

Bigdata, Hadoop ecosystem, Semantic IoT등의 프로젝트를 진행중에 습득한 내용을 정리하는 곳입니다.
필요한 분을 위해서 공개하고 있습니다. 문의사항은 gooper@gooper.com로 메일을 보내주세요.


hive Hive 사용법 및 쿼리 샘플코드

구퍼 2013.03.07 17:23 조회 수 : 2991

Hive 사용법 및 쿼리 샘플코드

hive 에서 사용하는 query 정리

지금까지 주로사용하는 것 위주로 정리했으며 지속적으로 업데이트 될 수 있음.

hive 환경구축 안되있는 경우는~

Hive (하이브) 설치 및 환경구축하기

Hive 실행

$ $HIVE_HOME/bin/hive

Hive 종료

hive> exit;

테이블 확인

show tables;

bigmark.csv 파일의 데이터를 저장하는 테이블 "bigmark"을 정의하기

테이블 생성

hive> CREATE TABLE bigmark (id int, mark STRING)

> ROW FORMAT DELIMITED FIELDS TERMINATED BY ','

> LINES TERMINATED BY 'n';

테이블에 파일삽입

hive> LOAD DATA LOCAL INPATH '/home/bigmark/localfiles/bigmark.csv'

> OVERWRITE INTO TABLE bigmark;

파티션 사용하기

테이블 생성

hive> CREATE TABLE big (id INT, bb STRING, ii STRING, gg STRING)

> PARTITIONED BY (ver timestamp)

> ROW FORMAT DELIMITED FIELDS TERMINATED BY ','

> LINES TERMINATED BY ' n';

테이블에 파일삽입

hive> LOAD DATA LOCAL INPATH '/home/bigmark/localfiles/bigmark.csv'

> OVERWRITE INTO TABLE big PARTITION (ver = '2013-01-28 ');

테이블 검색

테이블 구조 확인

hive> DESCRIBE bigmark;

테이블 내용 확인

hive> SELECT * FROM bigmark;

LIKE 식에 의한 검색

hive> SELECT id, mark FROM bigmark

> WHERE mark LIKE '빅마크';

LIKE 식에 의한 검색(파티션이 있을 경우)

hive> SELECT bb, ii, gg FROM big

> WHERE ver='2013-01-28' and gg LIKE '빅%';

LIKE 대신 REGEXP도 가능

번호 제목 글쓴이 날짜 조회 수
80 [Kerberos인증] /var/log/krb5kdc.log파일 기준으로 인증요청(AS), 티켓확인(TGS)이 진행되는 로그 기록 gooper 2022.09.21 36
79 [vi] test.nq파일에서 특정문자열(예, <>)을 찾아서 포함되는 라인을 삭제한 동일한 이름의 파일을 만드는 방법 총관리자 2017.01.25 36
78 Github를 이용하는 전체 흐름 이해하기 총관리자 2016.11.18 36
77 5건의 triple data를 이용하여 특정 작업 폴더에서 작업하는 방법/절차 총관리자 2016.06.16 36
76 S2RDF모듈의 실행부분만 추출하여 별도록 실행하는 방법(draft) 총관리자 2016.06.14 36
75 kerberos연동된 CDH 6.3.4에서 default realm값이 잘못된 상태에서 서비스 기동시 오류 gooper 2022.10.14 35
74 [TLS/SSL]Kudu Tablet Server설정 총관리자 2022.05.13 35
73 Oracle NLOB type의 데이터를 import하는 경우 No Java type for SQL type 2011 for column rst와 같은 오류 발생시 조치사항 총관리자 2022.01.14 35
72 CM의 Impala->Query tab에서 FINISHED query가 보이지 않는 현상 총관리자 2021.08.31 35
71 tar를 이용한 리눅스 백업 총관리자 2018.05.13 35
70 core 'gc_shard3_replica2' is already locked라는 오류가 발생할때 조치사항 총관리자 2017.09.14 35
69 spark에서 hive table을 읽어 출력하는 예제 소스 총관리자 2017.03.09 35
68 ServerInfo객체파일 총관리자 2016.07.21 35
67 AnalysisException: Incomplatible return type 'DECIMAL(38,0)' and 'DECIMAL(38,5)' of exprs가 발생시 조치 총관리자 2021.07.26 34
66 fuseki에서 제공하는 script중 s-post를 사용하는 예문 총관리자 2017.09.15 34
65 restaurant-controller,에서 등록 예시 총관리자 2022.04.30 33
64 [Kerberos]병렬 kinit 호출시 cache파일이 손상되어 Bad format in credentials cache 혹은 No credentials cache found 혹은 Internal credentials cache error 오류 발생시 gooper 2023.01.20 32
63 Failed to write to server: (no server available): 총관리자 2022.01.17 32
62 Cloudera Hadoop and Spark Developer Certification 준비(참고) 총관리자 2018.05.16 32
61 파일은 남겨두고 파일 내용만 지우고자 할 때. 총관리자 2017.08.30 32

A personal place to organize information learned during the development of such Hadoop, Hive, Hbase, Semantic IoT, etc.
We are open to the required minutes. Please send inquiries to gooper@gooper.com.

위로