Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.

hive external partition table생성및 data확인

총관리자 2014.04.03 22:19 조회 수 : 4278

-----------------------------------------------------------------------
데이타파일#1
test01.txt
park

-----------------------------------------------------------------------
데이타파일#2
test02.txt
sang

-----------------------------------------------------------------------
user 테이블 생성
CREATE EXTERNAL TABLE user (
name String
)
COMMENT 'User Infomation'
PARTITIONED BY (date String)

row format delimited fields terminated by 't'
LOCATION '/user/hadoop/datastore/user/';

-----------------------------------------------------------------------
20140403파티션에 데이타(test01.txt)를 date를 넣을 폴더 생성및 데이타 파일등록
hadoop@bigdata-host:~/hadoop/working$ hadoop fs -mkdir /user/hadoop/datastore/user/date=20140403
hadoop@bigdata-host:~/hadoop/working$ hadoop fs -put test01.txt /user/hadoop/datastore/user/date=20140403

-----------------------------------------------------------------------
파티션등록
hive> alter table user add partition(date='20140403');

-----------------------------------------------------------------------
결과 확인
hive> select * from user; -->
park 20140403

-----------------------------------------------------------------------
두번째 파일 등록
20140404파티션에 데이타(test02.txt)를 date를 넣을 폴더 생성및 데이타 파일등록
hadoop@bigdata-host:~/hadoop/working$ hadoop fs -mkdir /user/hadoop/datastore/user/date=20140404
hadoop@bigdata-host:~/hadoop/working$ hadoop fs -put test02.txt /user/hadoop/datastore/user/date=20140404

-----------------------------------------------------------------------

파티션등록
hive> alter table user add partition(date='20140404');

-----------------------------------------------------------------------
결과 확인
hive> select * from user; -->
park 20140403
sang 20140404
-----------------------------------------------------------------------

data파일 추가: test03.txt

-----------------------------------------------------------------------

변경된 파일을 20140403파티션에 upload후 데이타 확인

hadoop@bigdata-host:~/hadoop/working$ hadoop fs -put test03.txt /user/hadoop/datastore/user/date=20140403

-----------------------------------------------------------------------

select하면

hive> select * from user;
OK
park 20140403
append1 20140403
append2 20140403
append3 20140403
sang 20140404
Time taken: 0.318 seconds, Fetched: 5 row(s)

-----------------------------------------------------------------------

hadoop@bigdata-host:~/hadoop/working$ hadoop fs -ls /user/hadoop/datastore/user/date=20140403Found 2 items
-rw-r--r-- 1 hadoop supergroup 5 2014-04-03 21:55 /user/hadoop/datastore/user/date=20140403/test01.txt
-rw-r--r-- 1 hadoop supergroup 24 2014-04-03 22:42 /user/hadoop/datastore/user/date=20140403/test03.txt

이 게시물을

이 글의 추천인 목록 목록

번호	제목	날짜	조회 수
45	not leader of this config: current role FOLLOWER 오류 발생시 확인방법	2022.01.17	3983
44	우분투 16.04LTS에 Jupyter설치	2018.04.17	3957
43	lateral view 예제	2014.09.18	3904
42	impala session type별 표시되는 정보로 구분하는 방법	2021.05.25	3874
41	impala external 테이블 생성시 컬럼과 라인 구분자를 지정하여 테이블 생성하는 예시	2020.02.20	3850
40	Apache Toree설치(Jupyter에서 Scala, PySpark, SparkR, SQL을 사용할 수 있도록 하는 Kernel)	2018.04.17	3849
39	streaming작업시 입력된 값에 대한 사본을 만들게 되는데 이것이 실패했을때 발생하는 경고메세지	2017.04.03	3841
38	Scala를 이용한 Streaming예제	2018.03.08	3809
37	spark에서 hive table을 읽어 출력하는 예제 소스	2017.03.09	3791
36	small file 한개 파일로 만들기(text file 혹은 parquet file의 테이블)	2022.07.04	3788
35	Query 1234:1234 expired due to client inactivity(timeout is 5m)및 invalid query handle	2022.06.10	3775
34	Caused by: java.lang.ClassNotFoundException: org.apache.spark.Logging 발생시 조치사항	2017.04.19	3752
33	Hive JDBC Connection과 유형별 에러및 필요한 jar파일	2021.05.24	3744
32	kafka로 부터 메세지를 stream으로 받아 처리하는 spark샘플소스(spark의 producer와 consumer를 sbt로 컴파일 하고 서버에서 spark-submit하는 방법)	2016.07.13	3719
31	spark-submit 실행시 "java.lang.OutOfMemoryError: Java heap space"발생시 조치사항	2018.02.01	3711
30	hive기동시 Caused by: java.net.URISyntaxException: Relative path in absolute URI: ${system:java.io.tmpdir%7D/$%7Bsystem:user.name%7D 오류 발생시 조치사항	2016.09.25	3631
29	hive에서 insert overwrite directory.. 로 하면 default column구분자는 'SOH'혹은 't'가 됨	2014.05.20	3591
28	spark notebook 0.7.0설치및 설정	2016.11.14	3574
27	[Impala jdbc]CDP7.1.7환경에서 java프로그램을 이용하여 kerberized impala cluster에 접근하여 SQL을 수행하는 방법	2023.08.22	3545
26	spark stream처리할때 두개의 client프로그램이 동일한 checkpoint로 접근할때 발생하는 오류 내용	2018.01.16	3537

쓰기 태그

첫 페이지 1 2 3 4 5 6 7 8 끝 페이지

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.

hive external partition table생성및 data확인

댓글 0

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.

hive external partition table생성및 data확인

댓글 0

LOGIN