메뉴 건너뛰기

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.


MariaDB의 study데이타 베이스에 접근하여 product테이블의 데이타를 가져와서 study/out/productimport에 저장하는 sqoop문장이다.
이때 컬럼구분자는 '\001'(^A)를 사용하고 라인구분자는 '\003'(^C)를 사용한다.
hive폴더에 저장되는 라인은 price >1인 조건을 만족해야하며 productID및 name만 저장된다
이렇게 하면 컬럼에 newline(\n)이 있어도 문제없이 가져올 수 있다.

sqoop import \
--connect=jdbc:mysql://gsda3:포트/study \
--username=db사용자\
--password=패스워드\
--table=product \
--target-dir=study/out/productimport \
--fields-terminated-by='\001' \
--lines-terminated-by='\003'
--where="price > 1 " \
--columns="productID, name"

아래는 위에서 sqoop로 가져온 데이타에 대한 external table을 생성하는 hive명령문이다.

hive 1.1에서 기본적으로 지원하는 라인 구분자는 '\n'만 지원한다.
하지만 textinputformat.record.delimiter을 이용하여 라인 구분자를 변경할 수 있다.

set textinputformat.record.delimiter='\003';
create external table productimport
(productID string, name string)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\001'
STORED AS TEXTFILE
LOCATION 'study/out/productimport';
번호 제목 날짜 조회 수
610 missing block및 관련 파일명 찾는 명령어 2021.02.20 3182
609 lombok설치방법 2020.06.20 1386
608 [sap] Error: java.io.IOException: SQLException in nextKeyValue 오류 발생 2020.06.08 2787
607 [kudu]테이블 drop이 안되고 timeout이 걸리는 경우 조치 방법 2020.06.08 2628
606 [oozie] oozie shell action에서 shellscript수행결과의 2개 변수를 decision 액션에서 사용하기 2020.06.05 2338
605 [Sentry]HDFS의 ACL을 Sentry와 연동후 테스트 2020.06.02 2662
604 [sqoop] mapper를 2이상으로 설정하기 위한 split-by컬럼을 찾을때 유용하게 활용할 수 있는 쿼리 2020.05.13 3053
603 mysql sqoop작업을 위해서 mysql-connector-java.jar을 추가하는 경우 확실하게 인식시키는 방법 2020.05.11 2297
602 W/F수행후 Logs not available for 1. Aggregation may not to complete. 표시되며 로그내용이 보이지 않은 경우 2020.05.08 3584
601 A Cluster의 HDFS 디렉토리및 파일을 사용자및 권한 유지 하여 다운 받아서 B Cluster에 넣기 2020.05.06 2537
600 impala external 테이블 생성시 컬럼과 라인 구분자를 지정하여 테이블 생성하는 예시 2020.02.20 2421
599 [Kerberos]Kerberos상태의 클러스터에 JDBC로 접근할때 케이스별 오류내용 2020.02.14 3238
598 cloudera서비스 중지및 기동순서 2020.02.14 2693
597 impala테이블 쿼리시 max_row_size 관련 오류가 발생할때 조치사항 2020.02.12 2268
596 hue.axes_accessattempt테이블 데이터 샘플 2020.02.10 2834
595 hue.desktop_document2의 type의 종류 2020.02.10 2965
594 hue db에서 사용자가 가지는 정보 확인 2020.02.10 3297
593 Cloudera의 CMS각 컴포넌트의 역할 2020.02.10 2892
592 Namenode Metadata백업하는 방법 2020.02.10 2481
591 cloudera의 hue에서 사용자가 사용한 쿼리 목록 2020.02.07 2261
위로