메뉴 건너뛰기

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.


sqoop에서 mapper를 2이상으로 설정하기 위한 split-by컬럼을 찾을때 유용하게 활용할 수 있는 쿼리

(abctable에서 part_ym='201908'인 데이터를 가지고 test_col이라는 컬럼의 값을 이용하여 10등분하고 그 개수를 확인하는 impala sql임, -1은 마지막 값에 속하는 개수를 의미함)

select tt, count(*) from {
   select case when bb.lapse1 <= cast(substr(aa.test_col, 5,4) as int) and case(substr(aa.test_col, 5,4) as int) < bb.lapse2 then t
                  when t=10 and bb.lapse2 = cast(substr(aa.test_col, 5,4) as int) then -1
            end tt
   from 
    (select * from dw.abctable where part_ym='201908' aa,
    (select min_val, max_vl, t, max_val*((t-1)/10) as lapse1, max_val*((t+0)/10) as lapse2 from
          (select min(cast(substr(test_col, 5,4) as int)) as min_val, max(cast(substr(test_col, 5,4) as int)) as max_val from dw.abctable where part_ym= '201908') a, 
          (select cast(t as int) as t from copy_t where t in ('01','02','03','04','05','06','07','08','09','10')) b
    ) bb
} kk
where kk.tt is not null
group by kk.tt
order by 1;


번호 제목 날짜 조회 수
347 hadoop 클러스터 실행 스크립트 정리 2018.03.20 4817
346 mysql에서 외부 디비를 커넥션할 경우 접속 속도가 느려질때 2017.06.30 4814
345 hive의 메타정보 테이블을 MariaDB로 사용하는 경우 table comment나 column comment에 한글 입력시 깨지는 경우 utf8로 바꾸는 방법. 2023.03.10 4811
344 impald에서 idle_query_timeout 와 idle_session_timeout 구분 2021.05.20 4808
343 hbase에 필요한 jar들 2013.04.01 4801
342 hbase CustomFilter만들기 (0.98.X이상) 2015.05.08 4794
341 Hadoop 설치 및 시작하기 file 2013.03.06 4777
340 beeline실행시 User: root is not allowed to impersonate오류 발생시 조치사항 2016.06.03 4749
339 physical memory used되면서 mapper가 kill되는 경우 오류 발생시 조치 2018.09.20 4732
338 console명령과 API비교 2015.12.21 4731
337 update 샘플 2018.03.12 4728
336 [Hue admin]Add/Sync LDAP user, Sync LDAP users/groups 버튼 기능 설명 2023.08.09 4725
335 Nodes of the cluster (unhealthy)중 1/1 log-dirs are bad: 오류 해결방법 2015.05.17 4722
334 [EncryptionZone]User:hdfs not allowed to do 'DECRYPT_EEK on 'enc_key'오류 2023.11.02 4720
333 zookeeper 3.4.6 설치(3대) 2015.04.28 4718
332 hive metadata(hive, impala, kudu 정보가 있음) 테이블에서 db, table, owner, location를 조회하는 쿼리 2020.02.07 4709
331 기준일자 이전의 hdfs 데이타를 지우는 shellscript 샘플 2019.06.14 4707
330 Cloudera Manager설치및 Uninstall 방법(순서) 2018.05.28 4702
329 Ubuntu 16.04 LTS에 MariaDB 10.1설치 및 포트변경 및 원격접속 허용 2017.05.01 4701
328 HDFS 파일및 디렉토리 생성시 생성방법에 따라 권한이 다르게 부여된다. 2022.05.30 4681
위로