메뉴 건너뛰기

Bigdata, Semantic IoT, Hadoop, NoSQL

Bigdata, Hadoop ecosystem, Semantic IoT등의 프로젝트를 진행중에 습득한 내용을 정리하는 곳입니다.
필요한 분을 위해서 공개하고 있습니다. 문의사항은 gooper@gooper.com로 메일을 보내주세요.


Hue에서 왼쪽 DB및 테이블 목록이 hive tab에서는 정상적으로 보이는데 impala tab에서는 보이지 않고 실제 query를 수행해보면 테이블의 데이터 조회는 가능한 경우가 있다.

이때 Impala의 catalogd log를 살펴보면 아래와 같은 오류가 반복적으로 발생하는데 원인은 impala catalogd가 정보를 가져올 서버(?)에 접근시 TLS 인증을 하지 못하기 때문이다. 

(Enable TLS/SSL for Impala는 disable상태, 

Enable TLS/SSL to the Hive Metastore Database, Enable TLS/SSL for HiveServer2, Enable TLS/SSL for HiveServer2 WebUI모두 disable상태,

Enable TLS/SSL for Hue는 enable상태)



또한 Hue에서 다음의 작업이 실패하는 현상이 있다(AD및 Ranager에서 정상적으로 권한이 부여된것은 확인된 상태임)

1. table create등의 DML 쿼리 수행시 궈한이 없다고 나오면서 작업이 실패한다. (예, REFRESH, QueryError: AuthorizationException: User 'hadoop' does not have privileges to execute 'INVALIDATE METADATA/REFRESH' on: testDB.testtbl1)

2. Hue에서 해당 테이블명을 주고 select 구문을 수행하면 정상적으로 조회된다. 

3. Hue의 좌측 SQL탭에서 DB의 하위 테이블 목록이 조회되지 않는다.

4. Refresh 버튼을 클릭시 정상수행된듯하나 여전히 하위 테이블 목록이 조회되지 않는다.

5. Invalidate metadata버튼을 클릭시 "Too many tables(23) to invalidate. please do a full refresh." 라는 에러가 뜨면 수행되지 않는다. 


이때는 

1. Impala->Configuration의 아래 항목에 서비스(예, catalog데몬이 실행중인 서버) 서버의 인증서를 담고 있는 파일의 위치를 등록해주면 된다. 

Impala TLS/SSL Trust Store File : /opt/cloudera/security/certs/truststore

Impala TLS/SSL Trust Store Password : changeit


2. 위의 설정으로 CDP Hue에서 url이 자동 변경되면서 Hue서비스를 restart하여 반영하라고 메세지가 나올 수 있는데 이때는 Hue->Configuration->Solr Service중 CDP_INFRA-SOLR부분을 uncheck한다. 


---impala catalogd의 오류내용---

RangerAdminRESTClient.java:151] Failed to get response, Error is not specified

RangerAdminRESTClient.java:167] Error getting policies: Received NULL response!! secureMode=true,

user=impala/node02.gooper.com@GOOPER.COM (auth:KERBEROS), serviceName=cm_hive

RangerAdminRESTClient.java:230] Failed to get response, Error is: TrustManager is not specified


번호 제목 글쓴이 날짜 조회 수
320 W/F수행후 Logs not available for 1. Aggregation may not to complete. 표시되며 로그내용이 보이지 않은 경우 총관리자 2020.05.08 2110
319 A Cluster의 HDFS 디렉토리및 파일을 사용자및 권한 유지 하여 다운 받아서 B Cluster에 넣기 총관리자 2020.05.06 79
318 impala external 테이블 생성시 컬럼과 라인 구분자를 지정하여 테이블 생성하는 예시 총관리자 2020.02.20 109
317 [Kerberos]Kerberos상태의 클러스터에 JDBC로 접근할때 케이스별 오류내용 총관리자 2020.02.14 764
316 cloudera서비스 중지및 기동순서 총관리자 2020.02.14 178
315 impala테이블 쿼리시 max_row_size 관련 오류가 발생할때 조치사항 총관리자 2020.02.12 217
314 hue.axes_accessattempt테이블 데이터 샘플 총관리자 2020.02.10 108
313 hue.desktop_document2의 type의 종류 총관리자 2020.02.10 631
312 hue db에서 사용자가 가지는 정보 확인 총관리자 2020.02.10 1644
311 Cloudera의 CMS각 컴포넌트의 역할 총관리자 2020.02.10 71
310 Namenode Metadata백업하는 방법 총관리자 2020.02.10 374
309 cloudera의 hue에서 사용자가 사용한 쿼리 목록 총관리자 2020.02.07 156
308 hive metadata(hive, impala, kudu 정보가 있음) 테이블에서 db, table, owner, location를 조회하는 쿼리 총관리자 2020.02.07 380
307 oozie WF에서 참고할만한 내용 총관리자 2019.07.18 168
306 기준일자 이전의 hdfs 데이타를 지우는 shellscript 샘플 총관리자 2019.06.14 359
305 source, sink를 직접 구현하여 사용하는 예시 총관리자 2019.05.30 398
304 kerberos설정된 상태의 spooldir->memory->hdfs로 저장하는 과정의 flume agent configuration구성 예시 총관리자 2019.05.30 172
303 hive테이블의 물리적인 위치인 HDFS에 여러개의 데이터 파일이 존재할때 한개의 파일로 merge하여 동일한 테이블에 입력하는 방법 총관리자 2019.05.23 640
302 하둡 클러스터 전체 노드를 다시 기동하면 invalidate metadata를 수행해야 데이터가 틀어지지 않는다. 총관리자 2019.05.20 114
301 Could not configure server becase SASL configuration did not allow the Zookeeper server to authenticate itself properly: javax.security.auth.login.LoginException: Checksum failed 총관리자 2019.05.18 434

A personal place to organize information learned during the development of such Hadoop, Hive, Hbase, Semantic IoT, etc.
We are open to the required minutes. Please send inquiries to gooper@gooper.com.

위로