메뉴 건너뛰기

Bigdata, Semantic IoT, Hadoop, NoSQL

Bigdata, Hadoop ecosystem, Semantic IoT등의 프로젝트를 진행중에 습득한 내용을 정리하는 곳입니다.
필요한 분을 위해서 공개하고 있습니다. 문의사항은 gooper@gooper.com로 메일을 보내주세요.


consensus데이터가 잘못되거나 data파일이 지워지거나 wal정보가 잘못되는등의 다양한 원인에 의해서 kudu tablet server의 서비스가 되지 않는 경우가 있는데

이런경우 다음과 같이 data데이터및 wal디렉토리의 데이터를 모두 삭제하여 kudu로 하여금 재구성 하면서 복구하도록 해야 한다. 

(TS03가 문제이며 경로는 wal : /kudu/tablet/wal, data : /data01/kudu/data, /data02/kudu/data, /data03/kudu/data인 경우임)

* 주의할점은 kudu cluster ksck를 통하여 각 테이블의 RF(replication factor가 3이상인지 반드시 확인해야 하며 1인 경우 해당 테이블의 데이터가 소실될 수 있으니 반드시 확인할것)

1. TS03의 kudu tablet service stop

2. backup 수행(필요시)

  - sudo mv /kudu/tablet/wal /kudu/tablet/wal_backup

  - sudo mv /data01/kudu/data /data01/kudu/data_backup

  - sudo mv /data02/kudu/data /data02/kudu/data_backup

  - sudo mv /data03/kudu/data /data03/kudu/data_backup

3. Kudu 전체 restart해준다. (필용한 폴더가 자동으로 생성되면서 복구된다)

4. 상태 확인(테이블및 TS등의 상태을 확인할 수 있음) 

  - sudo -u kudu kinit -kt /run/cloudera-scm-agent/process/....-kudu-KUDU_MASTER/kudu.keytab kudu/master01.gooper.com@GOOPER.COM

  - sudo -u kudu kudu cluster ksck master01.gooper.com:7051,master02.gooper.com:7051,master03.gooper.com:7051



*참고 : 데이터 복구

1. TS03의 kudu tablet service stop

2. 기존데이터 삭제

  - sudo rm -r /kudu/tablet/wal

  - sudo rm -r /data01/kudu/data

  - sudo rm -r /data02/kudu/data

  - sudo rm -r /data03/kudu/data

3. 백업데이터를 이용하여 데이터 복구

  - sudo mv /kudu/tablet/wal_backup /kudu/tablet/wal

  - sudo mv /data01/kudu/data_backup /data01/kudu/data

  - sudo mv /data02/kudu/data_backup /data02/kudu/data

  - sudo mv /data03/kudu/data_backup /data03/kudu/data

4. Kudu 전체 restart해준다. (필용한 폴더가 자동으로 생성되면서 복구된다) 

5. 상태 확인(테이블및 TS등의 상태을 확인할 수 있음)

  - sudo -u kudu kinit -kt /run/cloudera-scm-agent/process/....-kudu-KUDU_MASTER/kudu.keytab kudu/master01.gooper.com@GOOPER.COM

  - sudo -u kudu kudu cluster ksck master01.gooper.com:7051,master02.gooper.com:7051,master03.gooper.com:7051


   

  

번호 제목 글쓴이 날짜 조회 수
14 kudu table와 impala(hive) table정보가 틀어져서 테이블을 읽지 못하는 경우(Error Loading Metadata) 조치방법 gooper 2023.11.10 24
» [KUDU] kudu tablet server여러가지 원인에 의해서 corrupted상태가 된 경우 복구방법 gooper 2023.03.28 34
12 [Kudu]ERROR: Unable to advance iterator for node with id '2' for Kudu table 'impala::core.pm0_abdasubjct': Network error: recv error from unknown peer: Transport endpoint is not connected (error 107) gooper 2023.03.16 531
11 [Kudu]Schema별 혹은 테이블별 사용량(Replica포함) 구하는 방법 gooper 2022.07.14 117
10 [Cloudera 6.3.4, Kudu]]Service Monitor에서 사용하는 metric중에 일부를 blacklist로 설정하여 모니터링 정보 수집 제외하는 방법 gooper 2022.07.08 31
9 [TLS/SSL]Kudu Tablet Server설정 총관리자 2022.05.13 35
8 [TLS/SSL]Kudu Master 설정하기 총관리자 2022.05.13 61
7 kudu rebalance수행 command예시 총관리자 2022.01.17 84
6 Kudu tablet이 FAILED일때 원인 확인 방법 총관리자 2022.01.17 89
5 Failed to write to server: (no server available): 총관리자 2022.01.17 32
4 Soft memory limit exceeded (at 100.05% of capacity) 오류 조치 총관리자 2022.01.17 177
3 not leader of this config: current role FOLLOWER 오류 발생시 확인방법 총관리자 2022.01.17 23
2 kudu 테이블 metadata강제 삭제시 발생하는 오류 메세지 총관리자 2022.01.12 108
1 kudu hms check 사용법(예시) 총관리자 2021.10.22 65

A personal place to organize information learned during the development of such Hadoop, Hive, Hbase, Semantic IoT, etc.
We are open to the required minutes. Please send inquiries to gooper@gooper.com.

위로