메뉴 건너뛰기

Bigdata, Semantic IoT, Hadoop, NoSQL

Bigdata, Hadoop ecosystem, Semantic IoT등의 프로젝트를 진행중에 습득한 내용을 정리하는 곳입니다.
필요한 분을 위해서 공개하고 있습니다. 문의사항은 gooper@gooper.com로 메일을 보내주세요.


consensus데이터가 잘못되거나 data파일이 지워지거나 wal정보가 잘못되는등의 다양한 원인에 의해서 kudu tablet server의 서비스가 되지 않는 경우가 있는데

이런경우 다음과 같이 data데이터및 wal디렉토리의 데이터를 모두 삭제하여 kudu로 하여금 재구성 하면서 복구하도록 해야 한다. 

(TS03가 문제이며 경로는 wal : /kudu/tablet/wal, data : /data01/kudu/data, /data02/kudu/data, /data03/kudu/data인 경우임)

* 주의할점은 kudu cluster ksck를 통하여 각 테이블의 RF(replication factor가 3이상인지 반드시 확인해야 하며 1인 경우 해당 테이블의 데이터가 소실될 수 있으니 반드시 확인할것)

1. TS03의 kudu tablet service stop

2. backup 수행(필요시)

  - sudo mv /kudu/tablet/wal /kudu/tablet/wal_backup

  - sudo mv /data01/kudu/data /data01/kudu/data_backup

  - sudo mv /data02/kudu/data /data02/kudu/data_backup

  - sudo mv /data03/kudu/data /data03/kudu/data_backup

3. Kudu 전체 restart해준다. (필용한 폴더가 자동으로 생성되면서 복구된다)

4. 상태 확인(테이블및 TS등의 상태을 확인할 수 있음) 

  - sudo -u kudu kinit -kt /run/cloudera-scm-agent/process/....-kudu-KUDU_MASTER/kudu.keytab kudu/master01.gooper.com@GOOPER.COM

  - sudo -u kudu kudu cluster ksck master01.gooper.com:7051,master02.gooper.com:7051,master03.gooper.com:7051



*참고 : 데이터 복구

1. TS03의 kudu tablet service stop

2. 기존데이터 삭제

  - sudo rm -r /kudu/tablet/wal

  - sudo rm -r /data01/kudu/data

  - sudo rm -r /data02/kudu/data

  - sudo rm -r /data03/kudu/data

3. 백업데이터를 이용하여 데이터 복구

  - sudo mv /kudu/tablet/wal_backup /kudu/tablet/wal

  - sudo mv /data01/kudu/data_backup /data01/kudu/data

  - sudo mv /data02/kudu/data_backup /data02/kudu/data

  - sudo mv /data03/kudu/data_backup /data03/kudu/data

4. Kudu 전체 restart해준다. (필용한 폴더가 자동으로 생성되면서 복구된다) 

5. 상태 확인(테이블및 TS등의 상태을 확인할 수 있음)

  - sudo -u kudu kinit -kt /run/cloudera-scm-agent/process/....-kudu-KUDU_MASTER/kudu.keytab kudu/master01.gooper.com@GOOPER.COM

  - sudo -u kudu kudu cluster ksck master01.gooper.com:7051,master02.gooper.com:7051,master03.gooper.com:7051


   

  

번호 제목 글쓴이 날짜 조회 수
741 bananapi 5대(ubuntu계열 리눅스)에 yarn(hadoop 2.6.0)설치하기-ResourceManager HA/HDFS HA포함, JobHistory포함 총관리자 2015.04.24 19143
740 mapreduce appliction을 실행시 "is running beyond virtual memory limits" 오류 발생시 조치사항 총관리자 2017.05.04 16899
739 org.apache.hadoop.hdfs.server.common.InconsistentFSStateException: Directory /tmp/hadoop-root/dfs/name is in an inconsistent state: storage directory does not exist or is not accessible. 구퍼 2013.03.11 14781
738 drop table로 삭제했으나 tablet server에는 여전히 존재하는 테이블 삭제방법 총관리자 2021.07.09 7560
737 insert hbase by hive ... error occured after 5 hours..HMaster가 뜨지 않는 장애에 대한 복구 방법 총관리자 2014.04.29 7129
736 Resource temporarily unavailable(자원이 일시적으로 사용 불가능함) 오류조치 총관리자 2015.11.19 6888
735 HBase shell로 작업하기 구퍼 2013.03.15 5834
734 dr.who로 공격들어오는 경우 조치방법 file 총관리자 2018.06.09 5603
733 하둡 분산 파일 시스템을 기반으로 색인하고 검색하기 구퍼 2013.03.15 5573
732 [Decommission]시 시간이 많이 걸리면서(수일) Decommission이 완료되지 않는 경우 조치 총관리자 2018.01.03 5341
731 Ubuntu 16.04LTS 설치후 초기에 주어야 하는 작업(php, apache, mariadb설치및 OS보안설정등) file 총관리자 2017.05.23 5272
730 hive 2.0.1 설치및 mariadb로 metastore 설정 총관리자 2016.06.03 5185
729 Hive Query Examples from test code (2 of 2) 총관리자 2014.03.26 5024
728 Spark에서 Serializable관련 오류및 조치사항 총관리자 2017.04.21 4901
727 [gson]mongodb의 api를 이용하여 데이타를 가져올때 "com.google.gson.stream.MalformedJsonException: Unterminated object at line..." 오류발생시 조치사항 총관리자 2017.12.11 4425
726 import 혹은 export할때 hive파일의 default 구분자는 --input-fields-terminated-by "x01"와 같이 지정해야함 총관리자 2014.05.20 4245
725 checking for termcap functions library... configure: error: No curses/termcap library found 구퍼 2013.03.08 4120
724 sqoop작업시 hdfs의 개수보다 더많은 값이 중복되어 oracle에 입력되는 경우가 있음 총관리자 2014.09.02 4093
723 다수의 로그 에이전트로 부터 로그를 받아 각각의 파일로 저장하는 방법(interceptor및 multiplexing) 총관리자 2014.04.04 4089
722 .git폴더를 삭제하고 다시 git에 추가하고 서버에 반영하는 방법 총관리자 2017.06.19 4078

A personal place to organize information learned during the development of such Hadoop, Hive, Hbase, Semantic IoT, etc.
We are open to the required minutes. Please send inquiries to gooper@gooper.com.

위로