메뉴 건너뛰기

Bigdata, Semantic IoT, Hadoop, NoSQL

Bigdata, Hadoop ecosystem, Semantic IoT등의 프로젝트를 진행중에 습득한 내용을 정리하는 곳입니다.
필요한 분을 위해서 공개하고 있습니다. 문의사항은 gooper@gooper.com로 메일을 보내주세요.


0. 아래와 같이 설정한다는 가정하에 작업을 진행한다.(ZK는 hbase가 관리하지 않도록 설정)

   master에 HMaster

   node1에 backup HMaster1, RegionServer

   node2에 backup HMaster2, RegionServer

   node3에 RegionServer

   node4에 RegionServer


1. hbase 0.98.12를 다운로드및 설치위치에 업로드

   http://www.eu.apache.org/dist/hbase/


2. 압축을 푼다.

   tar xvfz hbase-0.98.12-hadoop2-bin.tar.gz


3. soft link를 생성한다.

   ln -s hbase-0.98.12-hadoop2 hbase


3-1. 환경변수 설정(vi /etc/profile) 

   export HBASE_HOME=/usr/local/hbase 과

   export PATH=$PATH:$HBASE_HOME을 등록해준다.


4. hbase-env.sh 설정

  : JAVA_HOME과 HBASE_CLASSPATH의 commnet를 제거하고 

   아래와 같이 jdk가 설치된 경로와 hadoop이 설정파일의 위치를 지정해준다(hadoop변경사항을 hbase가 알기 위한 설정)

   zookeeper는 hbase가 관리하지 않게 설정한다.


  vi conf/hbase-env.sh

  export JAVA_HOME=/opt/jdk1.8.0_66

  export HBASE_CLASSPATH=$HADOOP_CONF_DIR

  export HBASE_MANAGES_ZK=false

  export HBASE_SSH_OPTS="-p 22"


* export JAVA_HOME=$JAVA_HOME로 설정하면 안되네??


5.conf/hbase-site.xml내용 수정

- zookeeper의 위치와 hbase의 data가 저장될 위치를 지정한다.


<configuration>

<!-- HDFS가 HA가 아닌경우 -->

<!--

  <property>

    <name>hbase.rootdir</name>

    <value>hdfs://master:9000/hbase</value>

  </property>

-->


<!-- HDFS가 HA로 구성된경우 -->

  <property>

    <name>hbase.rootdir</name>

    <value>hdfs://mycluster/hbase</value>

  </property>

<!-- mycluster는 hdfs-site.xml의 dfs.nameservices에 지정한 값을 사용한다 -->


  <property>

    <name>hbase.cluster.distributed</name>

    <value>true</value>

  </property>

  <property>

    <name>hbase.zookeeper.quorum</name>

    <value>master:2181,node1:2181,node2:2181</value>

  </property>

</configuration>


5-1. 로그 경로 변경

vi /usr/local/hbase/conf/hbase-env.sh

# Where log files are stored.  $HBASE_HOME/logs by default.

# export HBASE_LOG_DIR=${HBASE_HOME}/logs의 주석을 풀고 아래와 같이 변경함

 export HBASE_LOG_DIR=/logs/hbase/logs


6. regionserver가 될 node를 지정한

vi conf/regionservers

node1

node2

node3

node4


7. HMaster의 백업용으로 사용할 backup서버를 지정한다.(파일이 없으면 생성해준다)

vi conf/backup-masters

node1

node2


8. 각서버에 hbase전체를 복사후 링크를 생성한다.

가. 복사

  scp -r -P 22 hbase-0.98.12-hadoop2 root@node1:$HOME

  scp -r -P 22 hbase-0.98.12-hadoop2 root@node2:$HOME

  scp -r -P 22 hbase-0.98.12-hadoop2 root@node3:$HOME

  scp -r -P 22 hbase-0.98.12-hadoop2 root@node4:$HOME

나. 링크생성

  ln -s hbase-0.98.12-hadoop2 hbase


9. hadoop환경설정 정보를 hbase가 사용할 수 있게 설정(hbase가 설치된 모든 서버에서 실행)

* hadoop의 변경사항을 hbase가 알 수 있게 하는 방법은 2가지가 더 있다.

 가. hbase설치 위치의 conf폴더 밑에 hdfs-site.xml, core-site.xml, yarn-site.xml등 3개의 파일에 대한 symbolic links를

  생성한다.(hbase가 설치된곳의 conf폴더 밑에서 "ln -s $HADOOP_HOME/etc/hadoop/hdfs-site.xml hdfs-site.xml"등을 실행함)

  (

   root@master:~/hbase/conf# ln -s $HADOOP_HOME/etc/hadoop/hdfs-site.xml hdfs-site.xml 

   root@master:~/hbase/conf# ln -s $HADOOP_HOME/etc/hadoop/core-site.xml core-site.xml

   root@master:~/hbase/conf# ln -s $HADOOP_HOME/etc/hadoop/yarn-site.xml yarn-site.xml

)

 나. 몇개 안되는 설정값(예, dfs.replication.factor)은 hbase-site.xml에 설정값을 직접넣는다.


10. master서버에서 start시켜줌(master에서 기동시키면 나머지 데몬은 hbase가 자동으로 올려준댜)

root@master:bin# start-hbase.sh

starting master, logging to /usr/local/hbase/logs/hbase-root-master-master.out

node3: starting regionserver, logging to /usr/local/hbase/bin/../logs/hbase-root-regionserver-node3.out

node4: starting regionserver, logging to /usr/local/hbase/bin/../logs/hbase-root-regionserver-node4.out

node1: starting regionserver, logging to /usr/local/hbase/bin/../logs/hbase-root-regionserver-node1.out

node2: starting regionserver, logging to /usr/local/hbase/bin/../logs/hbase-root-regionserver-node2.out

node1: starting master, logging to /usr/local/hbase/bin/../logs/hbase-root-master-node1.out

node2: starting master, logging to /usr/local/hbase/bin/../logs/hbase-root-master-node2.out


* stop-hbase.sh은 HMaster데몬이 떠있는 곳에서 실행해야함

(stopping hbase: /tmp/hbase-hadoop-master.pid: No such file or directory 오류발생)


* regionserver를 수동으로 기동하는 방법

./bin/hbase-daemon.sh start regionserver


11. 모니터링

* hbase 0.98.x이하인 경우

HMaster Info Web UI : http://192.168.10.100:60010

Region Server : http://192.168.10.100:60030


* hbase 0.98.x이상의 버젼에서는 포트가 아래와 같이 변경됨

HMaster Info Web UI : http://192.168.10.100:16010

Region Server : http://192.168.10.100:16030


* start-hbase.sh에서 regionserver가 기동하지 못하고 "org.apache.hadoop.hbase.ClockOutOfSyncException: org.apache.hadoop.hbase.ClockOutOfSyncException"오류가 발생하면 master와 regionserver에서 "rdate -s time.bora.net" 혹은 "ntpdate time.bora.net"를 실행하여 시간을 맞추고 start-hbase.sh을 실행해준다.


12. hbase test
가. 실행
   bin/hbase shell

나. test 테이블생성
hbase(main):002:0> create 'test', 'cf'
0 row(s) in 1.5750 seconds
=> Hbase::Table - test

다. list
다. put 'test', 'rowkey1','cf:a', 'test_value'
라. scan 'test'
마. describe 'test'

* hbase shell을 이용한 간단한 테스트는 https://www.gooper.com/ss/index.php?mid=bigdata&category=2788&page=2&document_srl=2912 를 참조할것

번호 제목 글쓴이 날짜 조회 수
29 Hadoop의 Datanode를 Decommission하고 나서 HBase의 regionservers파일에 해당 노드명을 지웠는데 여전히 "Dead regionser"로 표시되는 경우 처리 총관리자 2018.01.25 238
28 Current heap configuration for MemStore and BlockCache exceeds the threshold required for successful cluster operation 총관리자 2017.07.18 892
27 HBase 설정 최적화하기(VCNC) file 총관리자 2017.07.18 120
26 HBase write 성능 튜닝 file 총관리자 2017.07.18 87
25 Hbase API를 이용하여 scan시 페이징을 고려하여 목록을 가져올때 사용할 수 있는 로직의 예시를 보여줌 총관리자 2017.04.26 237
24 테이블의 row수를 빠르게 카운트 하는 방법 총관리자 2017.01.26 77
23 hbase startrow와 endrow를 지정하여 검색하기 샘플 총관리자 2016.12.07 70
22 Flume을 이용한 데이타 수집시 HBase write 성능 튜닝 file 총관리자 2016.10.31 620
21 bin/start-hbase.sh실행시 org.apache.hadoop.hbase.util.FileSystemVersionException: HBase file layout needs to be upgraded오류가 발생하면 조치사항 총관리자 2016.08.01 205
20 org.apache.hadoop.hbase.ClockOutOfSyncException: org.apache.hadoop.hbase.ClockOutOfSyncException 오류시 조치사항 총관리자 2016.07.14 62
19 Master rejected startup because clock is out of sync 오류 해결방법 총관리자 2016.05.03 60
18 hbase shell 필드 검색 방법 총관리자 2015.05.24 1897
17 secureCRT에서 backspace키가 작동하지 않는 경우 해결방법 총관리자 2015.05.11 699
16 hbase가 기동시키는 zookeeper에서 받아드리는 ip가 IPv6로 사용되는 경우가 있는데 이를 IPv4로 강제적용하는 방법 총관리자 2015.05.08 266
15 hbase CustomFilter만들기 (0.98.X이상) 총관리자 2015.05.08 162
» HBase 0.98.12(1.2.5) for hadoop2 설치-5대에 완전분산모드 (HDFS HA상테) 총관리자 2015.04.29 1047
13 scan의 startrow, stoprow지정하는 방법 총관리자 2015.04.08 375
12 SASL configuration failed: javax.security.auth.login.LoginException: java.lang.NullPointerException 오류 해결방법 총관리자 2015.04.02 701
11 hbase shell에서 컬럼값 검색하기(SingleColumnValueFilter이용) 총관리자 2014.04.25 2443
10 column family삭제시 Column family 'delete' does not exist오류 발생하는 경우 총관리자 2014.04.14 931

A personal place to organize information learned during the development of such Hadoop, Hive, Hbase, Semantic IoT, etc.
We are open to the required minutes. Please send inquiries to gooper@gooper.com.

위로