Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.

kafka kafka 0.9.0.1 for scala 2.1.1 설치및 테스트

총관리자 2016.05.02 13:28 조회 수 : 4949

1. 다운로드

https://www.apache.org/dyn/closer.cgi?path=/kafka/0.9.0.1/kafka_2.11-0.9.0.1.tgz

2. upload및 압축풀기

가. tar xvfz kafka_2.11-0.9.0.1.tgz

나. ln -s kafka_2.11-0.9.0.1 kafka

3. properties파일 수정(zookeeper는 별도로 기동중인 상태임)

가. config/consumer.properties : zookeeper.connect=sda1:2181,sda2:2181,so1:2181

나. config/producter.properties : metadata.broker.list=sda1:9092,sda2:9092,so1:9092

다. config/server.properties를 broker개수 만큼 복사하고 아래의 내용을 수정한다.

(예, broker가 3개인경우 는server-1.properties, server-2.properties, server-3.properties의

이름을 각각 가지는 설정파일을 3개 만든다.)

- broker.id=1 : broker마다 unique한 값

- port=9092

- host.name=sda1 : 각 서버의 고정ip

- log.dirs=/logs/kafka/kafka-logs

- zookeeper.connect=sda1:2181,sda2:2181,so1:2181

4. broker로 사용할 서버에 각각 복사(sda1, sda2, so1)

scp -r -P 22 kafka_2.11-0.9.0.1 root@sda2:$HOME

5. broker노드로 사용할 각 서버에서 kafka server를 기동한다.(root로 각 서버에서 실행)

가. ln -s kafka_2.11-0.9.0.1 kafka

나. bin/kafka-server-start.sh config/server-1.properties & (해당 서버에서 실행)

(Kafka Manager모니터링툴을 이용하기 위한 JMX PORT를 설정하기 위해서

env JMX_PORT=8989 bin/kafka-server-start.sh config/server-1.properties &

와 같이 실행한다.)

나-1. bin/kafka-server-start.sh config/server-2.properties & (해당 서버에서 실행)

(Kafka Manager모니터링툴을 이용하기 위한 JMX PORT를 설정하기 위해서

env JMX_PORT=8989 bin/kafka-server-start.sh config/server-2.properties &

와 같이 실행한다.)

나-2. bin/kafka-server-start.sh config/server-3.properties & (해당 서버에서 실행)

(Kafka Manager모니터링툴을 이용하기 위한 JMX PORT를 설정하기 위해서

env JMX_PORT=8989 bin/kafka-server-start.sh config/server-3.properties &

와 같이 실행한다.)

* 서버중지 : bin/kafka-server-stop.sh

* 데몬확인(jps -m) : 81589 Kafka config/server-1.properties

6. topic관리(토픽명 : test-topic)

가. 생성

* bin/kafka-topics.sh --create --zookeeper sda1:2181,sda2:2181,so1:2181 --replication-factor 3 --partitions 3 --topic test-topic

나. 목록

* topic목록 확인 : bin/kafka-topics.sh --list --zookeeper sda1:2181,sda2:2181,so1:2181

다. topic정보

* topic정보 : bin/kafka-topics.sh --describe --zookeeper sda1:2181,sda2:2181,so1:2181

라. topic삭제

* topic삭제 : bin/kafka-topics.sh --delete --zookeeper sda1:2181,sda2:2181,so1:2181 --topic COLLECT_ONEM2M

* 지정topic(예, COL_TEST)에 대한 replica와 partition정보 확인 :

./kafka-topics.sh --describe --zookeeper sda1:2181 --topic COL_TEST

마. topic설정 정보 변경

* topic 설정변경(partitions의 수를 5로 변경하는 경우) : bin/kafka-topics.sh --alter --zookeeper sda1:2181,sda2:2181,so1:2181 --topic COL_TEST --partitions 5

바.topic 생성시 주의사항

존재하지 않은 topic에 대하여 메시지를 생산하거나 소비할 경우 broker의 설정값에 따라 디폴트 설정으로 topic을 자동생성될 수 있다. (자동생성하지 않도록 하려면 auto.create.topics.enable를 false로 설정한다)

- broker관련 기본적으로 설정해야 하는 값(Kafka API사용시 conf설정)

auto.create.topics.enable=true

num.partitions=1

default.replication.factor=1

delete.topic.enable=false

#30MB(전송가능량, Kafka API사용시 conf설정)

message.max.bytes=31457280

replica.fetch.max.bytes=31457280

8. test

가. producer기동

bin/kafka-console-producer.sh --broker-list sda1:9092,sda2:9092,so1:9092 --topic test-topic

나. consumer기동

bin/kafka-console-consumer.sh --zookeeper sda1:2181,sda2:2181,so1:2181 --from-beginning --topic test-topic

* producer의 console에서 텍스트 입력후 consumer에서 data가 보이면 정상적으로 작동되는것임

9. Kafka API를 이용하여 consumer프로그램 만들때 conf는 아래와 같이 설정해준다.

properties.put("zookeeper.connect",Utils.ZOOKEEPER_LIST);

properties.put("group.id",user_id);

properties.put("zookeeper.session.timeout.ms", "500");

properties.put("zookeeper.sync.time.ms", "250");

properties.put("auto.commit.interval.ms", "1000");

properties.put("fetch.message.max.bytes", "31457280"); // 30MB 전송가능함

properties.put("auto.offset.reset", "smallest");

이 게시물을

이 글의 추천인 목록 목록

번호	제목	날짜	조회 수
217	Scala버젼 변경 혹은 상황에 맞게 Spark소스 컴파일하기	2016.05.31	4974
216	centos에 sbt 0.13.5 설치	2016.05.30	4244
215	Job이 끝난 log을 볼수 있도록 설정하기	2016.05.30	5325
214	spark client프로그램 기동시 "Error initializing SparkContext"오류 발생할때 조치사항	2016.05.27	8273
213	--master yarn 옵션으로 spark client프로그램 실행할때 메모리 부족 오류발생시 조치방법	2016.05.27	4417
212	DataSetCreator.py 실행시 파일을 찾을 수 없는 오류	2016.05.27	3135
211	python 2.6.6에서 print 'A=' 형태의 사용이 python 3.5.1에서 오류(SyntaxError: Missing parentheses in call to 'print') 발생함..	2016.05.27	3785
210	python실행시 ValueError: zero length field name in format오류 해결방법	2016.05.27	4820
209	S2RDF 테스트(벤치마크 테스트를 기준으로 python, scala소스가 만들어져서 기능은 파악되지 못함) [1]	2016.05.27	3738
208	CentOS6에 python3.5.1 소스코드로 빌드하여 설치하기	2016.05.27	5267
207	RDF storage조합에대한 test결과(4store, Jena+HBase, Hive+HBase, CumulusRDF, Couchbase) 페이지 링크	2016.05.26	7466
206	spark-submit으로 spark application실행하는 다양한 방법	2016.05.25	5369
205	spark 온라인 책자링크 (제목 : mastering-apache-spark)	2016.05.25	8378
204	"Initial job has not accepted any resources; check your cluster UI to ensure that workers are registered and have sufficient resources"오류 발생시 조치사항	2016.05.25	5469
203	spark-env.sh에서 사용할 수있는 항목.	2016.05.24	5335
202	Spark 1.6.1 설치후 HA구성	2016.05.24	7482
201	spark-shell실행시 "A read-only user or a user in a read-only database is not permitted to disable read-only mode on a connection."오류가 발생하는 경우 해결방법	2016.05.20	3772
200	Master rejected startup because clock is out of sync 오류 해결방법	2016.05.03	7065
199	kafka broker기동시 brokerId가 달라서 기동에 실패하는 경우 조치방법	2016.05.02	6059
»	kafka 0.9.0.1 for scala 2.1.1 설치및 테스트	2016.05.02	4949

쓰기 태그

첫 페이지 23 24 25 26 27 28 29 30 31 32 끝 페이지

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.

kafka kafka 0.9.0.1 for scala 2.1.1 설치및 테스트

댓글 0

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.

kafka kafka 0.9.0.1 for scala 2.1.1 설치및 테스트

댓글 0

로그인

LOGIN