Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.

Solr+SolRDF solrcloud에 solrdf1.1설치하고 테스트 하기

총관리자 2016.04.22 09:53 조회 수 : 3287

0. solr를 설치한다 : solrdf1.1과 호환되는 solr버젼은 5.3.1이므로 이것을 설치할것)

https://www.gooper.com/ss/bigdata/3108

1. /tmp로 이동하여 git로 소스를 다운받고 빌드한다.

cd /tmp

git clone https://github.com/agazzarini/SolRDF.git solrdf-download

빌드하기

cd solrdf-download/solrdf

mvn clean install

* 빌드하면 /tmp/solrdf-download/solrdf/solrdf-integration-tests/target/solrdf-integration-tests-1.1-dev/solrdf에 생성됨

* 참고사이트 : https://github.com/agazzarini/SolRDF

2. solrdf용 solrconfig.xml을 수정하여 HDFS에 저장할 수 있도록 함

*파일위치:

/tmp/solrdf-download/solrdf/solrdf-integration-tests/target/solrdf-integration-tests-1.1-dev/solrdf/store/conf

을 주석처리하고 아래의 내용을 추가한다.

<str name="solr.hdfs.confdir">${solr.hdfs.confdir:}</str>

</directoryFactory>

3. build결과 폴더를 실행디렉토리로 복사하고 링크를 생성한다.(solr cluster모든 서버에 복사하고 설정해야함)

cp -r /tmp/solrdf-download/solrdf/solrdf-integration-tests/target/solrdf-integration-tests-1.1-dev/solrdf $HOME

cd $HOME

mv solrdf solrdf-1.1

ln -s solrdf-1.1 solrdf

4. 환경변수를 설정한다.(solr cluster 모든 서버에 설정)

vi /etc/profile

export SOLRDF_HOME=$HOME/solrdf

를 추가한다.

* 환경변수 적용 : source /etc/profile

5. zookeeper에 새로운 solrdf용 config정보 upload(최초한번)

./hadoop/solr/server/scripts/cloud-scripts/zkcli.sh -zkhost gsda1:2181 -cmd upconfig -c store --confname store -confdir $HOME/solrdf/store/conf

* zookeeper의 configs/store에 업로드된다.

(http://gsda1:8080/solr/#/~cloud?view=tree로 확인 가능함, configs폴더밑에 store폴더가 있고 그 밑에 설정파일이 있음)

* znode 삭제 : ../server/scripts/cloud-scripts/zkcli.sh -zkhost gsda1:2181 -c store -cmd clear /configs/store

6. solrdf 기동(8080포트로 새로운 solr인스턴스를 기동하게된다)(모든 solr cluster서버에서 실행)

solr가 설치된 위치의 bin폴더 밑으로 가서 아래 명령을 준다.
./solr start -p 8080 -s $SOLRDF_HOME -cloud -z gsda1:2181,gsda2:2181,gsda3:2181 
-a "-Dsolr.data.dir=hdfs://mycluster/user/root/solr/solrdf 
-Dsolr.lock.type=hdfs 
-Dsolr.directoryFactory=HdfsDirectoryFactory 
-Dsolr.updatelog=hdfs://mycluster/user/root/solr/solrdf 
-Dsolr.hdfs.confdir=/svc/apps/sda/bin/hadoop/hadoop/etc/hadoop 
"

* HDFS의 hdfs://mycluster/user/root/solr/solrdf에 data를 저장하도록 8080포트로 인스턴스가 기동됨

* solr.hdfs.confdir은 hadoop의 conf파일이 있는 위치를 지정해줌

* HDFS가 아닌 File로 data로 등록기록 하는 경우의 실행방법

./solr start -p 8080 -s $SOLRDF_HOME -cloud -z gsda1:2181,gsda2:2181,gsda3:2181 

-a "-Dsolr.data.dir=/data/solr/solrdf 

-Dsolr.updatelog=/data/solr/solrdf 

"

* SolRDF 에서 data저장서로 HDFS로 지정하는 경우 아래와 같은 오류가 발생되어 HDFS에 data를 저장할 수 없음

SolrCore Initialization Failures

store: org.apache.solr.common.SolrException:org.apache.solr.common.SolrException: Index locked for write for core 'store'. Solr now longer supports forceful unlocking via 'unlockOnStartup'. Please verify locks manually!

Please check your logs for more information

Log4j (org.slf4j.impl.Log4jLoggerFactory)

Time (Local) Level Core Logger Message

2016. 4. 27. 오후 4:39:45 WARN null NativeCodeLoader Unable to load native-hadoop library for your platform... using builtin-java classes where applicable

2016. 4. 27. 오후 4:39:45 ERROR null SolrCore [store] Solr index directory 'hdfs://mycluster/user/root/solr/solrdf/store/data/index/' is locked. Throwing exception.

2016. 4. 27. 오후 4:39:46 ERROR null CoreContainer Error creating core [store]: Index locked for write for core 'store'. Solr now longer supports forceful unlocking via 'unlockOnStartup'. Please verify locks manually!

2016. 4. 27. 오후 4:39:46 ERROR null CoreContainer Error waiting for SolrCore to be created

7. "store"라는 collection생성하기(최초 한번) - ZK에 있는 configs/store에 있는 config정보를 활용함

./solr create -p 8080 -c store -shards 1 -replicationFactor 1 -n store

* 파일로 data를 저장하는 경우(5개 서버가 있으며 3개의 복사본을 유지함) - ZK에 있는 configs/store에 있는 config정보를 활용함

./solr create -p 8080 -c store -shards 5 -replicationFactor 3 -n store

* zookeeper의 collections/store에 생성된다.

(http://gsda1:8080/solr/#/~cloud?view=tree로 확인 가능함, collections밑에 store폴더가 있고 그 밑에 설정파일이 있음)

* HDFS에 연동하는 경우에는 collection생성시 -shards, -repliationFactor값을 1로 주어야 "lock"관련 오류가 발생하지 않는다.

(물론 data를 파일에 저장하도록 설정하는 경우에는 서버 마다의 HDD를 가지고 있으므로 shard개수를 2이상 지정하는것이 맞다.)

* 이렇게 되면 replication은 HDFS가 제공하는 복제기능으로 커버가능할거 같은데.. sharding은 지원하지 못하는 건가??

* 여러 서버에서 solr 인스턴스를 각각 실행하면 query의 패더레이션과 분산은 가능하겠지??

8. sample data 등록하기

http://localhost:8080/solr/store/update/bulk?commit=true

&update.contentType=application/n-triples

&stream.file=/tmp/solrdf-download/solrdf/solrdf-integration-tests/src/test/resources/sample_data/bsbm-generated-dataset.nt

9. sparql로 data확인하기

curl "http://127.0.0.1:8080/solr/store/sparql"

--data-urlencode "q=SELECT (count(?s) as ?cnt) WHERE { ?s ?p ?o }"

-H "Accept: application/sparql-results+json"

* 참고 : 8080포트에 작동중인 인스턴스 stop : bin/solr stop -p 8080 

---------오류내용(collection생성시 shard를 2이상 지정하고 solr인스턴스 기동시 아래와 같은 오류가 발생됨)----------------------

SolrCore Initialization Failures
store: org.apache.solr.common.SolrException:org.apache.solr.common.SolrException: Index locked for write for core 'store'. Solr now longer supports forceful unlocking via 'unlockOnStartup'. Please verify locks manually!
Please check your logs for more information
Log4j (org.slf4j.impl.Log4jLoggerFactory)

Time (Local)	Level	Core	Logger	Message
2016. 4. 27. 오후 4:39:45	WARN	null	NativeCodeLoader	Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
2016. 4. 27. 오후 4:39:45	ERROR	null	SolrCore	[store] Solr index directory 'hdfs://mycluster/user/root/solr/solrdf/store/data/index/' is locked. Throwing exception.
2016. 4. 27. 오후 4:39:46	ERROR	null	CoreContainer	Error creating core [store]: Index locked for write for core 'store'. Solr now longer supports forceful unlocking via 'unlockOnStartup'. Please verify locks manually!
2016. 4. 27. 오후 4:39:46	ERROR	null	CoreContainer	Error waiting for SolrCore to be created

이 게시물을

이 글의 추천인 목록 목록

번호	제목	날짜	조회 수
270	spark, kafka, mariadb, jena, springframework등을 이용하여 공통모듈을 jar로 만들기 위한 build.gradle파일(참고용)	2016.08.19	3419
269	kafka 0.9.0.1버젼의 producer와 kafka버젼이 0.10.0.1인 consumer가 서로 대화하는 모습	2016.08.18	3357
268	build.gradle을 pom.xml로 변환하는 방법	2016.08.18	5018
267	Jena는 기본적으로 multi thread환경을 지원하지 않는다.	2016.08.16	3337
266	down된 broker로 메세지를 전송하려는 경우의 오류 내용및 조치사항	2016.08.12	2732
265	여러가지 방법으로 특정 jar파일을 exclude하지 못하는 경우 해당 jar파일을 제외시키는 방법	2016.08.11	2331
264	jar파일의 dependency찾는 프로그램	2016.08.11	2528
263	compile할때와 exclude할때 대상을 표현하는 명칭이 다르므로 주의할것	2016.08.10	3451
262	외부 jar파일을 만들려고하는jar파일의 package로 포함하는 방법	2016.08.10	2106
261	servlet-api를 jar형태로 build할때 포함하지 말고 java 설치 위치의 jre/lib/ext에 복사하여 사용하는것이 좋다.	2016.08.10	2840
260	[Elephas] Jena Elephas를 이용하여 Spark에서 rdfTriples의 RDD를 만들고 RDD관련 작업하는 샘플소스	2016.08.10	3239
259	로컬의 라이브러리파일들을 dependency에 포함시키는 방법	2016.08.09	3254
258	gradle을 이용하여 jar파일 생성시 provided속성을 지정할 수 있게 설정하는 방법	2016.08.09	3199
257	[SBT] assembly시 "[error] deduplicate: different file contents found in the following:"오류 발생시 조치사항	2016.08.04	4490
256	[SBT] SBT 사용법 정리(링크)	2016.08.04	3262
255	[SBT] project.sbt에 libraryDependencies에 필요한 jar를 지정했으나 sbt compile할때 클래스를 못찾는 오류가 발생했을때 조치사항	2016.08.03	3808
254	build할때 unmappable character for encoding MS949 에러 발생시 조치사항	2016.08.03	4246
253	kafkaWordCount.scala의 producer와 consumer 클래스를 이용하여 kafka를 이용한 word count 테스트 하기	2016.08.02	3562
252	bin/start-hbase.sh실행시 org.apache.hadoop.hbase.util.FileSystemVersionException: HBase file layout needs to be upgraded오류가 발생하면 조치사항	2016.08.01	3370
251	start-all.sh로 spark데몬 기동시 "JAVA_HOME is not set"오류 발생시 조치사항	2016.08.01	4093

쓰기 태그

첫 페이지 20 21 22 23 24 25 26 27 28 29 끝 페이지

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.

Solr+SolRDF solrcloud에 solrdf1.1설치하고 테스트 하기

0. solr를 설치한다 : solrdf1.1과 호환되는 solr버젼은 5.3.1이므로 이것을 설치할것)

1. /tmp로 이동하여 git로 소스를 다운받고 빌드한다.

2. solrdf용 solrconfig.xml을 수정하여 HDFS에 저장할 수 있도록 함

3. build결과 폴더를 실행디렉토리로 복사하고 링크를 생성한다.(solr cluster모든 서버에 복사하고 설정해야함)

4. 환경변수를 설정한다.(solr cluster 모든 서버에 설정)

5. zookeeper에 새로운 solrdf용 config정보 upload(최초한번)

6. solrdf 기동(8080포트로 새로운 solr인스턴스를 기동하게된다)(모든 solr cluster서버에서 실행)

7. "store"라는 collection생성하기(최초 한번) - ZK에 있는 configs/store에 있는 config정보를 활용함

8. sample data 등록하기

9. sparql로 data확인하기

댓글 0

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.

Solr+SolRDF solrcloud에 solrdf1.1설치하고 테스트 하기

0. solr를 설치한다 : solrdf1.1과 호환되는 solr버젼은 5.3.1이므로 이것을 설치할것)

1. /tmp로 이동하여 git로 소스를 다운받고 빌드한다.

2. solrdf용 solrconfig.xml을 수정하여 HDFS에 저장할 수 있도록 함

3. build결과 폴더를 실행디렉토리로 복사하고 링크를 생성한다.(solr cluster모든 서버에 복사하고 설정해야함)

4. 환경변수를 설정한다.(solr cluster 모든 서버에 설정)

5. zookeeper에 새로운 solrdf용 config정보 upload(최초한번)

6. solrdf 기동(8080포트로 새로운 solr인스턴스를 기동하게된다)(모든 solr cluster서버에서 실행)

7. "store"라는 collection생성하기(최초 한번) - ZK에 있는 configs/store에 있는 config정보를 활용함

8. sample data 등록하기

9. sparql로 data확인하기

댓글 0

LOGIN