Bigdata, Hadoop ecosystem, Semantic IoT등의 프로젝트를 진행중에 습득한 내용을 정리하는 곳입니다.
필요한 분을 위해서 공개하고 있습니다. 문의사항은 gooper@gooper.com로 메일을 보내주세요.

Spark+S2RDF S2RDF모듈의 실행부분만 추출하여 별도록 실행하는 방법(draft)

총관리자 2016.06.14 17:07 조회 수 : 36

-----아래는 S2RDF가 제시한 *.py프로그램(테스트 목적으로만 만드어져 있어서 실제 사용할 수 없음)을 사용하지 않고 직접 java나 spark-submit을 호출하여 작업하는 방법을 기록함

--------------------DataSetCreator(동록하려는 data(test2.nq)는 HDFS상의 s2rdf폴더 밑에 존재 해야함, /home/hadoop/DataSetCreator에서 실행)-------------------------------------

1. Generate Vertical Partitioning

$HOME/spark/bin/spark-submit --driver-memory 1g --class runDriver --master yarn --executor-memory 1g --deploy-mode cluster ./datasetcreator_2.10-1.1.jar s2rdf/ test2.nq VP 0.2

==> /tmp/stat_vp.txt가 만들어짐

2. Generate Exteded Vertical Partitioning subset SO

$HOME/spark/bin/spark-submit --driver-memory 1g --class runDriver --master yarn --executor-memory 1g --deploy-mode cluster ./datasetcreator_2.10-1.1.jar s2rdf/ test2.nq SO 0.2

==> /tmp/stat_so.txt가 만들어짐

3. Generate Exteded Vertical Partitioning subset OS

$HOME/spark/bin/spark-submit --driver-memory 1g --class runDriver --master yarn --executor-memory 1g --deploy-mode cluster ./datasetcreator_2.10-1.1.jar s2rdf/ test2.nq OS 0.2

==> /tmp/stat_os.txt가 만들어짐

4. Generate Exteded Vertical Partitioning subset SS

$HOME/spark/bin/spark-submit --driver-memory 1g --class runDriver --master yarn --executor-memory 1g --deploy-mode cluster ./datasetcreator_2.10-1.1.jar s2rdf/ test2.nq SS 0.2

==> /tmp/stat_ss.txt가 만들어짐

----------------------QueryTranslator(data/하위 파일(DataSetCreator과정을 통해서 만들어짐)은 모두 OS파일로 존재함), /home/hadoop/QueryTranslator/S2RDF_QueryTranslator에서 실행)------------------------

java -jar /home/hadoop/QueryTranslator/S2RDF_QueryTranslator/queryTranslator-1.1.jar -i data/sparql.in -o data/sparql.in -sd data/statistics/ -sUB 0.2

===>

VP STAT Size = 86

OS STAT Size = 353

SO STAT Size = 353

SS STAT Size = 1702

THE NUMBER OF ALL SAVED (< ScaleUB) TRIPLES IS -> 1311014421

THE NUMBER OF ALL SAVED (< ScaleUB) TABLES IS -> 2127

TABLE-><gr__offers>

TABLE-><foaf__homepage>

TABLE-><sorg__author>

TABLE-><wsdbm__friendOf>

TABLE-><wsdbm__likes>

TABLE-><sorg__language>

TABLE-><rev__hasReview>

TABLE-><rev__reviewer>

TABLE-><wsdbm__follows>

TABLE-><gr__includes>

* QueryTranslator실행 위치의 폴더구조(여기서 실행해도 실제 사용되는 것은 data폴더와 queryTranslator-1.1.jar파일이다.)

-bash-4.1$ ll

합계 20192

-rw-rw-r--. 1 hadoop hadoop 0 2016-06-13 15:30 HiveSPARQL_error.log

drwxrwxr-x. 3 hadoop hadoop 4096 2016-06-13 15:36 data

drwxrwxr-x. 2 hadoop hadoop 4096 2016-05-26 18:46 lib

-rw-rw-r--. 1 hadoop hadoop 20661741 2016-04-04 22:34 queryTranslator-1.1.jar

drwxrwxr-x. 3 hadoop hadoop 4096 2016-05-26 18:46 src

-bash-4.1$ ll -R data

data:

합계 16

-rw-rw-r--. 1 hadoop hadoop 0 2016-06-13 15:28 HiveSPARQL_error.log

-rw-rw-r--. 1 hadoop hadoop 730 2015-08-17 17:07 sparql.in

-rw-rw-r--. 1 hadoop hadoop 1821 2016-06-13 15:36 sparql.in.log

-rw-rw-r--. 1 hadoop hadoop 1889 2016-06-13 15:36 sparql.in.sql

drwxrwxr-x. 2 hadoop hadoop 4096 2016-05-26 18:46 statistics

data/statistics:

합계 132

-rw-rw-r--. 1 hadoop hadoop 19129 2015-08-17 17:07 stat_os.txt

-rw-rw-r--. 1 hadoop hadoop 18910 2015-08-17 17:07 stat_so.txt

-rw-rw-r--. 1 hadoop hadoop 89774 2015-08-17 17:07 stat_ss.txt

-rw-rw-r--. 1 hadoop hadoop 3419 2015-08-17 17:07 stat_vp.txt

=====새로운 QueryTranslator=======>

java -jar /home/hadoop/QueryTranslator/S2RDF_QueryTranslator/queryTranslator-1.1.jar -i ./test2/test2.sparql -o ./test2/test2.sparql -sd ./test2/statistics/ -sUB 0.2

-bash-4.1$ mkdir ./test2/statistics

-bash-4.1$ touch ./test2/statistics/stat_vp.txt

-bash-4.1$ touch ./test2/statistics/stat_os.txt

-bash-4.1$ touch ./test2/statistics/stat_so.txt

-bash-4.1$ touch ./test2/statistics/stat_ss.txt

==> ./test2/폴더 밑에 test2.sparql.sql로 sql파일이 생성됨

------------------------QueryExecutor(/home/hadoop/QueryExecutor에서 실행)--------------------------------------

$HOME/spark/bin/spark-submit --driver-memory 2g --class runDriver --master yarn --executor-memory 1g --deploy-mode cluster --files ./IL5-1-U-1--SO-OS-SS-VP__WatDiv1M.sql ./queryexecutor_2.10-1.1.jar WatDiv1M IL5-1-U-1--SO-OS-SS-VP__WatDiv1M.sql > ./QueryExecutor.err

$HOME/spark/bin/spark-submit --driver-memory 2g --class runDriver --master yarn --executor-memory 1g --deploy-mode cluster --files /home/hadoop/QueryTranslator/S2RDF_QueryTranslator/data/sparql.in.sql ./queryexecutor_2.10-1.1.jar s2rdf sparql.in.sql

$HOME/spark/bin/spark-submit --driver-memory 2g --class runDriver --master yarn --executor-memory 1g --deploy-mode cluster --files ./sparql.in__s2rdf.sql ./queryexecutor_2.10-1.1.jar s2rdf sparql.in__s2rdf.sql

---------새로운 QueryExecutor---------------------------------------------------------

$HOME/spark/bin/spark-submit --driver-memory 2g --class runDriver --master yarn --executor-memory 1g --deploy-mode cluster --files /home/hadoop/QueryExecutor/test2/test2.sparql.sql ./queryexecutor_2.10-1.1.jar s2rdf test2.sparql.sql

==> select 결과값이 /tmp/table명/results.txt와 table명/resultTimes.txt파일로 생성됨

이 게시물을

번호	제목	글쓴이	날짜	조회 수
241	Toree 0.1.0-incubating이 Scala 2.10.4까지만 지원하게 되어서 발생하는 NoSuchMethod오류 문제 해결방법(scala 2.11.x을 지원하지만 오류가 발생할 수 있음)	총관리자	2018.04.20	110
240	딥러닝 수학/알고리즘 '한국어' 강의	총관리자	2016.04.10	110
239	kudu 테이블 metadata강제 삭제시 발생하는 오류 메세지	총관리자	2022.01.12	109
238	https용 인증서 발급 명령문 예시및 오류 메세지	총관리자	2018.01.24	109
237	impala external 테이블 생성시 컬럼과 라인 구분자를 지정하여 테이블 생성하는 예시	총관리자	2020.02.20	108
236	hue.axes_accessattempt테이블 데이터 샘플	총관리자	2020.02.10	108
235	elasticsearch 1.3.0에서 rdf및 hadoop plugin설치	총관리자	2016.04.06	108
234	collection생성혹은 collection조회시 Plugin init failure for [schema.xml] fieldType "pdate": Error loading class 'solr.IntField' 오류 조치사항	총관리자	2022.04.07	107
233	.gitignore파일에 지정되지 않은 파일이 ignore되는 경우 확인방법	총관리자	2016.11.22	107
232	[Impala TLS/SSL이슈]RangerAdminRESTClient.java:151] Failed to get response, Error is: TrustManager is not specified	gooper	2023.02.02	106
231	컴퓨터 무한 재부팅 원인및 조치방법	총관리자	2017.12.05	106
230	spark 2.0.0를 windows에서 실행시 로컬 파일을 읽을때 발생하는 오류 해결 방법	총관리자	2017.01.12	106
229	[SparkR]SparkR 설치 사용기 1 - Installation Guide On Yarn Cluster & Mesos Cluster & Stand Alone Cluster	총관리자	2016.11.04	106
228	[AD(LADP)] CDP1.7에서 AD및 Kerberos를 연동해도 각 노드에 os account, os group은 생성되어야 하지만 SSSD서비스를 이용하면 직접 생성될 필요가 없다.	gooper	2022.06.10	105
227	Hue Load Balancer를 L4로 L/B하는 경우는 L4쪽 도멘인으로 발행된 인증서를 TLS/SSL항목에 설정해주어야 한다.	총관리자	2021.10.08	104
226	TopBraid Composer에서 SPIN 사용법	총관리자	2016.02.25	104
225	https://github.com/Merck/Halyard프로젝트 컴파일및 배포/테스트	총관리자	2017.01.24	103
224	fuseki의 endpoint를 이용한 insert, delete하는 sparql예시	총관리자	2018.02.14	102
223	RDF storage조합에대한 test결과(4store, Jena+HBase, Hive+HBase, CumulusRDF, Couchbase) 페이지 링크	총관리자	2016.05.26	102
222	Class.forName을 이용한 메서드 호출 샘플소스	총관리자	2016.12.21	100

쓰기 태그

첫 페이지 21 22 23 24 25 26 27 28 29 30 끝 페이지

A personal place to organize information learned during the development of such Hadoop, Hive, Hbase, Semantic IoT, etc.
We are open to the required minutes. Please send inquiries to gooper@gooper.com.

Bigdata, Semantic IoT, Hadoop, NoSQL

Bigdata, Hadoop ecosystem, Semantic IoT등의 프로젝트를 진행중에 습득한 내용을 정리하는 곳입니다.
필요한 분을 위해서 공개하고 있습니다. 문의사항은 gooper@gooper.com로 메일을 보내주세요.

Spark+S2RDF S2RDF모듈의 실행부분만 추출하여 별도록 실행하는 방법(draft)

댓글 0

A personal place to organize information learned during the development of such Hadoop, Hive, Hbase, Semantic IoT, etc.
We are open to the required minutes. Please send inquiries to gooper@gooper.com.

Bigdata, Semantic IoT, Hadoop, NoSQL

Bigdata, Hadoop ecosystem, Semantic IoT등의 프로젝트를 진행중에 습득한 내용을 정리하는 곳입니다. 필요한 분을 위해서 공개하고 있습니다. 문의사항은 gooper@gooper.com로 메일을 보내주세요.

Spark+S2RDF S2RDF모듈의 실행부분만 추출하여 별도록 실행하는 방법(draft)

댓글 0

A personal place to organize information learned during the development of such Hadoop, Hive, Hbase, Semantic IoT, etc. We are open to the required minutes. Please send inquiries to gooper@gooper.com.

LOGIN

Bigdata, Hadoop ecosystem, Semantic IoT등의 프로젝트를 진행중에 습득한 내용을 정리하는 곳입니다.
필요한 분을 위해서 공개하고 있습니다. 문의사항은 gooper@gooper.com로 메일을 보내주세요.

A personal place to organize information learned during the development of such Hadoop, Hive, Hbase, Semantic IoT, etc.
We are open to the required minutes. Please send inquiries to gooper@gooper.com.