메뉴 건너뛰기

Bigdata, Semantic IoT, Hadoop, NoSQL

Bigdata, Hadoop ecosystem, Semantic IoT등의 프로젝트를 진행중에 습득한 내용을 정리하는 곳입니다.
필요한 분을 위해서 공개하고 있습니다. 문의사항은 gooper@gooper.com로 메일을 보내주세요.



0. RDF4J의 rdf4j-server.war가 제공하는 RESTFul API를 이용하여 repository에 대해서 triple(statement) data를 이용하여 CRUD operation하는 방법을 기록한다(많은 부분에서 일부만 정리함).(POSTMAN등의 툴을 이용하여 호출한다, 리포지토리명 : gTest)

(*참조 : http://docs.rdf4j.org/rest-api/#_repository_queries)


* Content-Type은 Body값(data)에 따라서 다르게 지정해야함

가. text/plain;charset=UTF-8 : triple data는 text형태로 1개만 지정 가능함

나. application/x-turtle;charset=UTF-8 : triple data를 text형태로 여러개 지정 가능함

다. text/turtle;charset=UTF-8 : triple data를 text형태로 여러개 지정 가능함

라. application/rdf+xml;charset=UTF-8 : post data를 rdf+xml로 지정해야함


* 주석은 #을 이용함


1. 데이타(statements 혹은 triples) 등록/수정

 가. POST방식으로 입력

 - URL : http://www.gooper.com/rdf4j-server/repositories/gTest/statements

 - METHOD : POST

 - HEADERS : Content-Type-> application/x-turtle;charset=UTF-8

 - BODY : 등록할 triple data

 - 수행결과 : HTTP/1.1 204 NO CONTENT


    : 여러개의 triple입력 가능함(triple 끝에는 각각 .을 찍어줄것)

    : body에 등록할 데이타를 triple형태로 나열함

    : 동일한것은 무시하고 새로운것만 등록함

    : ?s ?p가 동일하고 ?o가 다른 경우는 ?o의 값을 update하지 않고 새로운 statement로 입력함.


 나. PUT방식으로 입력(전체 데이타를 지우고 PUT에서 지정된 data를 입력하는 경우가 대부분이고 가끔 정상적으로 동작함)

 - URL : http://www.gooper.com/rdf4j-server/repositories/gTest/statements

 - METHOD : PUT

 - HEADERS : Content-Type-> application/x-turtle;charset=UTF-8

 - BODY : 등록할 triple data

 - 수행결과 : 없음


    : 여러개의 triple지정 가능함 (triple 끝에는 각각 .을 찍어줄것)

    : ?s ?p가 같고 ?o가 다른 경우는 새롭게 등록하지 않고 ?o값을 update함.


 다. SPARQL 1.1의 Update string에 설명되어 있는 update수행  <- sample로 기록한 내용은 실행되나 언제 쓰는건지 모르겟음

 - URL : http://www.gooper.com/rdf4j-server/repositories/gTest/statements

 - METHOD : POST

 - HEADERS : Content-Type-> application/x-www-form-urlencoded

 - BODY : update=INSERT%20{?s%20?p%20?o}%20WHERE%20{?s%20?p%20?o}

 - 수행결과 : HTTP/1.1 204 NO CONTENT


 라. BODY에 나열된 데이타를 단일 transaction으로 취급하여 POST 수행 <- sample로 기록한 내용은 실행되나 오류가 1건있는 데이타 포함 총 2건의 triple data로 테스트 하면 오류없는 1건만 등록됨

 - URL : http://www.gooper.com/rdf4j-server/repositories/gTest/statements

 - METHOD : POST

 - HEADERS : Content-Type-> application/x-rdftransaction(?) -> text/plain으로 지정해야 text로 기록된 데이타를 정상처리함

 - BODY : triple 데이타 목록

 - 수행결과 : HTTP/1.1 204 NO CONTENT


2. 데이타 조회

 가. GET방식으로 ?s ?p ?o를 지정하여 조회하기

 - URL : http://www.gooper.com/rdf4j-server/repositories/gTest?query=select%20*%20where%20%7B%3Chttp%3A%2F%2Fwww.gooper.com%2Fgooper%3E%20%3Fp%20%3Fo%7D&limit_query=100&infer=true&queryLn=SPARQL&

 - METHOD : GET (GET, POsT모두 사용가능하며 URL-encoded값이 GET의 길이를 넘어가는 경우 POST를 사용하고 POST를 사용하는 경우는 Content-Type을 www-form-urlencoded로 지정해야한다)

 - HEADERS : Accept-> application/sparql-results+xml, */*;q=0.5

 - BODY : 없음

 - 수행결과 : 조회결과

<?xml version='1.0' encoding='UTF-8'?>
<sparql xmlns='http://www.w3.org/2005/sparql-results#'>
    <head>
        <variable name='p'/>
        <variable name='o'/>
    </head>
    <results>
        <result>
            <binding name='p'>
                <uri>http://www.gooper.com/hasName1</uri>
            </binding>
            <binding name='o'>
                <uri>http://www.gooper.com/parksanghyeon1</uri>
            </binding>
        </result>
    </results>
</sparql>


     : 호출할때 query부분은 sparql문장을 사용하며 반드시 URL encoding해서 지정해야한다.

     : limit_query=100는 리턴되는 결과 개수를 100개로 제한한다.

     : infer=true는 추론을 수행여부를 true로 설정한다.

     : queryLn=SPARQL은 sparql로 쿼리를 수행한다고 표시함

     : distinct=true는 distinct 적용여부를 true로 설정

     : timeout=0, maximum query수행시간을 초단위로 지정한다. 0(defualt)는 제한없음.

     : offset=10, query결과에서 skip할 개수를 지정한다.

     : $<varname>, 바인딩한 변수를 지정한다. sparql에서 바인딩으로 지정한 변수가 있으면 여기서 지정한 값으로 치환한다.


 나. 전체를 조회하는 경우 : GET방식으로 인수를 지정하지 않고 호출하면 전체 데이타가 리턴됨

 - URL : http://www.gooper.com/rdf4j-server/repositories/gTest/statements

 - METHOD : GET

 - HEADERS : Accept->application/rdf+xml

 - BODY : 없음

 - 수행결과 : gTest가 가지고 있는 전체 data

            HTTP/1.1 200 OK
            Content-Type: application/rdf+xml;charset=UTF-8

            [RDF/XML ENCODED RDF DATA]


3. 데이타 삭제

 가. ?s 지정 : ?s를 지정하여 ?s에 해당되는 모든 데이타 삭제

 - URL : http://www.gooper.com/rdf4j-server/repositories/gTest/statements?subj=<http://www.gooper.com/gooper>

 - METHOD : DELETE

 - HEADERS : 없음

 - BODY : 없음

 - 수행결과 : HTTP/1.1 204 NO CONTENT


 나. ?s ?p 지정 : ?s ?p를 지정하여 ?s ?p에 해당되는 모든 데이타 삭제

 - URL : http://www.gooper.com/rdf4j-server/repositories/gTest/statements?subj=<http://www.gooper.com/gooper>&pred=<http://www.gooper.com/hasName1>

 - METHOD : DELETE

 - HEADERS : 없음

 - BODY : 없음

 - 수행결과 : HTTP/1.1 204 NO CONTENT


 다. ?s ?p ?o 지정 : ?s ?p ?o를 지정하여 ?s ?p ?o에 해당되는 모든 데이타 삭제

 - URL : http://www.gooper.com/rdf4j-server/repositories/gTest/statements?subj=<http://www.gooper.com/gooper>&pred=<http://www.gooper.com/hasName1>&obj=<http://www.gooper.com/parksanghyeon>

 - METHOD : DELETE

 - HEADERS : 없음

 - BODY : 없음

 - 수행결과 : HTTP/1.1 204 NO CONTENT


 라. 전체데이타 삭제 : gTest의 전체 데이타 삭제

 - URL : http://www.gooper.com/rdf4j-server/repositories/gTest/statements

 - METHOD : DELETE

 - HEADERS : 없음

 - BODY : 없음

 - 수행결과 : HTTP/1.1 204 NO CONTENT




번호 제목 글쓴이 날짜 조회 수
141 "Initial job has not accepted any resources; check your cluster UI to ensure that workers are registered and have sufficient resources"오류 발생시 조치사항 총관리자 2016.05.25 1030
140 impala 설치/설정 총관리자 2016.06.03 1031
139 HBase 0.98.12(1.2.5) for hadoop2 설치-5대에 완전분산모드 (HDFS HA상테) 총관리자 2015.04.29 1047
138 Hive Query Examples from test code (1 of 2) 총관리자 2014.03.26 1050
137 external partition table생성및 data확인 총관리자 2014.04.03 1072
136 Ubuntu 16.04 LTS에 MariaDB 10.1설치 및 포트변경 및 원격접속 허용 총관리자 2017.05.01 1081
135 Building a Cluster docs 총관리자 2014.04.22 1083
134 mysql에서 외부 디비를 커넥션할 경우 접속 속도가 느려질때 총관리자 2017.06.30 1083
133 cloudera(python 2.7.5)에서 anaconda3로 설치한 외부 python(3.6.6)을 이용하여 pyspark를 사용하는 설정 총관리자 2018.09.14 1087
132 hive job실행시 meta정보를 원격의 mysql에 저장하는 경우 설정방법 총관리자 2014.05.28 1088
131 spark stream처리할때 두개의 client프로그램이 동일한 checkpoint로 접근할때 발생하는 오류 내용 총관리자 2018.01.16 1115
130 Ubuntu 16.04 LTS에서 sendmail설치및 설정(수신,발신 가능)및 메일서버 만들기 총관리자 2017.05.23 1119
129 로그 파일에 대해 Elasticsearch 사용하기 총관리자 2014.09.25 1121
128 sequence한 번호 생성방법 총관리자 2014.04.25 1123
127 CentOS의 서버 5대에 yarn(hadoop 2.7.2)설치하기-ResourceManager HA/HDFS HA포함, JobHistory포함 총관리자 2016.03.29 1138
126 json serde사용법 총관리자 2014.04.17 1140
125 호튼웍스 하둡을 검색엔진과 연동하는 방법과 아키텍쳐 총관리자 2014.09.25 1141
124 Caused by: java.net.URISyntaxException: Relative path in absolute URI: ${system:java.io.tmpdir%7D/$%7Bsystem:user.name%7D오류발생시 조치사항 총관리자 2016.06.03 1141
123 build.gradle을 pom.xml로 변환하는 방법 총관리자 2016.08.18 1161
122 Mybatis foreach 문법정리(상황에 따른 사용법) 총관리자 2015.11.10 1177

A personal place to organize information learned during the development of such Hadoop, Hive, Hbase, Semantic IoT, etc.
We are open to the required minutes. Please send inquiries to gooper@gooper.com.

위로