메뉴 건너뛰기

Bigdata, Semantic IoT, Hadoop, NoSQL

Bigdata, Hadoop ecosystem, Semantic IoT등의 프로젝트를 진행중에 습득한 내용을 정리하는 곳입니다.
필요한 분을 위해서 공개하고 있습니다. 문의사항은 gooper@gooper.com로 메일을 보내주세요.



0. RDF4J의 rdf4j-server.war가 제공하는 RESTFul API를 이용하여 repository에 대해서 triple(statement) data를 이용하여 CRUD operation하는 방법을 기록한다(많은 부분에서 일부만 정리함).(POSTMAN등의 툴을 이용하여 호출한다, 리포지토리명 : gTest)

(*참조 : http://docs.rdf4j.org/rest-api/#_repository_queries)


* Content-Type은 Body값(data)에 따라서 다르게 지정해야함

가. text/plain;charset=UTF-8 : triple data는 text형태로 1개만 지정 가능함

나. application/x-turtle;charset=UTF-8 : triple data를 text형태로 여러개 지정 가능함

다. text/turtle;charset=UTF-8 : triple data를 text형태로 여러개 지정 가능함

라. application/rdf+xml;charset=UTF-8 : post data를 rdf+xml로 지정해야함


* 주석은 #을 이용함


1. 데이타(statements 혹은 triples) 등록/수정

 가. POST방식으로 입력

 - URL : http://www.gooper.com/rdf4j-server/repositories/gTest/statements

 - METHOD : POST

 - HEADERS : Content-Type-> application/x-turtle;charset=UTF-8

 - BODY : 등록할 triple data

 - 수행결과 : HTTP/1.1 204 NO CONTENT


    : 여러개의 triple입력 가능함(triple 끝에는 각각 .을 찍어줄것)

    : body에 등록할 데이타를 triple형태로 나열함

    : 동일한것은 무시하고 새로운것만 등록함

    : ?s ?p가 동일하고 ?o가 다른 경우는 ?o의 값을 update하지 않고 새로운 statement로 입력함.


 나. PUT방식으로 입력(전체 데이타를 지우고 PUT에서 지정된 data를 입력하는 경우가 대부분이고 가끔 정상적으로 동작함)

 - URL : http://www.gooper.com/rdf4j-server/repositories/gTest/statements

 - METHOD : PUT

 - HEADERS : Content-Type-> application/x-turtle;charset=UTF-8

 - BODY : 등록할 triple data

 - 수행결과 : 없음


    : 여러개의 triple지정 가능함 (triple 끝에는 각각 .을 찍어줄것)

    : ?s ?p가 같고 ?o가 다른 경우는 새롭게 등록하지 않고 ?o값을 update함.


 다. SPARQL 1.1의 Update string에 설명되어 있는 update수행  <- sample로 기록한 내용은 실행되나 언제 쓰는건지 모르겟음

 - URL : http://www.gooper.com/rdf4j-server/repositories/gTest/statements

 - METHOD : POST

 - HEADERS : Content-Type-> application/x-www-form-urlencoded

 - BODY : update=INSERT%20{?s%20?p%20?o}%20WHERE%20{?s%20?p%20?o}

 - 수행결과 : HTTP/1.1 204 NO CONTENT


 라. BODY에 나열된 데이타를 단일 transaction으로 취급하여 POST 수행 <- sample로 기록한 내용은 실행되나 오류가 1건있는 데이타 포함 총 2건의 triple data로 테스트 하면 오류없는 1건만 등록됨

 - URL : http://www.gooper.com/rdf4j-server/repositories/gTest/statements

 - METHOD : POST

 - HEADERS : Content-Type-> application/x-rdftransaction(?) -> text/plain으로 지정해야 text로 기록된 데이타를 정상처리함

 - BODY : triple 데이타 목록

 - 수행결과 : HTTP/1.1 204 NO CONTENT


2. 데이타 조회

 가. GET방식으로 ?s ?p ?o를 지정하여 조회하기

 - URL : http://www.gooper.com/rdf4j-server/repositories/gTest?query=select%20*%20where%20%7B%3Chttp%3A%2F%2Fwww.gooper.com%2Fgooper%3E%20%3Fp%20%3Fo%7D&limit_query=100&infer=true&queryLn=SPARQL&

 - METHOD : GET (GET, POsT모두 사용가능하며 URL-encoded값이 GET의 길이를 넘어가는 경우 POST를 사용하고 POST를 사용하는 경우는 Content-Type을 www-form-urlencoded로 지정해야한다)

 - HEADERS : Accept-> application/sparql-results+xml, */*;q=0.5

 - BODY : 없음

 - 수행결과 : 조회결과

<?xml version='1.0' encoding='UTF-8'?>
<sparql xmlns='http://www.w3.org/2005/sparql-results#'>
    <head>
        <variable name='p'/>
        <variable name='o'/>
    </head>
    <results>
        <result>
            <binding name='p'>
                <uri>http://www.gooper.com/hasName1</uri>
            </binding>
            <binding name='o'>
                <uri>http://www.gooper.com/parksanghyeon1</uri>
            </binding>
        </result>
    </results>
</sparql>


     : 호출할때 query부분은 sparql문장을 사용하며 반드시 URL encoding해서 지정해야한다.

     : limit_query=100는 리턴되는 결과 개수를 100개로 제한한다.

     : infer=true는 추론을 수행여부를 true로 설정한다.

     : queryLn=SPARQL은 sparql로 쿼리를 수행한다고 표시함

     : distinct=true는 distinct 적용여부를 true로 설정

     : timeout=0, maximum query수행시간을 초단위로 지정한다. 0(defualt)는 제한없음.

     : offset=10, query결과에서 skip할 개수를 지정한다.

     : $<varname>, 바인딩한 변수를 지정한다. sparql에서 바인딩으로 지정한 변수가 있으면 여기서 지정한 값으로 치환한다.


 나. 전체를 조회하는 경우 : GET방식으로 인수를 지정하지 않고 호출하면 전체 데이타가 리턴됨

 - URL : http://www.gooper.com/rdf4j-server/repositories/gTest/statements

 - METHOD : GET

 - HEADERS : Accept->application/rdf+xml

 - BODY : 없음

 - 수행결과 : gTest가 가지고 있는 전체 data

            HTTP/1.1 200 OK
            Content-Type: application/rdf+xml;charset=UTF-8

            [RDF/XML ENCODED RDF DATA]


3. 데이타 삭제

 가. ?s 지정 : ?s를 지정하여 ?s에 해당되는 모든 데이타 삭제

 - URL : http://www.gooper.com/rdf4j-server/repositories/gTest/statements?subj=<http://www.gooper.com/gooper>

 - METHOD : DELETE

 - HEADERS : 없음

 - BODY : 없음

 - 수행결과 : HTTP/1.1 204 NO CONTENT


 나. ?s ?p 지정 : ?s ?p를 지정하여 ?s ?p에 해당되는 모든 데이타 삭제

 - URL : http://www.gooper.com/rdf4j-server/repositories/gTest/statements?subj=<http://www.gooper.com/gooper>&pred=<http://www.gooper.com/hasName1>

 - METHOD : DELETE

 - HEADERS : 없음

 - BODY : 없음

 - 수행결과 : HTTP/1.1 204 NO CONTENT


 다. ?s ?p ?o 지정 : ?s ?p ?o를 지정하여 ?s ?p ?o에 해당되는 모든 데이타 삭제

 - URL : http://www.gooper.com/rdf4j-server/repositories/gTest/statements?subj=<http://www.gooper.com/gooper>&pred=<http://www.gooper.com/hasName1>&obj=<http://www.gooper.com/parksanghyeon>

 - METHOD : DELETE

 - HEADERS : 없음

 - BODY : 없음

 - 수행결과 : HTTP/1.1 204 NO CONTENT


 라. 전체데이타 삭제 : gTest의 전체 데이타 삭제

 - URL : http://www.gooper.com/rdf4j-server/repositories/gTest/statements

 - METHOD : DELETE

 - HEADERS : 없음

 - BODY : 없음

 - 수행결과 : HTTP/1.1 204 NO CONTENT




번호 제목 글쓴이 날짜 조회 수
461 Namenode Metadata백업하는 방법 총관리자 2020.02.10 369
460 HUE를 사용할 사용자를 추가 하는 절차 총관리자 2018.05.29 367
459 hadoop클러스터를 구성하던 서버중 HA를 담당하는 서버의 hostname등이 변경되어 문제가 발생했을때 조치사항 총관리자 2016.07.29 363
458 root계정으로 MariaDB설치후 mysql -u root -p로 db에 접근하여 바로 해줘야 하는일..(케릭터셑은 utf8) 총관리자 2015.10.02 361
457 HDFS상의 /tmp폴더에 Permission denied오류가 발생시 조치사항 총관리자 2017.01.25 360
456 기준일자 이전의 hdfs 데이타를 지우는 shellscript 샘플 총관리자 2019.06.14 359
455 TransmitData() to failed: Network error: Recv() got EOF from remote (error 108) 오류 현상 총관리자 2019.02.15 358
454 git설명 한글판 총관리자 2015.12.09 358
453 impala,hive및 hdfs만 접근가능하고 파일을 이용한 테이블생성가능하도록 hue 권한설정설정 총관리자 2018.09.17 356
452 Ubuntu 16.04 LTS에서 사이트에 무료인증서를 이용하여 SSL적용 file 총관리자 2017.05.23 354
451 linux에서 특정 포트를 사용하는 프로세스 확인하기 총관리자 2017.04.26 350
450 [kudu]테이블 drop이 안되고 timeout이 걸리는 경우 조치 방법 총관리자 2020.06.08 347
449 Hive MetaStore Server기동시 Could not create "increment"/"table" value-generation container SEQUENCE_TABLE since autoCreate flags do not allow it. 오류발생시 조치사항 총관리자 2017.05.03 347
448 Apache Spark와 Drools를 이용한 CEP구현 테스트 총관리자 2016.07.15 342
447 [sqoop] mapper를 2이상으로 설정하기 위한 split-by컬럼을 찾을때 유용하게 활용할 수 있는 쿼리 총관리자 2020.05.13 339
446 쿠버네티스(k8s) 설치 및 클러스터 구성하기 총관리자 2019.10.19 337
445 embedded-cassandra의 data 저장위치 총관리자 2019.06.09 336
444 sentry설정후 beeline으로 hive2server에 접속하여 admin계정에 admin권한 부여하기 총관리자 2018.07.03 336
443 Cleaning up the staging area file시 'cannot access' 혹은 'Directory is not writable' 발생시 조치사항 총관리자 2017.05.02 336
442 python2.7.4에서 Oracle DB(11.2)를 사용하기 위한 설정(RPM을 이용하여 RHEL 7.4에 설치) 총관리자 2021.11.26 334

A personal place to organize information learned during the development of such Hadoop, Hive, Hbase, Semantic IoT, etc.
We are open to the required minutes. Please send inquiries to gooper@gooper.com.

위로