Bigdata, Hadoop ecosystem, Semantic IoT등의 프로젝트를 진행중에 습득한 내용을 정리하는 곳입니다.
필요한 분을 위해서 공개하고 있습니다.
문의사항은 gooper@gooper.com로 메일을
보내주세요.
1. coordinator.xml에서 아래와 같이 <datasets></datasets>을 추가해주면 <done-flag></done-flag>사이에 지정된 파일이 <uri-template></uri-template>사이의 경로에 생성되어야만 action이 실행되도록 할 수 있다.
-----------------------------------------------------------------coordinator.xml-------------------------------------------------------------------------------------
<coordinator-app name="${scenarioNo}-s-C" frequency="${coord:minutes(1)}" start="${startTime}" end="${endTime}"
timezone="UTC" xmlns="uri:oozie:coordinator:0.1">
<controls>
<concurrency>1</concurrency>
</controls>
<datasets>
<dataset name="logs" frequency="${coord:minutes(1)}"
initial-instance="${startTime}" timezone="UTC">
<uri-template>
${nameNode}/data1/cas/output/s1/${YEAR}/${MONTH}/${DAY}
</uri-template>
<done-flag>000000_0</done-flag>
</dataset>
</datasets>
<input-events>
<data-in name="input" dataset="logs">
<instance>${startTime2}</instance>
</data-in>
</input-events>
<action>
<workflow>
<app-path>${nameNode}/data1/cas/scenario/${scenarioNo}/sqoop</app-path>
<configuration>
<property>
<name>jobTracker</name>
<value>${jobTracker}</value>
</property>
<property>
<name>nameNode</name>
<value>${nameNode}</value>
</property>
<property>
<name>queueName</name>
<value>${queueName}</value>
</property>
<property>
<name>wfInput</name>
<value>${coord:dataIn('input')}</value>
</property>
<property>
<name>iyear</name>
<!-- <value>${coord:formatTime(coord:nominalTime(),"yyyy")}</value> -->
<value>${coord:formatTime(coord:actualTime(),"yyyy")}</value>
</property>
<property>
<name>imonth</name>
<!-- <value>${coord:formatTime(coord:nominalTime(),"MM")}</value> -->
<value>${coord:formatTime(coord:actualTime(),"MM")}</value>
</property>
<property>
<name>iday</name>
<!-- <value>${coord:formatTime(coord:nominalTime(),"dd")}</value> -->
<value>${coord:formatTime(coord:actualTime(),"dd")}</value>
</property>
</configuration>
</workflow>
</action>
</coordinator-app>
댓글 0
번호 | 제목 | 글쓴이 | 날짜 | 조회 수 |
---|---|---|---|---|
399 | insert hbase by hive ... error occured after 5 hours..HMaster가 뜨지 않는 장애에 대한 복구 방법 | 총관리자 | 2014.04.29 | 7129 |
398 | oozie가 말하는 start시간은..서버에서 확인되는 시간이 아닙니다. | 총관리자 | 2014.05.14 | 699 |
397 | sqoop export/import등을 할때 driver를 못찾는 오류가 발생하면... | 총관리자 | 2014.05.15 | 863 |
396 | sqoop에서 oracle관련 작업할때 테이블명, 사용자명, DB명은 모두 대문자로 사용할것 | 총관리자 | 2014.05.15 | 1528 |
395 | dual table만들기 | 총관리자 | 2014.05.16 | 822 |
» | 특정파일이 생성되어야 action이 실행되는 oozie job만들기(coordinator.xml) | 총관리자 | 2014.05.20 | 984 |
393 | source의 type을 spooldir로 하는 경우 해당 경로에 파일이 들어오면 파일단위로 전송함 | 총관리자 | 2014.05.20 | 687 |
392 | hive에서 insert overwrite directory.. 로 하면 default column구분자는 'SOH'혹은 't'가 됨 | 총관리자 | 2014.05.20 | 999 |
391 | import 혹은 export할때 hive파일의 default 구분자는 --input-fields-terminated-by " |