Bigdata, Hadoop ecosystem, Semantic IoT등의 프로젝트를 진행중에 습득한 내용을 정리하는 곳입니다.
필요한 분을 위해서 공개하고 있습니다.
문의사항은 gooper@gooper.com로 메일을
보내주세요.
oozie의 action에 user_retry및 retry_interval을 지정하여 작업이 바로 종료되지 않고 일정 시간 대기하도록 할 수 있는데.. 이때 L4가 round robin형태로 처리하면 retry간격이 일정하지 않게 짧아지는 문제가 있다.
이는 action 수행 순서인 Start action->call for action->Preparing retry가 각각 다른 oozie서버에서 수행되면서 retry간격을 정확히 측정하지 못하는 문제가 있다.
특히 선행 retry에서 Start action과 call for action은 반드시 같은 서버에서 수행되고 다음 retry도 같은 oozie서버에서 수행되어야 문제 없이 정해진 시간만큼 wait시킬 수 있다 .
예를 들어 아래와 같은 ooze log상의 작업이 진행되면..
17회와 18회 사이는 지정된 시간만큼 정확하게 wait이 되지만 18회와 19회 사이는 원하는 만큼의 시간만큼 wait하지 못한다.
userRetryCount[17]
->Start action(oozie#1)
->callback for action(oozie#1)
->Preparing retry(oozie#1, callback for action서버와 같음)
userRetryCount[18]
->Start action(oozie#1)
->callback for action(oozie#2)
->Preparing retry(oozie#2, callback for action서버와 같음)
userRetryCount[19]
->Start action(oozie#1)
->callback for action(oozie#2)
->Preparing retry(oozie#2, callback for action서버와 같음)
댓글 0
번호 | 제목 | 글쓴이 | 날짜 | 조회 수 |
---|---|---|---|---|
400 | insert hbase by hive ... error occured after 5 hours..HMaster가 뜨지 않는 장애에 대한 복구 방법 | 총관리자 | 2014.04.29 | 7129 |
399 | oozie가 말하는 start시간은..서버에서 확인되는 시간이 아닙니다. | 총관리자 | 2014.05.14 | 699 |
398 | sqoop export/import등을 할때 driver를 못찾는 오류가 발생하면... | 총관리자 | 2014.05.15 | 867 |
397 | sqoop에서 oracle관련 작업할때 테이블명, 사용자명, DB명은 모두 대문자로 사용할것 | 총관리자 | 2014.05.15 | 1528 |
396 | dual table만들기 | 총관리자 | 2014.05.16 | 825 |
395 | 특정파일이 생성되어야 action이 실행되는 oozie job만들기(coordinator.xml) | 총관리자 | 2014.05.20 | 984 |
394 | source의 type을 spooldir로 하는 경우 해당 경로에 파일이 들어오면 파일단위로 전송함 | 총관리자 | 2014.05.20 | 687 |
393 | hive에서 insert overwrite directory.. 로 하면 default column구분자는 'SOH'혹은 't'가 됨 | 총관리자 | 2014.05.20 | 999 |
392 | import 혹은 export할때 hive파일의 default 구분자는 --input-fields-terminated-by " |