Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.
Kudu서비스의 WebUI(node01.gooper.com/8050)를 통해서 Tablets탭을 클릭하면 Tablet상황을 확인 할 수 있다.
정상적인 경우라면 Live Tablet Replicas->Summary의 Status가 모두 RUNNING상태여야 한다.
이 상태가 FAILED상태일 때 fail원인을 확인하려면 Live Table Replicas Summary밑에 Detail이 있는데 우측에 검색창이 있다.
여기에 failed를 입력하면 FAILED 상태의 tablet만 보여주는데 State항목을 보면 오류 상황을 확인할 수 있다.
Kudu WebUI는 tablet server별로 제공되므로 전체를 한번에 볼 수는 없고 각각의 tablet server에 접근해서 파악해야 전체 현황을 알 수 있다.
이경우 tablet server기동시 특정 메모리 상황등에 따른 오류가 발생하는것으로 kudu내부적으로 다른 tablet server에 복사하는 방법으로 복구되므로 관련 table을 select해봐서 사용 가능하다면 문제없는것이다.
*오류 발생 예시
: kudu table의 range partition을 지정(RANGE (acol) PARTITION "1" <= VALUES < "1\000")할 때 잘못하여 '\'가 포함되는 경우는 다음과 같은 오류가 표시되며 해당 table의 해당 partition이 속한 tablet은 FAILED상태가 된다.
-->
FAILED(TABLET_DATA_READY): Service unavailabe: transaction on tablet 123hg4567uy4537 rejected due to meory pressure: the memeory usge of this transaction(10488787) plus the current consumption(62933136) exceeds the transaction memory limit(67108864) or the limit of an ancestral memory tracker.