Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.
Hadoop을 사용하여 빅데이터 분석에서 테스트용으로 사용할 수 있는 data set에 대한 정보를 가진 사이트 입니다.
http://www.findbestopensource.com/article-detail/free-large-data-corpus
http://labrosa.ee.columbia.edu/millionsong/
댓글 0
| 번호 | 제목 | 날짜 | 조회 수 |
|---|---|---|---|
| 72 |
원보드pc인 bananapi를 이용하여 hadoop 클러스터 구성하기(준비물)
| 2014.05.29 | 6543 |
| 71 | 의사분산모드에 hadoop설치및 ecosystem 환경 정리 | 2014.05.29 | 5254 |
| 70 | hadoop및 ecosystem에서 사용되는 명령문 정리 | 2014.05.28 | 6616 |
| 69 | hive job실행시 meta정보를 원격의 mysql에 저장하는 경우 설정방법 | 2014.05.28 | 5229 |
| 68 | oozie의 meta정보를 mysql에서 관리하기 | 2014.05.26 | 26568 |
| 67 | hive query에서 mapreduce돌리지 않고 select하는 방법 | 2014.05.23 | 5014 |
| 66 | hiverserver2기동시 connection refused가 발생하는 경우 조치방법 | 2014.05.22 | 4939 |
| 65 | import 혹은 export할때 hive파일의 default 구분자는 --input-fields-terminated-by " |