메뉴 건너뛰기

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.


0. Spark, Scala, Pip, Python, Hadoop, Jupyter등은 이미 설치되어 있다고 가정한다.


1. 환경변수 설정

sudo vi /etc/profile

export $SPARK_HOME=$HOME/spark


2. 수정된 환경변수값 반영

sudo source /etc/profile


3. toree설치

sudo pip install toree

sudo jupyter toree install --spark_home=$SPARK_HOME --interpreters=Scala,PySpark,SparkR,SQL


4. browser에서 확인

https://gsda4:8888/


5. jupyter kernal목록 확인(jupyter kernelspec list)

/usr/local/lib/python2.7/dist-packages/jupyter_client/session.py:48: VisibleDeprecationWarning: zmq.eventloop.minitornado is deprecated in pyzmq 14.0 and will be removed.

    Install tornado itself to use zmq with the tornado IOLoop.


  from zmq.eventloop.ioloop import IOLoop

[ListKernelSpecs] WARNING | Native kernel (python2) is not available

[ListKernelSpecs] WARNING | Native kernel (python2) is not available

Available kernels:

  apache_toree_pyspark    /usr/local/share/jupyter/kernels/apache_toree_pyspark

  apache_toree_scala      /usr/local/share/jupyter/kernels/apache_toree_scala

  apache_toree_sparkr     /usr/local/share/jupyter/kernels/apache_toree_sparkr

  apache_toree_sql        /usr/local/share/jupyter/kernels/apache_toree_sql

  python3                 /usr/local/share/jupyter/kernels/python3


번호 제목 날짜 조회 수
570 TransmitData() to failed: Network error: Recv() got EOF from remote (error 108) 오류 현상 2019.02.15 3867
569 [Oozie]Disk I/O error: Failed to open HDFS file dhfs://..../tb_aaa/....OPYING 2019.02.15 3799
568 kafka에서 메세지 중복 consume이 발생할 수 있는 상황 2018.10.23 3954
567 [sentry]role부여후 테이블명이 변경되어 오류가 발생할때 조치방법 2018.10.16 4336
566 hive metastore ERD file 2018.09.20 4109
565 Error: java.lang.RuntimeException: java.lang.OutOfMemoryError 오류가 발생하는 경우 2018.09.20 4155
564 physical memory used되면서 mapper가 kill되는 경우 오류 발생시 조치 2018.09.20 4732
563 impala,hive및 hdfs만 접근가능하고 파일을 이용한 테이블생성가능하도록 hue 권한설정설정 2018.09.17 3274
562 cloudera(python 2.7.5)에서 anaconda3로 설치한 외부 python(3.6.6)을 이용하여 pyspark를 사용하는 설정 2018.09.14 4466
561 ntp시간 맞추기 2018.09.12 2342
560 ubuntu 커널 업그레이드 방법 2018.09.02 3225
559 oracle to hive data type정리표 2018.08.22 7379
558 postgresql-9.4에서 FATAL: remaining connection slots are reserved for non-replication superuser connections가 나올때 조치 2018.08.16 4482
557 sentry설정 방법및 활성화시 설정이 필요한 파일및 설정값, 계정생성 방법 2018.08.16 4231
556 컬럼및 라인의 구분자를 지정하여 sqoop으로 데이타를 가져오고 hive테이블을 생성하는 명령문 2018.08.03 4254
555 sqoop으로 mariadb에 접근해서 hive 테이블로 자동으로 생성하기 2018.08.03 4421
554 Last transaction was partial에 따른 Unable to load database on disk오류 발생시 조치사항 2018.08.03 6653
553 RHEL 7.4에 zeppelin 0.7.4 설치 2018.07.31 4514
552 conda를 이용한 jupyterhub(v0.9)및 jupyter설치 (v4.4.0) 2018.07.30 4327
551 anaconda3 (v5.2) 설치및 머신러닝 관련 라이브러리 설치 절차 2018.07.27 3641
위로