메뉴 건너뛰기

Cloudera, BigData, Semantic IoT, Hadoop, NoSQL

Cloudera CDH/CDP 및 Hadoop EcoSystem, Semantic IoT등의 개발/운영 기술을 정리합니다. gooper@gooper.com로 문의 주세요.


spark Scala를 이용한 Streaming예제

총관리자 2018.03.08 09:59 조회 수 : 4302


object StreamingRequestCount {
  def main(args: Array[String]) {
    val ssc = new StreamingContext(new SparkContext(),Seconds(2))
    val mystream = ssc.socketTextStream(hostname, port)
    val userreqs = mystream.map(line => (line.split(' ')(2),1))
        .reduceByKey((x,y) => x+y)
    userreqs.print()
    ssc.start()
    ssc.awaitTermination()
  }
}


번호 제목 날짜 조회 수
45 Scala버젼 변경 혹은 상황에 맞게 Spark소스 컴파일하기 2016.05.31 4007
44 Hive JDBC Connection과 유형별 에러및 필요한 jar파일 2021.05.24 4003
43 Hue Load Balancer를 L4로 L/B하는 경우는 L4쪽 도멘인으로 발행된 인증서를 TLS/SSL항목에 설정해주어야 한다. 2021.10.08 4002
42 "bad handshake: Error([('SSL routines', 'ssl3_get_server_certificate', 'certificate verify failed')])" 오류는 CA인증을 하지 못해서 발생함 2022.05.13 3995
41 Apache Toree설치(Jupyter에서 Scala, PySpark, SparkR, SQL을 사용할 수 있도록 하는 Kernel) 2018.04.17 3933
40 lateral view 예제 2014.09.18 3905
39 small file 한개 파일로 만들기(text file 혹은 parquet file의 테이블) 2022.07.04 3885
38 impala session type별 표시되는 정보로 구분하는 방법 2021.05.25 3877
37 impala external 테이블 생성시 컬럼과 라인 구분자를 지정하여 테이블 생성하는 예시 2020.02.20 3853
36 streaming작업시 입력된 값에 대한 사본을 만들게 되는데 이것이 실패했을때 발생하는 경고메세지 2017.04.03 3841
35 spark에서 hive table을 읽어 출력하는 예제 소스 2017.03.09 3793
34 Query 1234:1234 expired due to client inactivity(timeout is 5m)및 invalid query handle 2022.06.10 3779
33 Caused by: java.lang.ClassNotFoundException: org.apache.spark.Logging 발생시 조치사항 2017.04.19 3754
32 kafka로 부터 메세지를 stream으로 받아 처리하는 spark샘플소스(spark의 producer와 consumer를 sbt로 컴파일 하고 서버에서 spark-submit하는 방법) 2016.07.13 3719
31 spark-submit 실행시 "java.lang.OutOfMemoryError: Java heap space"발생시 조치사항 2018.02.01 3712
30 hive기동시 Caused by: java.net.URISyntaxException: Relative path in absolute URI: ${system:java.io.tmpdir%7D/$%7Bsystem:user.name%7D 오류 발생시 조치사항 2016.09.25 3631
29 hive에서 insert overwrite directory.. 로 하면 default column구분자는 'SOH'혹은 't'가 됨 2014.05.20 3595
28 spark notebook 0.7.0설치및 설정 2016.11.14 3576
27 [Impala jdbc]CDP7.1.7환경에서 java프로그램을 이용하여 kerberized impala cluster에 접근하여 SQL을 수행하는 방법 2023.08.22 3547
26 spark stream처리할때 두개의 client프로그램이 동일한 checkpoint로 접근할때 발생하는 오류 내용 2018.01.16 3537
위로