메뉴 건너뛰기

Bigdata, Semantic IoT, Hadoop, NoSQL

Bigdata, Hadoop ecosystem, Semantic IoT등의 프로젝트를 진행중에 습득한 내용을 정리하는 곳입니다.
필요한 분을 위해서 공개하고 있습니다. 문의사항은 gooper@gooper.com로 메일을 보내주세요.


import org.apache.spark.SparkContext
import org.apache.spark.streaming.StreamingContext
import org.apache.spark.streaming.Seconds

object StreamingLogsMB {
  def main(args: Array[String]) {
    if (args.length < 2) {

      System.err.println("Usage: stubs.StreamingLogsMB <hostname> <port>")
      System.exit(1)
    }

    // get hostname and port of data source from application arguments
    val hostname = args(0)
    val port = args(1).toInt

    // Create a Spark Context
    val sc = new SparkContext()

    // Set log level to ERROR to avoid distracting extra output
    sc.setLogLevel("ERROR")

    // Configure the Streaming Context with a 1 second batch duration
    val ssc = new StreamingContext(sc,Seconds(1))

    // Create a DStream of log data from the server and port specified
    val logs = ssc.socketTextStream(hostname,port)

    ssc.checkpoint("logcheckpt")

    logs.countByWindow(Seconds(5), Seconds(2)).print

    ssc.start()
    ssc.awaitTermination()
  }
}

번호 제목 글쓴이 날짜 조회 수
504 Cloudera설치중 실패로 여러번 설치하는 과정에 "Running in non-interactive mode, and data appears to exist in Storage Directory /dfs/nn. Not formatting." 오류가 발생시 조치하는 방법 총관리자 2018.03.29 281
503 Cloudera설치중에 "Error, CM server guid updated"오류 발생시 조치방법 총관리자 2018.03.29 192
502 Cloudera가 사용하는 서비스별 포트 총관리자 2018.03.29 238
501 Cloudera가 사용하는 서비스별 디렉토리 총관리자 2018.03.29 124
500 cloudera-scm-agent 설정파일 위치및 재시작 명령문 총관리자 2018.03.29 218
499 [CentOS] 네트워크 설정 총관리자 2018.03.26 109
498 Components of the Impala Server 총관리자 2018.03.21 59
497 HDFS Balancer설정및 수행 총관리자 2018.03.21 100
496 hadoop 클러스터 실행 스크립트 정리 총관리자 2018.03.20 569
495 HA(Namenode, ResourceManager, Kerberos) 및 보안(Zookeeper, Hadoop) 총관리자 2018.03.16 74
494 자주쓰는 유용한 프로그램 총관리자 2018.03.16 741
493 에러 추적(Error Tracking) 및 로그 취합(logging aggregation) 시스템인 Sentry 설치 총관리자 2018.03.14 66
492 update 샘플 총관리자 2018.03.12 792
491 이미지 관리 오픈소스 목록 총관리자 2018.03.11 107
» Scala에서 countByWindow를 이용하기(예제) 총관리자 2018.03.08 148
489 Scala를 이용한 Streaming예제 총관리자 2018.03.08 45
488 scala application 샘플소스(SparkSession이용) 총관리자 2018.03.07 113
487 fuseki의 endpoint를 이용한 insert, delete하는 sparql예시 총관리자 2018.02.14 51
486 프로세스를 확인해서 프로세스를 삭제하는 shell script예제(cryptonight) 총관리자 2018.02.02 147
485 spark-submit 실행시 "java.lang.OutOfMemoryError: Java heap space"발생시 조치사항 총관리자 2018.02.01 308

A personal place to organize information learned during the development of such Hadoop, Hive, Hbase, Semantic IoT, etc.
We are open to the required minutes. Please send inquiries to gooper@gooper.com.

위로