Zeppelin spark interpreter 연동

IT 잡동사니

Zeppelin spark interpreter 연동

케키키케 2024. 7. 1. 23:49

1. Zeppelin Interpreter - Spark 설정

아래 3개의 설정 지정

SPAKR_HOME 지정.
spark.master = yarn
spark.submit.deployMode = client
그리고 spark.executor.cores, spark.driver.cores 등 메모리도.. 기본적으로 실행할 자원 설정
1. 근데 노트북 내에서 아래와 같이 따로 설정도 가능함

%spark.conf
spark.app.name test-app-name
spark.executor.instances 10
spark.executor.core 10
spark.yarn.queue queue.test

2. 필요 라이브러리 설정

cd ${ZEPPELIN_HOME}/interpreter/spark/

ls -al  //이렇게 보면 ._spark-interpreter-0.11.1.jar 파일이 껍데기만 있는 것을 볼 수 있다.

cp spark-interpreter-0.11.1.jar ._spark-interpreter-0.11.1.jar // 정상 파일로 복사해준다.

scala-2.12 버전도 사용해야 해서 똑같이 해준다.

cd ${ZEPPELIN_HOME}/interpreter/spark/scala-2.12 

cp spark-scala-2.12-0.11.1.jar ._ spark-scala-2.12-0.11.1.jar

3.Spark interpreter - Hive 연동

그리고 추가로 spark 세션 생성해서 hive 접속 시에 기존 spark-shell로는 hive 잘만 접속하는데,

mysql.org 어쩌고 나온다. 커넥터가 없다고 한다.

${ZEPPELIN_HOME}/lib에 mysql-connector-java-8.0.23.jar 를 추가해준다.

4. 추가 라이브러리 설정

spark.jars에 설정합니다.

hdfs://test-nn/test/delta-spark_2.12-3.1.0.jar,hdfs://test-nn/test/delta-hive-assembly_2.12-3.1.0.jar

5. 자원 설정

Note당 독립 자원 할당을 위해 Per Note, Isolated 로 설정함

6. Python 언어 설정

설치한 python path 입력

PYSPARK_PYTHON /usr/bin/python3

PYSPARK_DRIVER_PYTHON /usr/bin/python3

저작자표시

'IT 잡동사니' 카테고리의 다른 글

Ubuntu OpenLDAP 설치 (0)	2024.07.01
Zeppelin 설치(Windows) - UI 안나오는 이슈 해결, 원격 접속 허용 (0)	2024.07.01
데이터 중심 애플리케이션 설계 - 복제 (0)	2022.09.12
IntelliJ Google style fomatter를 적용해보자! + 매크로 등록 (0)	2022.05.15
클린코드 17장 냄새와 휴리스틱 리뷰 (0)	2022.03.10

현재글Zeppelin spark interpreter 연동

메모장

나의 메모장

GitHub, IntelliJ UTF-8, kafka, sqoop mysql, 카프카 자바, 카프카 컨슈머, 자바 큐, vue게시판, mariadb 설치, nvm설치, kafka 설치, npm설치, 프로그래머스 자바, zeppelin spark, zeppelin spark interpreter, git remote, sqoop hive, Kafka 시작하기, vue.js게시판, 게시판만들기,

Today :
Yesterday :

일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

메모장