๋ชฉ๋ก์ ์ฒด ๊ธ (59)
๐ฅ
2.4.4 ์ดํ์ 2.4.5 ์ด์ ๋ฒ์ ์์ ํ๋ก configuration ์ค์ ํ๋๊ฒ ์ข ๋ค๋ฅธ ๋ฏ ํ๋ค. Spark ๋ฒ์ 2.4.4 ์ดํ spark = SparkSession.builder.appName("myapp") \ .config("some.config", "some.value") \ .getOrCreate() # signature V4 ๋ฅผ ์ฌ์ฉํ๋ ๋ฆฌ์ ์ผ ๊ฒฝ์ฐ ์๋ property ์ค์ spark.sparkContext.setSystemProperty("com.amazonaws.services.s3.enableV4", "true") # s3 ์ ๋ณด ์ค์ spark.sparkContext._jsc.hadoopConfiguration().set(f"fs.s3a.bucket.{mybucket}.endpo..
ls --time-style='+%Y%m%d %H:%M:%S' -l
์ฒ์์ ๊ทธ๋ฅ ํ์ด์ฌ์ผ๋ก ํ์ผ์ ์ฝ์ด์ ์นดํ์นด ๋ฉ์์ง๋ฅผ ๋ณด๋ด๋ ค ํ๋๋ฐ ์๊ฐ๋ณด๋ค ๋๋ ธ๋ค.. ์นดํ์นด๋ก ๋ณด๋ด์ผํ๋ ํ์ผ์ ์์ฑํ๋ ์ฝ๋๊ฐ c/c++๋ก ๋์ด์๊ธฐ๋ ํ๊ณ ๋ฉ์์ง ์์ฑ ์ฆ์ ๋ฐ๋ก ๋ณด๋ด๋ฉด ๋ ๋นจ๋ผ์ง ๊ฒ ๊ฐ์ C๋ก ์์ฑํด๋ดค๋ค. 1. librdkafka ํจํค์ง ๋ค์ด๋ก๋ ๋๋ centos ์จ์ ์๋์ ๊ฐ์ด ์ค์นํ๋ค. yum install librdkafka-devel ๋ค๋ฅธ ์ด์์ฒด์ ๋ ์๋ github ํ์ด์ง ์ฐธ๊ณ https://github.com/confluentinc/librdkafka#installation 2. librdkafka ์ค์น ์์น ํ์ธ ์ค์น ์์น ํ์ธํ๋ ๋ฐฉ๋ฒ ์ฐธ๊ณ : https://quackstudy.tistory.com/entry/CentOS-yum%EC%9C%BC%EB%A1%9C-%EC%..
yum ํจํค์ง ์ค์น ๋ฆฌ์คํธ ํ์ธ yum install list rpm ์ผ๋ก ๊ฒฝ๋ก ์ฐพ๊ธฐ ๊ฒฝ๋ก๋ฅผ ์ฐพ์ผ๋ ค๋ฉด yum๋ง์ผ๋ก๋ ์๋๊ณ rpm์ ์ฌ์ฉํด์ผ ํ๋ค. # ์ ์ฒด ์ค์น ๋ฆฌ์คํธ ํ์ธ rpm -qa # ํน์ ๋ฌธ์์ด์ด ๋ค์ด๊ฐ ํจํค์ง ์ด๋ฆ ํ์ธ rpm -qa | grep $๋ฌธ์์ด # ํจํค์ง ์ด๋ฆ์ผ๋ก ์์น ์ฐพ๊ธฐ rpm -ql $ํจํค์ง๋ช ์์ ์๋์ ๊ฐ์ด ์ค์น ๊ฒฝ๋ก๋ฅผ ํ์ธํ ์ ์๋ค. [root@testserver ~]# rpm -ql librdkafka-devel-0.11.4-1.el7.x86_64 /usr/include/librdkafka /usr/include/librdkafka/rdkafka.h /usr/include/librdkafka/rdkafkacpp.h /usr/lib64/librdkafka++.so /u..
์ ํํ ์ด๋ค ์ค๋ฅ ๋ฌธ๊ตฌ์๋์ง๋ db ์ต์ ๊ฐ์ ์ด๋ฏธ ์์ ํด๋ฒ๋ ค์ ์ฌํ์ ์ด๋ ต์ง๋ง airflow ์ค์ผ์ฅด๋ฌ์์ db๋ฅผ ์ฟผ๋ฆฌํ ๋ syntax error๊ฐ ๋๋ค๋ ์ค๋ฅ์๋ค. (๋์ถฉ ์๋ ์ค๋ฅ ๋๋..) db init์ ํ๋๋ฐ select ์ ์ ์๋ ์ปฌ๋ผ๋ค์ด group by ์ ์ ์๋ ์ค๋ฅ "table.column" doesn't exist. airflow์์๋ ๊ณต์์ ์ผ๋ก mariadb๋ฅผ ์ง์ํ์ง ์๋๋ค. (์ฐธ๊ณ : https://airflow.apache.org/docs/apache-airflow/stable/howto/set-up-database.html) Despite big similarities between MariaDB and MySQL, we DO NOT support MariaDB as a back..