๋ชฉ๋ก๋ฐ์ดํฐ/ํ๋ก (10)
๐ฅ
https://www.youtube.com/watch?v=7y9gNwqLNtU์ ๋์์ ์ ๋ฆฌํจ hive -> iceberg๋ก ๋ณ๊ฒฝํ ์ฌ๋ก Line ๋ฐ์ดํฐ ํ๋ซํผ์ ๊ธฐ์กด ๋ฐฉ์๋ฐ์ดํฐ ํ๋ซํผ์ ํน์ง๋ฐ์ดํฐ์ ํฌ๊ธฐ/์ข ๋ฅ/ํ์ฉ ๊ท๋ชจ๊ฐ ํฌ๋ค๋จธ์ ์: 5000 ๋+๋ฐ์ดํฐ ํฌ๊ธฐ: 290 PB+ํ์ด๋ธ ํ ์ด๋ธ ์: 4๋ง๊ฐ (๋ชจ๋ external table)log ingestion rate: ์ด๋น 17.5M+ํ๋ฃจ์ ๊ตฌ๋๋๋ job ์: 15๋ง+ํ๋ซํผ ์ฌ์ฉ์ ์: 700+ Query ProcessingSQL ๊ธฐ๋ฐ, spark, hive, trino, flink๋ฅผ ๋ถ์ฐ sql ์ฟผ๋ฆฌ ์์ง์ผ๋ก ์ฌ์ฉ๋ฐ์ดํฐํ์ผ์ด ์ด๋์ ์๋์ง, ์ด๋ป๊ฒ ์ฝ๊ณ ์ธ์์๋์ง์ ๋ํ ์ ๋ณด ํ์์ฟผ๋ฆฌ์ ๋ํ ํ ์ด๋ธ์ ์ด๋ป๊ฒ ๊ด๋ฆฌํ ์ง๋ ํ ์ด๋ธ ํฌ๋งท์ ์ํด ์ ์๋จ *..
๊ฐ๋จํ๊ฒ hue-desktop-site๋ฅผ ์์ ํ๋ฉด ๋๋ค. (ambari๋ก ์ค์ ) ํด๋ผ์ฐ๋ฐ๋ผ๋ ํฌ๊ฒ ๋ค๋ฅด์ง๋ ์์ ๊ฒ ๊ฐ๋ค. ์ฐธ์กฐ: https://docs.cloudera.com/documentation/enterprise/6/6.3/topics/cm_sg_ssl_hue.html#concept_cxx_mmd_s4 1. SSL enabled default๊ฐ false ์์ true๋ก ๋ณ๊ฒฝ 2. ssl_certificate pem ํ์ผ ์ธ์ฆ์ ๊ฒฝ๋ก ์ค์ 3. SSL carcerts ์ต์์ CA ์ธ์ฆ์ pemํ์ผ ๊ฒฝ๋ก ์ค์ 4. SSL Password ์ธ์ฆ์์ ๋น๋ฐ๋ฒํธ ์ด๋ถ๋ถ์ ๋น๋ฐ๋ฒํธ๋ก ์ค์ ํ์ผ์ ๋ฐํ์์ง ์๊ฒ ํ๋ ค๋ฉด SSL password script๋ก ์คํฌ๋ฆฝํธ ํ์ผ ์ค์ ์ ํ๋ฉด ๋๋ค. 5. SSL Priv..
set hive.msck.repair.batch.size=1; set hive.msck.path.validation=ignore; Hive ์์ ์ ๋ช ๋ น์ด ์ฌ์ฉ ์์ ์๋์ ๊ฐ์ ์ค๋ฅ๊ฐ ๋ฐ์ํ๋ค. Error: Error while processing statement: Cannot modify hive.msck.path.validation at runtime. It is not in list of params that are allowed to be modified at runtime (state=42000,code=1)โ hive-site์ ์๋ ์ค์ ๊ฐ ์ถ๊ฐ ํ ์ ์ ๋์ ํ์ธํจ key: hive.security.authorization.sqlstd.confwhitelist.append value: h..
CREATE EXTERNAL TABLE some_table ( some columns... ) STORED AS SOME_FILE_FORMAT LOCATION 's3a://s3_bucket/my_s3_path/' ์์ ๊ฐ์ด s3 ๊ฒฝ๋ก๋ฅผ ์ฐธ์กฐํ๋ ํ ์ด๋ธ ์์ฑ ํ ์กฐํ ์ ์๋์ ์๋ฌ ๋ฐ์ํ๋ค. Disk I/O error on "my_server_info" Failed to open HDFS file s3a:"my_s3_file" Error(255): Unknown error 255 Root cause: ConnectionPoolTimeoutException: Timeout waiting for connection from pool https://docs.cloudera.com/documentation/en..