๋ชฉ๋ก๋ฐ์ดํ„ฐ/ํ•˜๋‘ก (10)

๐Ÿฅ

Apache Iceberg ์‚ฌ์šฉ ์‚ฌ๋ก€ (LINE Data Platform์—์„œ Apache Iceberg ๋„์ž…)

https://www.youtube.com/watch?v=7y9gNwqLNtU์œ„ ๋™์˜์ƒ ์ •๋ฆฌํ•จ hive -> iceberg๋กœ ๋ณ€๊ฒฝํ•œ ์‚ฌ๋ก€ Line ๋ฐ์ดํ„ฐ ํ”Œ๋žซํผ์˜ ๊ธฐ์กด ๋ฐฉ์‹๋ฐ์ดํ„ฐ ํ”Œ๋žซํผ์˜ ํŠน์ง•๋ฐ์ดํ„ฐ์˜ ํฌ๊ธฐ/์ข…๋ฅ˜/ํ™œ์šฉ ๊ทœ๋ชจ๊ฐ€ ํฌ๋‹ค๋จธ์‹  ์ˆ˜: 5000 ๋Œ€+๋ฐ์ดํ„ฐ ํฌ๊ธฐ: 290 PB+ํ•˜์ด๋ธŒ ํ…Œ์ด๋ธ” ์ˆ˜: 4๋งŒ๊ฐœ (๋ชจ๋‘ external table)log ingestion rate: ์ดˆ๋‹น 17.5M+ํ•˜๋ฃจ์— ๊ตฌ๋™๋˜๋Š” job ์ˆ˜: 15๋งŒ+ํ”Œ๋žซํผ ์‚ฌ์šฉ์ž ์ˆ˜: 700+ Query ProcessingSQL ๊ธฐ๋ฐ˜, spark, hive, trino, flink๋ฅผ ๋ถ„์‚ฐ sql ์ฟผ๋ฆฌ ์—”์ง„์œผ๋กœ ์‚ฌ์šฉ๋ฐ์ดํ„ฐํŒŒ์ผ์ด ์–ด๋””์— ์žˆ๋Š”์ง€, ์–ด๋–ป๊ฒŒ ์ฝ๊ณ  ์“ธ์ˆ˜์žˆ๋Š”์ง€์— ๋Œ€ํ•œ ์ •๋ณด ํ•„์š”์ฟผ๋ฆฌ์— ๋Œ€ํ•œ ํ…Œ์ด๋ธ”์„ ์–ด๋–ป๊ฒŒ ๊ด€๋ฆฌํ• ์ง€๋Š” ํ…Œ์ด๋ธ” ํฌ๋งท์— ์˜ํ•ด ์ •์˜๋จ *..