[Spark] Accumulator์ Broadcast (๊ณต์ ๋ณ์)
์ฐธ๊ณ : https://spark.apache.org/docs/latest/rdd-programming-guide.html#shared-variables ๊ณต์ ๋ณ์ ์คํํฌ์์๋ ๋ถ์ฐํ์ฌ ๋ณ๋ ฌ์ฒ๋ฆฌํ๊ธฐ ์ํด ๋ฐ์ดํฐ๋ฅผ ๋ถํ ํด์(ํํฐ์
๋) ์ฌ๋ฌ ๋จธ์ ์์ ๋์์ ์ฒ๋ฆฌํ๋ค. ์ด๋ ์ฌ์ฉ๋ ๋ชจ๋ ๋ณ์๋ ๋ฐฐํฌ๋ ๋ ๋ณต์ฌ๋ ๋ณต์ฌ๋ณธ์ผ๋ก ์๋ํ๋๋ฐ, ์ด๋ฌํ ๋ณ์์ ์
๋ฐ์ดํธ๋ driver์ ๋ค์ ์ ๋ฌ๋์ง ์๋๋ค. ๊ทธ๋ฌ๋ ์ด๋ค ์กฐ๊ฑด(?) ์ ๊ฐ์ง๊ณ ์์ด์ผ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ ์ ์๋ ๊ฒฝ์ฐ๊ฐ ๋ฐ์ํ๋๋ฐ, ์ด๋ด๋ ์ ํ๋ ์ ํ์ ๊ณต์ ๋ณ์๋ฅผ ์ฌ์ฉํ์ฌ ๋ณ๋ ฌ ์ฒ๋ฆฌ ํ ์ํ๋ ๊ฐ์ ๋ฐ์ ์ ์๋ค. Broadcast Variable ๋ธ๋ก๋์บ์คํธ ๋ณ์๋ฅผ ์ฌ์ฉํ๋ฉด ๋ณ์์ ๋ณต์ฌ๋ณธ์ ์ ๋ฌํ๋๊ฒ ์๋, Read Only ๋ณ์๋ฅผ ๊ฐ ์์ปค ๋
ธ๋์ ์บ์๋ ์ํ๋ก..