๋ชฉ๋ก2024/10/09 (2)
๐ฅ
Spark on KubernetesSpark์์๋ cluster manager๋ก kubernetes๋ฅผ ์ง์ํ๋ค(2.3 ๋ฒ์ ๋ถํฐ). kubernetes๊ฐ ๊ด๋ฆฌํ๋ ํด๋ฌ์คํฐ์์ spark๊ฐ ์คํ๋๊ณ , ๋ค์ดํฐ๋ธ kubernetes ์ค์ผ์ค๋ฌ๋ฅผ ์ฌ์ฉํ๋ค. ์ฅ์ ์ปจํ ์ด๋ ๊ธฐ๋ฐ ์ํฌ๋ก๋์ฟ ๋ฒ๋คํฐ์ค์ HPA๋ฅผ ์ฌ์ฉํด executor ์๋ฅผ ์๋ฉ์ผ๋ก ์กฐ์ ํ ์ ์๋ค.์์ ๋ฐ ๋ฐฐํฌ ๊ด๋ฆฌ ์ ํ์ฑ๋จ์ ์ด๊ธฐ ์ค์ ๋ณต์ก์ฑkubernetes ์ค์ผ์ค๋ง ๋ฌธ์ : third party scheduler๋ฅผ ์ฌ์ฉํด์ผ ํจkubernetes ํด๋ฌ์คํฐ์ ์ํ์ spark ์ฑ๋ฅ ๋ฐ ๊ฐ์ฉ์ฑ์ ์ํฅ์ ๋ฐ์๋ณต์กํ ๋ชจ๋ํฐ๋ง ๋ฐ ๋ก๊น - spark ์์ฒด ๋ก๊ทธ, pod ๋ก๊ทธ, ์์คํ ๋ก๊ทธ, ์ด๋ฒคํธ ๋ก๊ทธ ๋ฑ...data locality - kubernetes์์๋ s..
์ค์ ์ง์ค์ ๋ก๊น ์ผ๋ฐ์ ์ผ๋ก ๋ถ์ฐํ๊ฒฝ์์ ๋ง์ดํฌ๋ก์๋น์ค๋ฅผ ์ด์ํ๋ฉด ๊ฐ ์๋น์ค์์ ๋ฐ์ํ ๋ก๊ทธ ํ์ผ๋ค์ ํํธํ๋์ด ๊ฐ๊ฐ ์ ์ฅ๋๋ค.์๋ก ๋ค๋ฅธ ๊ฐ๋ณ ์๋น์ค์์ ๋ฐ์ํ๋ ๋ก๊ทธ๋ฅผ ์ฐ๊ฒฐ์ง์ด ์ฒ์๋ถํฐ ๋๊น์ง ์์๋๋ก ์ถ์ ํ๋ ๊ฒ์ ์ด๋ ต๋ค.๋ฐ๋ผ์ ๋ก๊ทธ์ ์ถ์ฒ์ ์๊ด์์ด ๋ชจ๋ ๋ก๊ทธ๋ฅผ ์ค์ ์ง์ค์ ์ผ๋ก ์ ์ฅ, ๋ถ์ํด์ผ ํ๋ฉฐ, ์๋น์ค ์คํ ํ๊ฒฝ์์ ๋ถ๋ฆฌํ์ฌ ๊ด๋ฆฌ๋์ด์ผ ํ๋ค. ์ฅ์ ์ฌ๋ฌ ์๋ฒ๋ ์ดํ๋ฆฌ์ผ์ด์ ์์ ์์ฑ๋ ๋ก๊ทธ๋ฅผ ํ ๊ณณ์ ์์งํ๊ธฐ ๋๋ฌธ์ ๋ค์ํ ์์คํ ์ ์ํ๋ฅผ ํ ๋ฒ์ ํ์ ํ ์ ์๋ค.๋ชจ๋ ๋ก๊ทธ ๋ฐ์ดํฐ๋ฅผ ํตํฉํ์ฌ ์ ์ฅํ๋ฏ๋ก ๊ด๋ฆฌ๊ฐ ์ฉ์ดํด์ง๋ค. (๋ณดํต ์ฉ๋์ด ํฌ๊ณ ํ์ฅ ๊ฐ๋ฅํ DB๋ ํด๋ผ์ฐ๋ ์คํ ๋ฆฌ์ง์ฌ์ฉ)์ค์์์ ๋ก๊ทธ๋ฅผ ํ ๋ฒ์ ๊ฒ์ํ๊ณ ๋ถ์ํ ์ ์์ผ๋ฏ๋ก ์ด๋ฒคํธ๋ฅผ ์ถ์ ํ๊ธฐ๊ฐ ์ฌ์์ง๊ณ , ๋ฌธ์ ํด๊ฒฐ ์๊ฐ์ด ๋จ์ถ๋๋ค.๋จ์ ๋จ์ผ..