๐ฅ
[Spark] GraphX ๋ณธ๋ฌธ
graphX๋ ์คํํฌ์์ graph computation์ ์ํํ๊ธฐ ์ํ Spark API์ด๋ค.
์คํํฌ ๋ฌธ์์ ์ค๋ช ๋์ด ์๋ GraphX์ ์ฅ์ ์ ์๋์ ๊ฐ๋ค.
Flexibility
๋จ์ผ ์์คํ ๋ด์์ ETA, ๋ถ์, ๊ทธ๋ํ ๊ณ์ฐ์ ํตํฉํ ์ ์๋ค. RDD/Dataframe์์ ๊ทธ๋ํ๋ก ํจ์จ์ ์ธ ๋ณํ์ด ๊ฐ๋ฅํ๋ฉฐ, Pregel API๋ก ์ฌ์ฉ์ ์ ์ ๋ฐ๋ณต ๊ทธ๋ํ ์๊ณ ๋ฆฌ์ฆ์ ์์ฑํ ์ ์๋ค.
Speed
์ค์ ๊ทธ๋ํ ์ปดํจํ ๋ชฉ์ ์ผ๋ก ๋ง๋ค์ด์ง ์์คํ (specialized graph processing system)๊ณผ ๋น๊ตํ์ฌ ๋น์ทํ ์ฑ๋ฅ์ ๋ณด์ธ๋ค.
Algorithm
๋ค์ํ ์๊ณ ๋ฆฌ์ฆ์ด ์๋ค.
- PageRank
- Connected components
- Label propagation
- SVD++
- Strongly connected components
- Triangle Count
GraphX๋ ์์ฝ๊ฒ๋ Scala์์๋ง ์ง์ํ๊ณ ์๋ค.
๋ค๋ฅธ ์ธ์ด๋ก graphX๋ฅผ ์ฌ์ฉํ๊ณ ์ถ๋ค๋ฉด GraphFrames ํจํค์ง๋ฅผ ์ฃผ์ ํด์ ์ฌ์ฉํ๋ฉด ๋๋ค.
'๋ฐ์ดํฐ > Spark' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Spark] Adaptive Query Execution(AQE) (0) | 2024.03.23 |
---|---|
[Spark] ์คํํฌ์ Executor Memory ๊ตฌ์กฐ (0) | 2024.03.23 |
[Spark] Spark Join ์ข ๋ฅ (0) | 2024.03.18 |
[Spark] spark์์ s3 ์ ๊ทผํ๊ธฐ (ACCESS_KEY, SECRET_KEY) (0) | 2023.12.19 |
[Spark] s3 ๋ฐ์ดํฐ dataframe์ผ๋ก ๋ก๋ํ๊ธฐ (0) | 2023.06.01 |