๋ฐ์ดํฐ ๋ถ์๊ณผ ๋จธ์ ๋ฌ๋์ ํ๋ค ๋ณด๋ฉด CSV, JSON, Excel ๋ฑ์ ํ์ผ ํฌ๋งท์ ์์ฃผ ์ฌ์ฉํ๊ฒ ๋๋ค. ํ์ง๋ง ๋์ฉ๋ ๋ฐ์ดํฐ๋ฅผ ๋ค๋ฃฐ ๋๋ ์๋์ ์ ์ฅ ํจ์จ์ฑ์ด ์ค์ํ๋ฐ, ์ด๋ด ๋ Parquet ํฌ๋งท์ด ๊ฐ๋ ฅํ ๋์์ด ๋ ์ ์๋ค.1. Parquet๋?Apache Parquet๋ ์ปฌ๋ผ ๊ธฐ๋ฐ ์ ์ฅ ๋ฐฉ์(columnar storage format)์ ์ฌ์ฉํ๋ ์คํ์์ค ๋ฐ์ดํฐ ํฌ๋งท์. Hadoop ์ํ๊ณ์์ ๊ฐ๋ฐ๋์์ผ๋ฉฐ, ๋์ฉ๋ ๋ฐ์ดํฐ ์ฒ๋ฆฌ์ ๋ถ์ ์ฑ๋ฅ์ ๊ทน๋ํํ๋ ๋ฐ ์ต์ ํ๋จ.ํน์ง์ปฌ๋ผ ๊ธฐ๋ฐ ์ ์ฅ(Columnar Storage)CSV๋ JSON ๊ฐ์ ํฌ๋งท์ ๋ฐ์ดํฐ๋ฅผ ํ(Row) ๋จ์๋ก ์ ์ฅํ์ง๋ง, Parquet์ ์ปฌ๋ผ(Column) ๋จ์๋ก ์ ์ฅํจํน์ ์ปฌ๋ผ๋ง ์ฝ์ด๋ ๋๋ฏ๋ก, ๋ถ์ ์๋๊ฐ ํฅ์๋จ์์ถ ๋ฐ ์ธ์ฝ๋ฉ(Co..