728x90
๋ฐ˜์‘ํ˜•

pandas 2

[๋ถ€์ŠคํŠธ์บ ํ”„ AI Tech 3๊ธฐ Pre-Course] ๊ผญ ์•Œ์•„์•ผ ํ•˜๋Š” ํŒŒ์ด์ฌ ๊ธฐ์ดˆ ์ง€์‹Python Data Analysis Library Panel Data (Pandas 2)

๋ชจ๋“  ๊ฒŒ์‹œ๋ฌผ์€ macOS Monterey 12.0.1 ๋ฒ„์ „ ๊ธฐ์ค€์œผ๋กœ ์ž‘์„ฑํ•˜์˜€์Šต๋‹ˆ๋‹ค. ๋ถ€์ŠคํŠธ์บ ํ”„ AI Tech 3๊ธฐ๋ฅผ ์œ„ํ•œ Pre-Course ๋ฅผ ํ† ๋Œ€๋กœ ์ž‘์„ฑํ•˜์˜€์Šต๋‹ˆ๋‹ค. Groupby ๊ธฐ์กด์˜ ๋ฐ์ดํ„ฐ์—์„œ ๊ฐ™์€ ์ข…๋ฅ˜์˜ ๋ฐ์ดํ„ฐ๋ผ๋ฆฌ(Index) ๋ฌถ์–ด์ค€๋‹ค. by SPLIT ํ•จ์ˆ˜๋ฅผ ์ ์šฉํ•œ๋‹ค. by APPLY ๋ฌถ์–ด์„œ ํ•˜๋‚˜์˜ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์—ฌ์ค€๋‹ค. by COMBINE Groupby์˜ ๊ธฐ์ค€ column์„ ๋‘ ๊ฐœ ์ด์ƒ ์žก์œผ๋ฉด Hierarchical Index๊ฐ€ ๋งŒ๋“ค์–ด์ง„๋‹ค. ์ด๋•Œ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์ค‘์— ํ•˜๋‚˜๊ฐ€ unstack ์ด๋‹ค. ๋ฐ์ดํ„ฐ๋ฅผ matrix๋กœ ํ’€์–ด์ค€๋‹ค. ๋˜, Multi Index๋กœ ๋ฌถ์—ฌ์žˆ์„ ๋•Œ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์ด reset_index()๋‹ค. groupby๋กœ ๋งŒ๋“  grouped ์ƒํƒœ์—์„œ ์ ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ์„ธ ๊ฐ€์ง€ appl..

[๋ถ€์ŠคํŠธ์บ ํ”„ AI Tech 3๊ธฐ Pre-Course] ๊ผญ ์•Œ์•„์•ผ ํ•˜๋Š” ํŒŒ์ด์ฌ ๊ธฐ์ดˆ ์ง€์‹Python Data Analysis Library Panel Data (Pandas 1)

๋ชจ๋“  ๊ฒŒ์‹œ๋ฌผ์€ macOS Monterey 12.0.1 ๋ฒ„์ „์„ ๊ธฐ์ค€์œผ๋กœ ์ž‘์„ฑํ•˜์˜€์Šต๋‹ˆ๋‹ค. ๋ถ€์ŠคํŠธ์บ ํ”„ AI Tech 3๊ธฐ ์˜ˆ๋น„ ์บ ํผ๋ฅผ ์œ„ํ•œ Pre-Course ๊ฐ•์ขŒ๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ์ž‘์„ฑํ•˜์˜€์Šต๋‹ˆ๋‹ค. Pandas ๊ตฌ์กฐํ™”๋œ ๋ฐ์ดํ„ฐ์˜ ์ฒ˜๋ฆฌ๋ฅผ ์ง€์›ํ•˜๋Š” Python ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์ด๋‹ค. Python๊ณ„์˜ Excel์ด๋ผ๊ณ  ์ดํ•ด๋ฅผ ํ•˜๋ฉด ์ข‹๋‹ค. Numpy์™€ ํ†ตํ•ฉํ•˜์—ฌ ๊ฐ•๋ ฅํ•œ "์Šคํ”„๋ ˆ๋“œ์‹œํŠธ" ์ฒ˜๋ฆฌ ๊ธฐ๋Šฅ์„ ์ œ๊ณตํ•œ๋‹ค. Tabular Data๋ฅผ ๋‹ค๋ฃธ์— ์žˆ์–ด ๊ฐ€์žฅ ์ตœ์ ํ™” ๋˜์–ด์žˆ๋Š” ๋„๊ตฌ์ด๋‹ค. sep๋Š” data๋ฅผ ๋‚˜๋ˆ„๋Š” ๊ธฐ์ค€์ด๊ณ , regular expression์œผ๋กœ ๋˜์–ด์žˆ๋‹ค. s๋Š” single blank์— +๋Š” ์—ฌ๋Ÿฌ๊ฐœ๋ผ๋Š” ์˜๋ฏธ๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ๊ธฐ์— ์ฆ‰, ๋„์–ด์“ฐ๊ธฐ๊ฐ€ ์—ฌ๋Ÿฌ๊ฐœ ์žˆ์„ํ…๋ฐ ์ด๋ฅผ separation ๊ธฐ์ค€์œผ๋กœ ์‚ผ๊ฒ ๋‹ค. header๋Š” column ๊ฐ’์— ..

728x90
๋ฐ˜์‘ํ˜•