์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- iloc
- Lambda
- ๋ฐ์ดํฐ๋ถ์
- ๋ฐ์ดํฐ๋ถ์์ค์ ๋ฌธ๊ฐ
- ๋ฐ์ดํฐ๋ถ๊ท ํ
- ADP
- ํ์ด์ฌ
- ์๋ํด๋ผ์ฐ๋
- ํฌ๋กค๋ง
- ๋น ๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ
- t-test
- ๋ ๋ฆฝํ๋ณธ
- Python
- numpy
- PCA
- dataframe
- ๋น ๋ฐ์ดํฐ
- datascience
- ADsP
- pandas
- ๋์ํ๋ณธ
- DBSCAN
- ์ฃผ์ฑ๋ถ๋ถ์
- ์ค๋ฒ์ํ๋ง
- ์ธ๋์ํ๋ง
- ๋ฐ์ดํฐ๋ถ์์ ๋ฌธ๊ฐ
- ๊ตฐ์งํ
- opencv
- ํ ์คํธ๋ถ์
- LDA
๋ชฉ๋ก๐ Python (45)
Data Science LAB

Pandas ์์๋ ๋ค์ํ ๋ฐฉ๋ฒ์ผ๋ก ๊ฒฐ์ธก์น(NA)๋ฅผ ์ฒ๋ฆฌํ ์ ์๋ค. ๊ฒฐ์ธก์น๋, ์ปฌ๋ผ์ ๊ฐ์ด ์๋ NULL ์ํ์ ๋ฐ์ดํฐ๋ฅผ ๋งํ๋ฉฐ, ๋ฐ์ดํฐ์ ์ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ์ ์ฉํ ๋ ๊ฒฐ์ธก์น๊ฐ ์กด์ฌํ๋ฉด ๋ฌธ์ ๊ฐ ๋ฐ์ํ๊ธฐ ๋๋ฌธ์ ๋ค๋ฅธ ๊ฐ์ผ๋ก ๋์ฒดํ๊ฑฐ๋ ์ญ์ ํด์ผํ๋ค. ๋ฐ์ดํฐ์ ๊ฒฐ์ธก ์ฌ๋ถ ํ์ธ import pandas as pd import numpy as np data = pd.read_csv("titanic_train.csv") data.head() ๋จผ์ , ์ ๋ช ํ ๋ถ๋ฅ ๋ฐ์ดํฐ์ ์ค ํ๋์ธ ํ์ดํ๋ ๋ฐ์ดํฐ์ ์ ๋ถ๋ฌ์จ๋ค. data.isna() isna()๋ฅผ ์ฌ์ฉํ๋ฉด ๋ฐ์ดํฐ๊ฐ ๊ฒฐ์ธก์ธ์ง ์๋์ง์ ๋ํด True/False๋ก ๋ฐํํด์ค๋ค. True -> ๊ฒฐ์ธก False -> ๊ฒฐ์ธก X data.isna().sum() isna์ sum(..

Pandas์์ apply lambda๋ฅผ ์ ์ฉํ๋ฉด ์์ฝ๊ฒ ๋ฐ์ดํฐ๋ฅผ ๊ฐ๊ณตํ ์ ์๋ค. def get_square(a): return a**2 print('3์ ์ ๊ณฑ : ',get_square(3)) ๋ณดํต ํจ์๋ฅผ ์์ฑํ ๋, def [ํจ์๋ช (์ธ์)]: return ๋ฐํ๊ฐ ์ผ๋ก ์์ฑํ์ง๋ง, lambda๋ฅผ ์ฌ์ฉํ๋ฉด ์์ฝ๊ฒ ํจ์๋ฅผ ์์ฑํ๊ณ ์ ์ฉํ ์ ์๋ค. lambda_square = lambda x: x**2 print("3์ ์ ๊ณฑ : ",lambda_square(3)) lambda๋ฅผ ์ด์ฉํ๋ฉด ํ์ค์ ์ฝ๋๋ก๋ ํจ์๋ฅผ ์์ฑํ ์ ์๋ค. : ๋ก ๋ฐํ๋ ์ ๋ ฅ ์ธ์์ ๊ณ์ฐ์์ ๋ถ๋ฆฌํ๋ค. :์ ์ผ์ชฝ์ ์๋ x๋ ์ ๋ ฅ์ธ์์ด๋ฉฐ, ์ค๋ฅธ์ชฝ์ ์ ๋ ฅ์ธ์์ ๊ณ์ฐ์์ด๋ค. a = [1,2,3] squares = map(lambda x ..

Pandas๋ฅผ ์ด์ฉํด์ ๋ฐ์ดํฐ๋ฅผ ์ ํํ ๋, iloc๊ณผ loc์ ์์ฃผ ์ฌ์ฉํ๊ฒ ๋๋๋ฐ, ๊ฐ๋ ํท๊ฐ๋ ค์ ๋ ์ฐ์ฐ์์ ๋ํด ํฌ์คํ ํด๋ณด๋ ค๊ณ ํ๋ค! ์์น ๊ธฐ๋ฐ ์ธ๋ฑ์ฑ ์์น ๊ธฐ๋ฐ ์ธ๋ฑ์ฑ์ 0์ ์ถ๋ฐ์ ์ผ๋ก ํ๋ ๊ฐ๋ก, ์ธ๋ก์ถ ์ขํ ๊ธฐ๋ฐ์ ํ๊ณผ ์ด์์น๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ์ง์ ํ๋ค. ๋ฐ๋ผ์ ํ, ์ด ๊ฐ์ผ๋ก ์ ์๊ฐ ์ ๋ ฅ๋๋ฉฐ, iloc[] ์ฐ์ฐ์๋ ์์น ๊ธฐ๋ฐ ์ธ๋ฑ์ฑ์ ํด๋นํ๋ค. iloc[]์ ํ๊ณผ ์ด ๊ฐ์ผ๋ก integer ๋๋ integerํ์ ์ฌ๋ผ์ด์ฑ, ํฌ์ ๋ฆฌ์คํธ ๊ฐ์ ์ ๋ ฅํด์ค์ผ ํ๋ค. ๋จผ์ , ์ฐ์ต์ฉ์ผ๋ก ๋ฐ์ดํฐํ๋ ์์ ํ๋ ์์ฑํด์ค๋๋ค. import pandas as pd data = {'Name' : ['Red','Blue','Yellow','Green'], 'Year' : [2020,2021,2022,2023],..
๋๋์ด๋๋์ด๋๋์ด! ์๋์ฝ๋ค์์ ์๋ฌ๋ฅผ ํด๊ฒฐํ๊ณ konlpy๋ฅผ ์คํํ ์ ์๊ฒ ๋์๋ค! konlpy ์คํ์ด ์๋ผ์ ํ๊ธ ํ ์คํธ ๋ถ์์ ์์ ๋ชปํ์๋๋ฐ ์ด์ ํ ์ ์๊ฒ ๋์๋ค(๊ฐ๊ฒฉ) Konlpy ์ค์น ๋ฐฉ๋ฒ 1. JAVA ์ค์น https://www.oracle.com/java/technologies/downloads/#java11-windows ์์ ์ฌ์ดํธ๋ก ๋ค์ด๊ฐ์ ๋งฅ, OS, ์๋์ฐ ๋ฑ ์ฌ์ฉ ํ๊ฒฝ์ ๋ง์ถฐ JAVA๋ฅผ ๋ค์ด๋ฐ๋๋ค. (์ ๋ ์๋์ฐ๋ก ํ์ต๋๋น) 2. ํ์ผ ๊ฒฝ๋ก ์ฐพ๊ธฐ(jvm.dll) jvm.dll์ ํ์ผ์ ๊ฒฝ๋ก๋ฅผ ๋ณต์ฌํ๋ค. 3. ํ๊ฒฝ ๋ณ์ ์ค์ ๋จผ์ ์ ์ดํ์ ๋ค์ด๊ฐ์ ์์คํ ๋ฐ ๋ณด์ ํด๋ฆญ! ์์คํ ํด๋ฆญ! ์๋๋ก ์คํฌ๋กค์ ์ญ ๋ด๋ฆฐ ๋ค์ ๊ณ ๊ธ ์์คํ ์ค์ ํด๋ฆญ ํ๊ฒฝ ๋ณ์๋ฅผ ํด๋ฆญํ ๋ค์ ์์คํ ๋ณ์์..
๊ตฌ๋ฌธ ์๋ฌ : SyntaxError: cannot assign to function call โ์ด ์ค๋ฅ๋ ๋ณ์ ํ ๋น ๋ฌธ์ ๋ฑํธ ์ผ์ชฝ์ ํจ์ ํธ์ถ์ ๋ฃ์ ๋ ๋ฐ์ํ๋ค. ๋ฐ์ดํฐ ํ๋ ์์ ์ปฌ๋ผ๋ช ์ ์ง์ ํ ๋ ๋๊ดํธ '[]'๋ฅผ ์ฌ์ฉํด์ผํ๋๋ฐ, ๊ดํธ'()'๋ฅผ ์ฌ์ฉํด์ ๋ฐ์ํ ์ค๋ฅ์ด๋ค.
ํ์ด์ฌ์ผ๋ก ๋ฐ์ดํฐ ๋ถ์ ๊ณต๋ถ๋ฅผ ํ๋ค ๋ณด๋, ์์ฃผ ๋๋ ์ค๋ฅ์ ๋ํด์ ์ ๋ฆฌ๋ฅผ ํด๋ณด๋ ค๊ณ ํ๋ค! (๊ฑฐ์ ๋ค ๋น์ท๋น์ทํ ์๋ฌ์ธ๋ฏ,,ใ ) 1. StyntaxError : ์๋ชป๋ ๋ฌธ๋ฒ ๋๋ฌธ์ ๋ฐ์ print('ab) ์๋ฌ ๋ฉ์ธ์ง - SyntaxError : EOL while scanning string literal ์ด๋ฐ์์ผ๋ก ๋ฐ์ดํ๋ ๊ดํธ ๋ฑ ๊ธฐ๋ณธ์ ์ธ ๋ฌธ๋ฒ์ ๋ง์ง ์์ผ๋ฉด ์ค๋ฅ๊ฐ ๋ฐ์ํ๋ค. 2. NameError : ์ฐธ์กฐ๋ณ์๊ฐ ์์ ๋ ๋ฐ์ a = 1 print(b) ์๋ฌ ๋ฉ์ธ์ง - NameError : name '' is not defined ๋ณ์ b๋ ์ ์ธํ์ง ์์์ NameError๊ฐ ๋ฐ์ํ๋ค. 3. ZeroDivisionError : 0์ผ๋ก ๋๋ ๋ ๋ฐ์ print(100/0) ์๋ฌ ๋ฉ์ธ์ง - ZeroDiv..