์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- LDA
- ํ์ด์ฌ
- ํฌ๋กค๋ง
- PCA
- ๋ฐ์ดํฐ๋ถ์์ค์ ๋ฌธ๊ฐ
- ADP
- datascience
- dataframe
- Lambda
- ํ ์คํธ๋ถ์
- ๋ฐ์ดํฐ๋ถ์
- DBSCAN
- ADsP
- ์ค๋ฒ์ํ๋ง
- ๋น ๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ
- ๋ฐ์ดํฐ๋ถ๊ท ํ
- ๋ ๋ฆฝํ๋ณธ
- opencv
- Python
- pandas
- t-test
- ์ฃผ์ฑ๋ถ๋ถ์
- numpy
- ๋น ๋ฐ์ดํฐ
- ๋์ํ๋ณธ
- iloc
- ์๋ํด๋ผ์ฐ๋
- ์ธ๋์ํ๋ง
- ๊ตฐ์งํ
- ๋ฐ์ดํฐ๋ถ์์ ๋ฌธ๊ฐ
Data Science LAB
[Python] ๋ฆฌ์คํธ, ๋์ ๋๋ฆฌ, array ๋ฐ์ดํฐํ๋ ์์ผ๋ก ๋ณํ ๋ณธ๋ฌธ
[Python] ๋ฆฌ์คํธ, ๋์ ๋๋ฆฌ, array ๋ฐ์ดํฐํ๋ ์์ผ๋ก ๋ณํ
ใ ใ ใ ใ 2022. 2. 16. 12:58์๋ ํ์ธ์!
์ค๋์ ์ง๋ ํฌ์คํ ์ ์ด์ด์ Pandas๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์ด์ฉํด list, dictionary, arrayํ์์ ๋ฐ์ดํฐ๋ฅผ ๋ฐ์ดํฐํ๋ ์ํ์์ผ๋ก ๋ณํํด๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค. (เธ •_•)เธ
๋จผ์ , ๊ฐ๋จํ๊ฒ ๋ฆฌ์คํธ์ array๋ฅผ ์์ฑํด ๋ด ๋๋ค.
import pandas as pd
import numpy as np
col_name1 = ['col1']
list1 = [1,2,3]
array1 = np.array(list1)
print('array1 shape: ',array1.shape)
array๋ 1์ฐจ์์ผ๋ก ๊ตฌ์ฑ๋์ด ์๋ ๋ฐ์ดํฐ์ด๋ฉฐ 3๊ฐ์ ๋ก์ฐ๊ฐ ์๋ ๋ฆฌ์คํธ๊ฐ ์์ฑ๋ ๊ฒ์ ํ์ธํ ์ ์์ต๋๋ค.
๋ฆฌ์คํธ -> ๋ฐ์ดํฐํ๋ ์
pd.DataFrame(๋ฆฌ์คํธ์ด๋ฆ,์ปฌ๋ผ๋ช ) ์ ์ด์ฉํด ๋ฐ์ดํฐํ๋ ์ ํ์์ผ๋ก ๋ฐ๊ฟ ์ค๋๋ค.
df_list1 = pd.DataFrame(list1,columns=col_name1)
print('1์ฐจ์ ๋ฆฌ์คํธ => DataFrame :\n',df_list1)
์ปฌ๋ผ๋ช ์ด 'col1'์ด๋ฉฐ 3๊ฐ์ ํ์ผ๋ก ๊ตฌ์ฑ๋ ๋ฐ์ดํฐํ๋ ์์ ํ์ธํ ์ ์์ต๋๋ค.
array -> ๋ฐ์ดํฐํ๋ ์
df_array1 = pd.DataFrame(array1,columns=col_name1)
print('1์ฐจ์ ndarray => DataFrame : \n',df_array1)
๋ฆฌ์คํธ๋ฅผ ๋ฐ์ดํฐํ๋ ์์ผ๋ก ๋ณํํ ๊ฒ๊ณผ ์ฐจ์ด๋ ์์ต๋๋ค.
2์ฐจ์ array -> ๋ฐ์ดํฐํ๋ ์
์ด๋ฒ์๋ 2์ฐจ์ array๋ฅผ ๋ฐ์ดํฐํ๋ ์์ผ๋ก ๋ณํ์์ผ์ฃผ๊ฒ ์ต๋๋ค.
๋จผ์ , 2์ฐจ์ ํ์์ array๋ฅผ ์์ฑํด์ค๋๋ค.
col_name2 = ['col1','col2']
list2 = [[1,2],[3,4]]
array2 = np.array(list2)
print('array2 shape : ',array2.shape)
2ํ 2์ด๋ก ๊ตฌ์ฑ๋ array๋ฅผ ์์ฑํ์ต๋๋ค.
df_list2 = pd.DataFrame(list2,columns=col_name2)
print("2์ฐจ์ ๋ฆฌ์คํธ => DataFrame : \n",df_list2)
df_array2 = pd.DataFrame(array2,columns=col_name2)
print("2์ฐจ์ ndarray => DataFrame : \n",df_array2)
1์ฐจ์ ๋ฆฌ์คํธ์ ๋ง์ฐฌ๊ฐ์ง๋ก pd.DataFrame()์ ์ด์ฉํ์ฌ ๋ฐ์ดํฐํ๋ ์์ ์์ฑํ ์์์ต๋๋ค.
๋์ ๋๋ฆฌ -> ๋ฐ์ดํฐํ๋ ์
๋์ ๋๋ฆฌ ํํ์ ๋ฐ์ดํฐ๋ฅผ ๋ฐ์ดํฐํ๋ ์์ผ๋ก ์์ฑํ๋๋ก ํ๊ฒ ์ต๋๋ค.
dict = {'col1':[1,11],'col2':[2,12],'col3':[3,13]}
df_dict = pd.DataFrame(dict)
print("dictionary => DataFrame : \n",df_dict)
์ด๋ฒ์๋ ๋ฐ์ดํฐํ๋ ์ ํ์์ array, ๋ฆฌ์คํธ, ๋์ ๋๋ฆฌ ํํ๋ก ๋ณํํด๋ณด๋๋ก ํ๊ฒ ์ต๋๋น
๋ฐ์ดํฐํ๋ ์ -> array
array3 = df_dict.values
print("df_dict.values ํ์
:",type(array3))
print("df_dict.values.shape : ",array3.shape)
print(array3)
df.values๋ฅผ ์ด์ฉํด arrayํ์์ผ๋ก ๋ฐ๋๊ฒ์ ํ์ธํ ์ ์์ต๋๋ค.
๋ฐ์ดํฐํ๋ ์ -> ๋ฆฌ์คํธ
list3 = df_dict.values.tolist()
print("df_dict.value.tolist()ํ์
:",type(list3))
print(list3)
tolist()๋ฅผ ์ด์ฉํด list๋ก ๋ฐ๋๊ฒ์ ํ์ธํ ์ ์์ต๋๋ค.
๋ฐ์ดํฐํ๋ ์ -> ๋์ ๋๋ฆฌ
dict3 = df_dict.to_dict('list')
print("df_dict.to_dict() ํ์
:",type(dict3))
print(dict3)
๋ฐ์ดํฐ ๋ถ์์ ํ๋ค๋ณด๋ฉด ์ฌ๋ฌ๊ฐ์ง ํ์์ ๋ฐ์ดํฐ์ ์ ๋ง์ฃผ์น ์ ์๋๋ฐ,
ํ์ํ ๋ฐ์ดํฐ ํ์์ ๋ง์ถฐ ๊ฐ๋จํ๊ฒ ๋ณํํ ์ ์์ต๋๋ค!
'๐ Python > Pandas' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[python] df.columns.difference (0) | 2022.03.27 |
---|---|
[Python] ๋ฐ์ดํฐ ๊ฒฐ์ธก์น ์ฒ๋ฆฌ (0) | 2022.03.11 |
[Python] Apply lambda ์ ์ฉ (0) | 2022.03.10 |
[Python] loc/iloc ์ฐจ์ด์ (0) | 2022.03.10 |
[Python] ํ๋ค์ค(Pandas)๊ธฐ์ด (0) | 2022.02.15 |