250x250
Link
๋‚˜์˜ GitHub Contribution ๊ทธ๋ž˜ํ”„
Loading data ...
Notice
Recent Posts
Recent Comments
๊ด€๋ฆฌ ๋ฉ”๋‰ด

Data Science LAB

[Python] ๋ฆฌ์ŠคํŠธ, ๋”•์…”๋„ˆ๋ฆฌ, array ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„์œผ๋กœ ๋ณ€ํ™˜ ๋ณธ๋ฌธ

๐Ÿ Python/Pandas

[Python] ๋ฆฌ์ŠคํŠธ, ๋”•์…”๋„ˆ๋ฆฌ, array ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„์œผ๋กœ ๋ณ€ํ™˜

ใ…… ใ…œ ใ…” ใ…‡ 2022. 2. 16. 12:58
728x90

์•ˆ๋…•ํ•˜์„ธ์š”! 

์˜ค๋Š˜์€ ์ง€๋‚œ ํฌ์ŠคํŒ…์— ์ด์–ด์„œ Pandas๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ์ด์šฉํ•ด list, dictionary, arrayํ˜•์‹์˜ ๋ฐ์ดํ„ฐ๋ฅผ ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„ํ˜•์‹์œผ๋กœ ๋ณ€ํ™˜ํ•ด๋ณด๋„๋ก ํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค. (เธ‡ •_•)เธ‡

 

 


 

 

 

๋จผ์ €, ๊ฐ„๋‹จํ•˜๊ฒŒ ๋ฆฌ์ŠคํŠธ์™€ array๋ฅผ ์ƒ์„ฑํ•ด ๋ด…๋‹ˆ๋‹ค.

import pandas as pd
import numpy as np
col_name1 = ['col1']
list1 = [1,2,3]
array1 = np.array(list1)
print('array1 shape: ',array1.shape)

array๋Š” 1์ฐจ์›์œผ๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ๋Š” ๋ฐ์ดํ„ฐ์ด๋ฉฐ 3๊ฐœ์˜ ๋กœ์šฐ๊ฐ€ ์žˆ๋Š” ๋ฆฌ์ŠคํŠธ๊ฐ€ ์ƒ์„ฑ๋œ ๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. 

 

 

 

 

๋ฆฌ์ŠคํŠธ -> ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„

pd.DataFrame(๋ฆฌ์ŠคํŠธ์ด๋ฆ„,์ปฌ๋Ÿผ๋ช…) ์„ ์ด์šฉํ•ด ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„ ํ˜•์‹์œผ๋กœ ๋ฐ”๊ฟ” ์ค๋‹ˆ๋‹ค. 

df_list1 = pd.DataFrame(list1,columns=col_name1)
print('1์ฐจ์› ๋ฆฌ์ŠคํŠธ => DataFrame :\n',df_list1)

 

์ปฌ๋Ÿผ๋ช…์ด 'col1'์ด๋ฉฐ 3๊ฐœ์˜ ํ–‰์œผ๋กœ ๊ตฌ์„ฑ๋œ ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. 

 

 

 

 

 

 

array -> ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„
df_array1 = pd.DataFrame(array1,columns=col_name1)
print('1์ฐจ์› ndarray => DataFrame : \n',df_array1)

๋ฆฌ์ŠคํŠธ๋ฅผ ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„์œผ๋กœ ๋ณ€ํ™˜ํ•œ ๊ฒƒ๊ณผ ์ฐจ์ด๋Š” ์—†์Šต๋‹ˆ๋‹ค. 

 

 

 


 

2์ฐจ์› array -> ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„

์ด๋ฒˆ์—๋Š” 2์ฐจ์› array๋ฅผ ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„์œผ๋กœ ๋ณ€ํ™˜์‹œ์ผœ์ฃผ๊ฒ ์Šต๋‹ˆ๋‹ค. 

๋จผ์ €, 2์ฐจ์› ํ˜•์‹์˜ array๋ฅผ ์ƒ์„ฑํ•ด์ค๋‹ˆ๋‹ค. 

 

col_name2 = ['col1','col2']
list2 = [[1,2],[3,4]]
array2 = np.array(list2)
print('array2 shape : ',array2.shape)

2ํ–‰ 2์—ด๋กœ ๊ตฌ์„ฑ๋œ array๋ฅผ ์ƒ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค. 

 

 

df_list2 = pd.DataFrame(list2,columns=col_name2)
print("2์ฐจ์› ๋ฆฌ์ŠคํŠธ => DataFrame : \n",df_list2)

df_array2 = pd.DataFrame(array2,columns=col_name2)
print("2์ฐจ์› ndarray => DataFrame : \n",df_array2)

1์ฐจ์› ๋ฆฌ์ŠคํŠธ์™€ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ pd.DataFrame()์„ ์ด์šฉํ•˜์—ฌ ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„์„ ์ƒ์„ฑํ•  ์ˆ˜์žˆ์Šต๋‹ˆ๋‹ค. 

 

 

 


๋”•์…”๋„ˆ๋ฆฌ -> ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„

๋”•์…”๋„ˆ๋ฆฌ ํ˜•ํƒœ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„์œผ๋กœ ์ƒ์„ฑํ•˜๋„๋ก ํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค. 

 

dict = {'col1':[1,11],'col2':[2,12],'col3':[3,13]}
df_dict = pd.DataFrame(dict)
print("dictionary => DataFrame : \n",df_dict)

 

 

 

 


์ด๋ฒˆ์—๋Š” ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„ ํ˜•์‹์„ array, ๋ฆฌ์ŠคํŠธ, ๋”•์…”๋„ˆ๋ฆฌ ํ˜•ํƒœ๋กœ ๋ณ€ํ™˜ํ•ด๋ณด๋„๋ก ํ•˜๊ฒ ์Šต๋‹ˆ๋‹น

 

 

๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„ -> array
array3 = df_dict.values
print("df_dict.values ํƒ€์ž… :",type(array3))
print("df_dict.values.shape : ",array3.shape)
print(array3)

df.values๋ฅผ ์ด์šฉํ•ด arrayํ˜•์‹์œผ๋กœ ๋ฐ”๋€๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

 

 

 

 

 

๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„ -> ๋ฆฌ์ŠคํŠธ
list3 = df_dict.values.tolist()
print("df_dict.value.tolist()ํƒ€์ž… :",type(list3))
print(list3)

 

tolist()๋ฅผ ์ด์šฉํ•ด list๋กœ ๋ฐ”๋€๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. 

 

 

 

 

 

๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„ -> ๋”•์…”๋„ˆ๋ฆฌ
dict3 = df_dict.to_dict('list')
print("df_dict.to_dict() ํƒ€์ž… :",type(dict3))
print(dict3)

 

 

 

 

 

๋ฐ์ดํ„ฐ ๋ถ„์„์„ ํ•˜๋‹ค๋ณด๋ฉด ์—ฌ๋Ÿฌ๊ฐ€์ง€ ํ˜•์‹์˜ ๋ฐ์ดํ„ฐ์…‹์„ ๋งˆ์ฃผ์น  ์ˆ˜ ์žˆ๋Š”๋ฐ,

ํ•„์š”ํ•œ ๋ฐ์ดํ„ฐ ํ˜•์‹์— ๋งž์ถฐ ๊ฐ„๋‹จํ•˜๊ฒŒ ๋ณ€ํ™˜ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค!

728x90
Comments