일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- Lambda
- ADP
- 독립표본
- 크롤링
- 데이터분석준전문가
- ADsP
- 대응표본
- 텍스트분석
- 데이터불균형
- 빅데이터
- 데이터분석
- 워드클라우드
- datascience
- DBSCAN
- numpy
- 오버샘플링
- 언더샘플링
- 빅데이터분석기사
- dataframe
- LDA
- 주성분분석
- 데이터분석전문가
- pandas
- iloc
- 군집화
- t-test
- PCA
- opencv
- 파이썬
- Python
목록pandas (4)
Data Science LAB

Pandas에서 apply lambda를 적용하면 손쉽게 데이터를 가공할 수 있다. def get_square(a): return a**2 print('3의 제곱 : ',get_square(3)) 보통 함수를 생성할 때, def [함수명(인자)]: return 반환값 으로 생성하지만, lambda를 사용하면 손쉽게 함수를 생성하고 적용할 수 있다. lambda_square = lambda x: x**2 print("3의 제곱 : ",lambda_square(3)) lambda를 이용하면 한줄의 코드로도 함수를 생성할 수 있다. : 로 반활될 입력 인자의 계산식을 분리한다. :의 왼쪽에 있는 x는 입력인자이며, 오른쪽은 입력인자의 계산식이다. a = [1,2,3] squares = map(lambda x ..

Pandas를 이용해서 데이터를 선택할 때, iloc과 loc을 자주 사용하게 되는데, 가끔 헷갈려서 두 연산자에 대해 포스팅 해보려고 한다! 위치 기반 인덱싱 위치 기반 인덱싱은 0을 출발점으로 하는 가로, 세로축 좌표 기반의 행과 열위치를 기반으로 데이터를 지정한다. 따라서 행, 열 값으로 정수가 입력되며, iloc[] 연산자는 위치 기반 인덱싱에 해당한다. iloc[]은 행과 열 값으로 integer 또는 integer형의 슬라이싱, 팬시 리스트 값을 입력해줘야 한다. 먼저, 연습용으로 데이터프레임을 하나 생성해줍니다. import pandas as pd data = {'Name' : ['Red','Blue','Yellow','Green'], 'Year' : [2020,2021,2022,2023],..

안녕하세요! 오늘은 지난 포스팅에 이어서 Pandas라이브러리를 이용해 list, dictionary, array형식의 데이터를 데이터프레임형식으로 변환해보도록 하겠습니다. (ง •_•)ง 먼저, 간단하게 리스트와 array를 생성해 봅니다. import pandas as pd import numpy as np col_name1 = ['col1'] list1 = [1,2,3] array1 = np.array(list1) print('array1 shape: ',array1.shape) array는 1차원으로 구성되어 있는 데이터이며 3개의 로우가 있는 리스트가 생성된 것을 확인할 수 있습니다. 리스트 -> 데이터프레임 pd.DataFrame(리스트이름,컬럼명) 을 이용해 데이터프레임 형식으로 바꿔 줍니다..

안녕하세요(. ❛ ᴗ ❛.)! 오늘은 데이터분석의 가장 기초 라이브러리인 Pandas에 대해 공부해 보려고 합니당! 판다스는 지난번에 공부했던 넘파이에 비해 데이터 핸들링이 훨씬 유연하고 쉽다는 장점이 있는 라이브러리 입니다. 데이터 분석에서 가장 자주 쓰이는 라이브러리이기도 합니다...ㅎ 판다스에서 가장 중요한 것은 DataFrame입니다. 데이터 프레임은 행과 열로 구성되어 있는 2차원의 데이터 구조라고 생각하면 됩니다. Series -> 컬럼이 하나인 구조체 DataFrame -> 컬럼이 여러개인 구조체 라고 생각하시면 될거 같습니당! 오늘은 데이터프레임 형식으로 데이터를 불러오고, 판다스를 이용해 아주 기초적인 분석을 해보도록 하겠습니다(●'◡'●) 먼저, 캐글에서 데이터 분석에 사용할 데이터를 ..