일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- 데이터분석준전문가
- 텍스트분석
- Lambda
- PCA
- dataframe
- 데이터분석
- opencv
- 언더샘플링
- 군집화
- DBSCAN
- t-test
- 빅데이터
- ADP
- 파이썬
- 워드클라우드
- 오버샘플링
- 크롤링
- 대응표본
- datascience
- 주성분분석
- ADsP
- 빅데이터분석기사
- numpy
- LDA
- 독립표본
- Python
- 데이터불균형
- pandas
- 데이터분석전문가
- iloc
목록분류 전체보기 (300)
Data Science LAB

df.columns.difference는 주로 변수와 y값을 분리하기 위해 사용한다. 1. 원래 데이터셋의 변수 확인 2. 독립변수로 사용할 변수만 추출 features = df.columns.difference(['price','CHAS']) 변수 'price', 'CHAS'가 사라진 것을 확인할 수 있다.
머신러닝 회귀분석 - 전처리 과정 설명 - 모델 3개 이상 말하고 2개이상의 모델 사용. - 모델 사용 이유 - 모델 성능 방법과 이유 - 모델 성능 시각화 - 추후 발전 방법(?) 회귀모델 생성 후 결과 해석 두집단이 같은지 검정통계량 구하기(평균.표준편차만줌) 나이브베이즈(코로나 양성판정 받은 사람이 양성일 확률) 평균의 신뢰구간 구하기

Error 주피터 노트북에서 SMOTE.fit_sample()를 이용해 OverSampling 데이터 생성 중 다음과 같은 에러가 발생하였다. AttributeError: 'SMOTE' object has no attribute 'fit_sample' 해결 방법 모듈을 불러올 때, 다음의 코드를 사용했다면 from imblearn.over_sampling import SMOTE X_train_over, y_train_over = smote.fit_resample(X_train, y_train) fit_resample()함수를 사용하면 해결된다.

1. 통계분석(사용 데이터 : Admission) 변수 데이터 형태 설명 GRE 수치형 GRE 점수 TOEFL 수치형 TOEFL 점수 Univ_Rating 수치형 대학교 등급(1~5등급) SOP 수치형 자기소개서 점수 LOR 수치형 추천서 점수 CGPA 수치형 평점평균 Research 범주형 연구 실적유무(0 : 없음, 1 : 있음) Chance_of_Admit 수치형 입학 허가 확률 1. 종속변수인 Chance_of_Admit와 독립변수에 대해 피어슨 상관계수를 이용한 상관관계 분석을 수행하고 그래프를 이용하여 분석결과를 설명하시오. import pandas as pd import numpy as np data = pd.read_csv("Admission.csv") data.head() - 상관관계 분..

1. 날짜 형식으로 데이터 타입 변환 df['Date'] = pd.to_datetime(df['Date']) pd.to_datetime()을 사용하면 날짜 형식의 데이터 타입인 'Datetime' 으로 변환할 수 있다. 2. 년, 월, 일 추출 df['년'] = df['Date'].dt.year df['월'] = df['Date'].dt.month df['일'] = df['Date'].dt.day df['요일'] = df['Date'].dt.day_name() 3. 특정 날짜 추출 ex) 2월달의 데이터만 추출 df = df[df['Date'].dt.month == 2] 상황에 맞춰 조건을 추출하면 해당 년, 월, 일, 요일에 맞는 데이터를 추출할 수 있다. 4. 현재 시간, 날짜 구하기 from dat..

3. 비정형 텍스트마이닝(사용데이터 : 영화 기생충_review.txt, 영화 기생충_사전.txt) "영화 기생충_review.txt'는 다음 영화 사이트의 영화 '기생충'에 대한 review데이터이며, '영화 기생충_사전.txt'은 영화 '기생충'의 출연진의 이름과 극중 이름, 감독 이름이 있는 데이터이다. 1. 데이터를 불러온 뒤, 숫자, 특수 문자 등을 제거하는 전처리 작업을 시행하시오. 그리고 '영화 기생충_review.txt'을 사전에 등록하시오. import pandas as pd import numpy as np f = open('영화 기생충_review.txt','r') data = f.read() -특수문자, 숫자를 공백으로 변환 import re text = re.sub('[^A-Za-..