일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- 텍스트분석
- PCA
- ADP
- 데이터분석준전문가
- 데이터분석
- 크롤링
- DBSCAN
- Lambda
- dataframe
- 언더샘플링
- 빅데이터분석기사
- 주성분분석
- opencv
- 빅데이터
- iloc
- numpy
- 독립표본
- 파이썬
- 데이터불균형
- ADsP
- 데이터분석전문가
- LDA
- 오버샘플링
- Python
- 대응표본
- 군집화
- t-test
- 워드클라우드
- datascience
- pandas
목록adp 실기 (22)
Data Science LAB
머신러닝 회귀분석 - 전처리 과정 설명 - 모델 3개 이상 말하고 2개이상의 모델 사용. - 모델 사용 이유 - 모델 성능 방법과 이유 - 모델 성능 시각화 - 추후 발전 방법(?) 회귀모델 생성 후 결과 해석 두집단이 같은지 검정통계량 구하기(평균.표준편차만줌) 나이브베이즈(코로나 양성판정 받은 사람이 양성일 확률) 평균의 신뢰구간 구하기

1. 통계분석(사용 데이터 : Admission) 변수 데이터 형태 설명 GRE 수치형 GRE 점수 TOEFL 수치형 TOEFL 점수 Univ_Rating 수치형 대학교 등급(1~5등급) SOP 수치형 자기소개서 점수 LOR 수치형 추천서 점수 CGPA 수치형 평점평균 Research 범주형 연구 실적유무(0 : 없음, 1 : 있음) Chance_of_Admit 수치형 입학 허가 확률 1. 종속변수인 Chance_of_Admit와 독립변수에 대해 피어슨 상관계수를 이용한 상관관계 분석을 수행하고 그래프를 이용하여 분석결과를 설명하시오. import pandas as pd import numpy as np data = pd.read_csv("Admission.csv") data.head() - 상관관계 분..

3. 비정형 텍스트마이닝(사용데이터 : 영화 기생충_review.txt, 영화 기생충_사전.txt) "영화 기생충_review.txt'는 다음 영화 사이트의 영화 '기생충'에 대한 review데이터이며, '영화 기생충_사전.txt'은 영화 '기생충'의 출연진의 이름과 극중 이름, 감독 이름이 있는 데이터이다. 1. 데이터를 불러온 뒤, 숫자, 특수 문자 등을 제거하는 전처리 작업을 시행하시오. 그리고 '영화 기생충_review.txt'을 사전에 등록하시오. import pandas as pd import numpy as np f = open('영화 기생충_review.txt','r') data = f.read() -특수문자, 숫자를 공백으로 변환 import re text = re.sub('[^A-Za-..

2. 통계분석(사용데이터: FIFA) FIFA 데이터는 가상의 온라인 축구게임에 등장하는 축구 선수의 주요 특징과 신체 정보에 대한 데이터이며, 변수 설명은 아래와 같다. 변수 데이터형태 ID 수치형 Age 수치형 Nationality 범주형 Overall 수치형 Club 범주형 Preferred Foot 범주형 Work Rate 범주형 Position 범주형 Jersey Number 수치형 Contract Valid Until 수치형 Height 문자형 Weight_lb 수치형 Release_Clause 수치형 Value 수치형 Wage 수치형 1. FIFA 데이터에서 각 선수의 키는 Height변수에 피트와 인치로 입력되어 있습니다. 이를 cm로 변환하여 새로운 변수 Height_cm을 생성하시오.(..