일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
Tags
- LDA
- iloc
- datascience
- 데이터분석
- Python
- 오버샘플링
- opencv
- ADsP
- 빅데이터분석기사
- 언더샘플링
- numpy
- 데이터분석전문가
- Lambda
- 데이터불균형
- PCA
- 군집화
- ADP
- t-test
- 독립표본
- 파이썬
- 빅데이터
- 텍스트분석
- 데이터분석준전문가
- 워드클라우드
- 크롤링
- pandas
- 대응표본
- DBSCAN
- 주성분분석
- dataframe
Archives
Data Science LAB
[Python,R] Adp 실기 모의고사 2회 1번 파이썬 풀이(데이터에듀 교재) 본문
728x90
1. 통계분석(사용 데이터 : Admission)
변수 | 데이터 형태 | 설명 |
GRE | 수치형 | GRE 점수 |
TOEFL | 수치형 | TOEFL 점수 |
Univ_Rating | 수치형 | 대학교 등급(1~5등급) |
SOP | 수치형 | 자기소개서 점수 |
LOR | 수치형 | 추천서 점수 |
CGPA | 수치형 | 평점평균 |
Research | 범주형 | 연구 실적유무(0 : 없음, 1 : 있음) |
Chance_of_Admit | 수치형 | 입학 허가 확률 |
1. 종속변수인 Chance_of_Admit와 독립변수에 대해 피어슨 상관계수를 이용한 상관관계 분석을 수행하고 그래프를 이용하여 분석결과를 설명하시오.
import pandas as pd
import numpy as np
data = pd.read_csv("Admission.csv")
data.head()
- 상관관계 분석
corr_matrix = data.corr()
corr_matrix
corr_matrix['Chance_of_Admit'].sort_values(ascending=False)
-상관관계 시각화
from pandas.plotting import scatter_matrix
scatter_matrix(data,figsize=(12,8))
-히트맵으로 시각화
-모든 독립변수는 종속변수와 양의 상관관계
- 통계적으로 유의함
728x90
'adp 실기' 카테고리의 다른 글
제 26회 ADP 실기 복원(22.09.25) (2) | 2022.10.15 |
---|---|
24회 Adp 실기 복기 (0) | 2022.03.26 |
[Python] Adp 실기 모의고사 1회 3번 (0) | 2022.03.21 |
[Python] Adp 실기 모의고사 1회 2번 파이썬 풀이(데이터에듀 교재) (0) | 2022.03.19 |
Comments