adp 실기
[Python,R] Adp 실기 모의고사 2회 1번 파이썬 풀이(데이터에듀 교재)
ㅅ ㅜ ㅔ ㅇ
2022. 3. 23. 21:27
728x90
1. 통계분석(사용 데이터 : Admission)
변수 | 데이터 형태 | 설명 |
GRE | 수치형 | GRE 점수 |
TOEFL | 수치형 | TOEFL 점수 |
Univ_Rating | 수치형 | 대학교 등급(1~5등급) |
SOP | 수치형 | 자기소개서 점수 |
LOR | 수치형 | 추천서 점수 |
CGPA | 수치형 | 평점평균 |
Research | 범주형 | 연구 실적유무(0 : 없음, 1 : 있음) |
Chance_of_Admit | 수치형 | 입학 허가 확률 |
1. 종속변수인 Chance_of_Admit와 독립변수에 대해 피어슨 상관계수를 이용한 상관관계 분석을 수행하고 그래프를 이용하여 분석결과를 설명하시오.
import pandas as pd
import numpy as np
data = pd.read_csv("Admission.csv")
data.head()
- 상관관계 분석
corr_matrix = data.corr()
corr_matrix
corr_matrix['Chance_of_Admit'].sort_values(ascending=False)
-상관관계 시각화
from pandas.plotting import scatter_matrix
scatter_matrix(data,figsize=(12,8))
-히트맵으로 시각화
-모든 독립변수는 종속변수와 양의 상관관계
- 통계적으로 유의함
728x90