adp 실기

[Python,R] Adp 실기 모의고사 2회 1번 파이썬 풀이(데이터에듀 교재)

ㅅ ㅜ ㅔ ㅇ 2022. 3. 23. 21:27
728x90

1. 통계분석(사용 데이터 : Admission)

변수 데이터 형태 설명
GRE 수치형 GRE 점수
TOEFL 수치형 TOEFL 점수
Univ_Rating 수치형 대학교 등급(1~5등급)
SOP 수치형 자기소개서 점수
LOR 수치형 추천서 점수
CGPA 수치형 평점평균
Research 범주형 연구 실적유무(0 : 없음, 1 : 있음)
Chance_of_Admit 수치형 입학 허가 확률

 

 

1. 종속변수인 Chance_of_Admit와 독립변수에 대해 피어슨 상관계수를 이용한 상관관계 분석을 수행하고 그래프를 이용하여 분석결과를 설명하시오.

import pandas as pd
import numpy as np

data = pd.read_csv("Admission.csv")
data.head()

 

 

- 상관관계 분석

corr_matrix = data.corr()
corr_matrix

 

corr_matrix['Chance_of_Admit'].sort_values(ascending=False)

 

-상관관계 시각화

from pandas.plotting import scatter_matrix

scatter_matrix(data,figsize=(12,8))

 

 

-히트맵으로 시각화

-모든 독립변수는 종속변수와 양의 상관관계

- 통계적으로 유의함

 

 

728x90