일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- 워드클라우드
- PCA
- 언더샘플링
- 크롤링
- dataframe
- 빅데이터
- 텍스트분석
- t-test
- datascience
- Lambda
- ADP
- 데이터분석준전문가
- LDA
- ADsP
- opencv
- 데이터분석전문가
- 주성분분석
- 데이터불균형
- pandas
- 파이썬
- 데이터분석
- DBSCAN
- iloc
- numpy
- 군집화
- 오버샘플링
- 독립표본
- Python
- 대응표본
- 빅데이터분석기사
목록전체 글 (300)
Data Science LAB

2022.02.10 - 정보처리기사 필기 합격 후기(비전공자) 정보처리기사 필기 합격 후기(비전공자) 이번 포스팅은 정보처리기사 필기 시험 합격 후기 입니다! 2021년 정보처리기사 4회차 시험에 응시하여 합격했었는데요,,ㅎ 아직 실기 시험은 합격하지 못했지만 올해 안에는 꼭 실기 시험까지 suhye.tistory.com 안녕하세요 ! 정보처리기사 필기 합격 후기에 이어서 오늘 발표난 실기 합격 후기에 대해 써보려고 합니다! 총 65점으로 합격할 수 있었습니다 ㅎㅎ.. - 교재 올해 출판된 이기적 교재와 작년 출판된 수제비 두권 모두 다 봤습니다! 개인적으로는 수제비 교재 추천드려요...ㅎㅎ.. (이기적 교재는 전반적으로 내용이 좀 부실한 느낌) 확실히 정보처리기사 실기 시험이 전반적으로 점점 어려워지고..

사용 데이터 : Admission.csv 변수 데이터 형태 설명 GRE 수치형 GRE 점수 TOEFL 수치형 TOEFL 점수 Univ_Rating 수치형 대학교 등급(1~5등급) SOP 수치형 자기소개서 점수 LOR 수치형 추천서 점수 CGPA 수치형 평점평균 Research 범주형 연구 실적유무(0 : 없음, 1 : 있음) Chance_of_Admit 수치형 입학 허가 확률 import pandas as pd import numpy as np df = pd.read_csv('../data/Admission.csv') df.head() 1. 종속변수인 Chance_of+adimit와 독립변수 (GRE, TOEFL, Univ_Rating, SOP, LOR, CGPA)에 대해 피어슨 상관관계 분석을 수행하고..

사용 데이터 : 영화 기생충_review.txt, 영화 기생충_사전.txt '영화 기생충_review.txt'는 다음 영화 사이트의 영화 '기생충'에 대한 review 데이터이며, '영화 기생충_사전.txt'은 영화 기생충의 출연진의 이름과 극중 이름, 감독 이름이 있는 데이터이다. 1. '영화 기생충_review.txt' 데이터를 읽어온 뒤 숫자, 특수 문자 등을 제거하는 전처리 작업을 시행하시오. 그리고 '영화 기생충_review.txt'을 사전에 등록하시오. import pandas as pd f = open('../data/영화 기생충_review.txt','r') review = f.read() review = pd.Series(review.split('\n')) review 데이터를 불러온뒤,..

1. 문제 설명 2. 제한 조건 3. 내 풀이 def solution(phone_number): answer = phone_number.replace(phone_number[:-4], '*'*len(phone_number[:-4])) return answer replace 함수를 사용해서 생각보다 쉽게 풀렸다! 4. 다른 사람 풀이 def hide_numbers(s): return "*"*(len(s)-4) + s[-4:] replace 대신 문자열을 더하는 것으로 풀음

사용 데이터 : FIFA.csv FIFA 데이터는 가상의 온라인 축구게임에 등장하는 축구 선수의 주요 특징과 신체 정보에 대한 데이터이며, 변수 설명은 아래와 같다. 변수 데이터형태 ID 수치형 Age 수치형 Nationality 범주형 Overall 수치형 Club 범주형 Preferred Foot 범주형 Work Rate 범주형 Position 범주형 Jersey Number 수치형 Contract Valid Until 수치형 Height 문자형 Weight_lb 수치형 Release_Clause 수치형 Value 수치형 Wage 수치형 1. FIFA 데이터에서 각 선수의 키는 Height변수에 피트와 인치로 입력되어 있습니다. 이를 cm로 변환하여 새로운 변수 Height_cm을 생성하시오.(" '..

사용 데이터 : lotto.csv lotto 데이터는 1회부터 859회까지의 로또 당첨번호(보너스 번호를 제외한 6개의 추첨번호)를 담고 있는 데이터이며, 변수 설명은 다음과 같다. 변수 데이터 형태 설명 time_id 수치형 로또 회차 numN 수치형 해당 회의 N번 째 당첨번호 6개 - 데이터 불러오기 import pandas as pd import numpy as np import warnings warnings.filterwarnings(action='ignore') df = pd.read_csv('../data/lotto.csv') df.head() 1. 연관규칙분석을 수행하기 위해 lotto 데이터셋을 transaction 데이터로 변환하시오. (단, 본 분석에서 로또번호가 추첨된 순서는 고려..