jinseon's log

[혼공머신] 5주차 Chapter 06 미션 인증 본문

ML & DL/[한빛미디어] 혼공

[혼공머신] 5주차 Chapter 06 미션 인증

J_SEON 2024. 2. 4. 18:29

 

 

# 진도 기본 미션 선택 미션
1주차
(1/2 ~ 1/7)
Chapter 01 ~ 02 코랩 실습 화면 캡처하기 Ch.02(02-1) 확인 문제 풀고, 풀이 과정 정리하기
2주차
(1/8 ~ 1/14)
Chapter 03 Ch.03(03-1) 2번 문제 출력 그래프 인증하기 모델 파라미터에 대해 설명하기
3주차
(1/15 ~ 1/21)
Chapter 04 Ch.04(04-1) 2번 문제 풀고, 풀이 과정 설명하기 Ch.04(04-2) 과대적합/과소적합 손코딩 코랩 화면 캡처하기
4주차
(1/22 ~ 1/28)
Chapter 05 교차 검증을 그림으로 설명하기 Ch.05(05-3) 앙상블 모델 손코딩 코랩 화면 인증하기
5주차
(1/29 ~ 2/4)
Chapter 06 k-평균 알고리즘 작동 방식 설명하기 Ch.06(06-3) 확인 문제 풀고, 풀이 과정 정리하기
6주차
(2/5 ~ 2/12)
Chapter 07 Ch.07(07-1) 확인 문제 풀고, 풀이 과정 정리하기 Ch.07(07-2) 확인 문제 풀고, 풀이 과정 정리하기

 

 

기본 미션

✔️ k-평균 알고리즘의 작동 방식

1. 무작위로 k개의 클러스터 중심 설정

2. 각 샘플에서 가장 가까운 클러스터 중심을 찾아 해당 클러스터의 샘플로 지정

3. 클러스터에 속한 샘플의 평균값으로 클러스터 중심 변경

4. 클러스터 중심에 변화가 없을 때까지 2번으로 돌아가 반복

 

선택 미션

문제1) 특성이 20개인 대량의 데이터셋이 있습니다. 이 데이터셋에서 찾을 수 있는 주성분 개수는 몇 개일까요?

 정답 : 20개

 풀이 : 주성분은 특성의 개수만큼 찾을 수 있기 때문이다.

 

문제2) 샘플 개수가 1,000개이고 특성 개수는 100개인 데이터셋이 있습니다. 즉 이 데이터셋의 크기는 (1000, 100)입니다. 이 데이터를 사이킷런의 PCA 클래스를 사용해 10개의 주성분을 찾아 변환했습니다. 변환된 데이터셋의 크기는 얼마일까요?

 정답 : (1000, 10)

 풀이 : 샘플의 개수(1000)는 그대로이고 특성 개수만 10으로 바뀌기 때문이다.

 

문제3) 문제2에서 설명된 분산이 가장 큰 주성분은 몇 번째인가요?

 정답 : 첫 번째 주성분

 풀이 : 주성분 분석은 분산이 가장 큰 방향부터 순서대로 찾기 때문이다.

Comments