[혼공머신] 5주차 Chapter 06 미션 인증

Notice

Recent Posts

Tags more

Archives

관리 메뉴

jinseon's log

ML & DL/[한빛미디어] 혼공

J_SEON 2024. 2. 4. 18:29

✔️ k-평균 알고리즘의 작동 방식

1. 무작위로 k개의 클러스터 중심 설정

2. 각 샘플에서 가장 가까운 클러스터 중심을 찾아 해당 클러스터의 샘플로 지정

3. 클러스터에 속한 샘플의 평균값으로 클러스터 중심 변경

4. 클러스터 중심에 변화가 없을 때까지 2번으로 돌아가 반복

문제1) 특성이 20개인 대량의 데이터셋이 있습니다. 이 데이터셋에서 찾을 수 있는 주성분 개수는 몇 개일까요?

ㆍ 정답 : 20개

ㆍ 풀이 : 주성분은 특성의 개수만큼 찾을 수 있기 때문이다.

문제2) 샘플 개수가 1,000개이고 특성 개수는 100개인 데이터셋이 있습니다. 즉 이 데이터셋의 크기는 (1000, 100)입니다. 이 데이터를 사이킷런의 PCA 클래스를 사용해 10개의 주성분을 찾아 변환했습니다. 변환된 데이터셋의 크기는 얼마일까요?

ㆍ 정답 : (1000, 10)

ㆍ 풀이 : 샘플의 개수(1000)는 그대로이고 특성 개수만 10으로 바뀌기 때문이다.

문제3) 문제2에서 설명된 분산이 가장 큰 주성분은 몇 번째인가요?

ㆍ 정답 : 첫 번째 주성분

ㆍ 풀이 : 주성분 분석은 분산이 가장 큰 방향부터 순서대로 찾기 때문이다.

'ML & DL/[한빛미디어] 혼공' Related Articles

Comments