728x90
반응형
여러 변수들의 변량을 ‘주성분’이라는 서로 상관성이 높은 변수들의 선형결합으로 만들어 기존의 상관성이 높은 변수들을 요약, 축소하는 기법
소수의 주성분으로 차원을 축소함으로써 데이터를 이해하기 쉽고 관리하기 쉽게 해줌 상관관계가 높은 다중공선성을 상관성이 없는 주성분으로 축소 후 모형에 활용
→ 추가로 군집분석을 수행하면 군집화 결과의 연산속도를 개선할 수 있음
# 데이터 불러오기
data(USArrests)
# 주성분분석 수행
pca <- prcomp(USArrests, scale = TRUE)
# 분석 결과 출력
summary(pca)
주성분 선택법
누적기여율(cumulative proportion)
누적기여율(cumulative proportioon)이 85%이상이면 주성분의 수로 결정할 수 있음
Scree plot (→ 수평)
scree plot을 활용하여 고유값이 수평을 유지하기 전단계로 주성분의 수를 선택
고유값의 크기순으로 산점도를 그린 그래프에서 감소하는 추세가 원만해지는 지점에서 1을 뺀 개수를 주성분으로 선택
R 주성분 분석
princomp(USArrests,cor=TRUE)
→ cor=TRUE면 상관계수행렬 이용. : 각 변수가 보유한 단위 차이에서 오는 문제를 해결할 수 있음
cor=FALSE면 공분산행렬 이용. : 고윳값이 1보다 큰 주성분의 수를 사용
요인분석 vs 주성분분석

728x90
반응형
'🥇 certification logbook' 카테고리의 다른 글
다중 회귀 (Multiple Regression Model) (0) | 2023.06.07 |
---|---|
다항 회귀 (Polynomial Regression Model) (0) | 2023.06.06 |
단순 선형 회귀 (Simple Linear Regression Model) (0) | 2023.06.06 |
분석환경 설정 (Visual Studio Code + 주피터노트북) (0) | 2023.06.05 |
[ADsP] 비지도학습 - 연관 분석 (0) | 2023.06.05 |
[ADsP] 지도학습 - 분류 분석 (0) | 2023.06.05 |
[ADsP] 지도학습 - 시계열 분석 (0) | 2023.06.04 |
[ADsP] 지도학습 - 회귀분석 (0) | 2023.06.04 |