자기조직화지도(SOM)
코호넨 맵이라고도 알려져 있음
비지도 신경망으로 고차원의 데이터를 이해하기 쉬운 저차원의 뉴런으로 정렬하여 지도의 형태로 형상화
구성
입력층(input layer)
입력 변수의 개수와 동일한 뉴런 수 존재
학습을 통하여 경쟁층에 정렬되는 것을 지도라 부름
입력층의 뉴런은 경쟁층의 뉴런들과 연결되어 있으며, 완전 연결되어 있음
경쟁층(competitive layer)
경쟁 학습으로 연결강도를 반복적으로 재조정하여 학습. 연결강도는 입력패턴과 가장 유사한 경쟁층 뉴런이 승자가 됨
입력 층의 표본 벡터에 가장 가까운 프로토타입 벡터를 선택해 BMU(Best-Matching-Unit)라 부름
승자 독점의 학습 규칙에 따라 위상학적 이웃에 대한 연결 강도를 조정하고, 경쟁층에는 승자 뉴런만이 나타나며 승자와 유사한 연결 강도를 갖는 입력 패턴이 동일한 경쟁 뉴런으로 배열됨
승자 독점
BMU
-
특징
지도 형태로 형상화하기에 시각적으로 이해가 쉬움
실제 데이터가 유사하면 지도상에서 가깝게 표현 → 패턴 발견, 이미지 분석에 뛰어난 성능
전방패스
하나의 전방 패스를 사용함으로써 인공신경망보다 속도가 빠름. 실시간 학습처리가 가능한 모형
다차원척도법(MDS)
객체간 근접성을 시각화 하는 통계기법
특징
개체들을 2차원 또는 3차원 공간상에 점으로 표현
개체들을 2차원 또는 3차원 공간상에 점으로 표현하여 개체들 사이의 집단화를 시각적으로 표현하는 분석 방법
데이터 속에 잠재해 있는 패턴, 구조를 찾아냄
→ 소수 차원의 공간에 기하학적으로 표현
데이터 축소의 목적
데이터 축소의 목적으로 다차원척도법을 이용
→ 데이터에 포함되는 정보를 끄집어내기 위해서 탐색수단으로써 사용
유클리드 거리행렬 활용
유클리드 거리행렬을 활용
→ 적합 정도를스트레스 값으로 나타냄
→ 공간상에 표현하기 위한 방법은 부적합도 기준으로 STRESS나 S-STRESS 사용
→ 부적합도를 최소로 하는 반복알고리즘을 이용. 일정 수준 이하가 될 때 적합한 모형으로 제시
-
다차원척도법 종류
계량적 MDS (구간, 비율 척도)
데이터가 구간척도나 비율척도
개체들간의 유클리드 거리행렬을 계산하고, 개체들간의 비유사성S를 공간상에 표현
비계량적 MDS (순서 척도)
데이터가 순서척도
순서척도를 거리의 속성과 같도록 변환하여 거리를 생성한 후 적용
'🥇 certification logbook' 카테고리의 다른 글
[python 데이터 핸들링] 판다스 연습 튜토리얼 - 04_Apply , Map (0) | 2023.06.13 |
---|---|
[python 데이터 핸들링] 판다스 연습 튜토리얼 - 03_Grouping (0) | 2023.06.13 |
[python 데이터 핸들링] 판다스 연습 튜토리얼 - 02 Filtering & Sorting (0) | 2023.06.09 |
[python 데이터 핸들링] 판다스 연습 튜토리얼 - 01 Getting & Knowing Data (0) | 2023.06.08 |
앙상블 (Ensemble) - 랜덤 포레스트 분류 (Random Forest Classifier) (0) | 2023.06.07 |
다중 회귀 (Multiple Regression Model) (0) | 2023.06.07 |
다항 회귀 (Polynomial Regression Model) (0) | 2023.06.06 |
단순 선형 회귀 (Simple Linear Regression Model) (0) | 2023.06.06 |