Create Opportunities

[인공지능 응용] Anomlay Detection(5) 본문

이상 탐지

[인공지능 응용] Anomlay Detection(5)

kimjaeyoon 2022. 12. 2. 15:20

경계 기반 이상탐지 기법

 

1) One-class SVM (1-SVM)


일단 SVM을 요약해보면,

: 데이터 공간상에서 정상과 이상을 구분하는 경계선(= 판별 함수)을 직접 정의한다. 고차원 상에서의 SVM 학습은 Hyperplane을 구하는 것이다.

 

아니, 근데 정상만으로 학습하는데 정상과 이상의 분류 경계선을 어떻게 설정할 수 있냐 ?  이게 핵심이다.

hyperplane으로부터 각 class의 가장 인접한 관측치까지의 거리 (= Margin) 를 최대화!!

outlier에 강건하게, generalization 성능을 높이도록 hyperplane을 찾아야 한다.

maximal margin

위 수식은 SVM의 핵심이며, 증명은 그리 어렵지 않다... 잘 생각해보면 된다.


저차원 → 고차원(kernel trick) Mapping하여 선형 분류기(Hyperplane)를 찾고,

이를 다시 저차원으로 가져와서 boundary를 구할 수 있다.


One Class SVM은 어떠한 형태인가 ?

: 원점으로부터 정상 데이터를 밀어낼 수 있는 가장 먼 Hyperplane을 찾는다.

Objective function

1. Maximal margin

2. 원점에서 hyperplane 밀어낸다. 

3. 예외적인 data도 포함하도록 Hyperplane을 당겨준다. 

그냥 기억하려고 정리

SVM은 깊게 들어갈수록 어려운 것 같다. 시간될 때, 각잡고 좀 봐야겠다.