이상 탐지
[인공지능 응용] Anomlay Detection(5)
kimjaeyoon
2022. 12. 2. 15:20
경계 기반 이상탐지 기법
1) One-class SVM (1-SVM)
일단 SVM을 요약해보면,
: 데이터 공간상에서 정상과 이상을 구분하는 경계선(= 판별 함수)을 직접 정의한다. 고차원 상에서의 SVM 학습은 Hyperplane을 구하는 것이다.
아니, 근데 정상만으로 학습하는데 정상과 이상의 분류 경계선을 어떻게 설정할 수 있냐 ? → 이게 핵심이다.
hyperplane으로부터 각 class의 가장 인접한 관측치까지의 거리 (= Margin) 를 최대화!!
outlier에 강건하게, generalization 성능을 높이도록 hyperplane을 찾아야 한다.
위 수식은 SVM의 핵심이며, 증명은 그리 어렵지 않다... 잘 생각해보면 된다.
저차원 → 고차원(kernel trick) Mapping하여 선형 분류기(Hyperplane)를 찾고,
이를 다시 저차원으로 가져와서 boundary를 구할 수 있다.
One Class SVM은 어떠한 형태인가 ?
: 원점으로부터 정상 데이터를 밀어낼 수 있는 가장 먼 Hyperplane을 찾는다.
1. Maximal margin
2. 원점에서 hyperplane 밀어낸다.
3. 예외적인 data도 포함하도록 Hyperplane을 당겨준다.
SVM은 깊게 들어갈수록 어려운 것 같다. 시간될 때, 각잡고 좀 봐야겠다.