일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- Generative modeling
- PM4Py
- Meta heuristic
- 프로세스 마이닝
- SQL 데이터 분석 첫걸음
- Fixed Learning
- OCSVM
- Clustering 기반 이상탐지
- Tomek links
- XAI
- 밀도 기반 이상탐지
- 국비지원교육
- GAN
- Condensed neares neighbor rule
- Petri net
- auto encoder
- Digital Pathology
- Grad-CAM
- Text generation
- 딥러닝
- multi modal
- Process Mining
- One-Sided Selection
- Inatance segmentation
- 병리 AI
- Gausian Density Estimation
- Sequence data
- 거리 기반 이상탐지
- Data Imbalance
- Random Undersampling
- Today
- Total
목록auto encoder (2)
Create Opportunities

Auto Encoder를 활용하는 데 있어서 두 가지 측면을 고려해볼 수 있다. 첫 번째로는 Dimension reduction. 차원이 축소되는 부분, 두 번째로는 Generative model. Input 으로 돌아가는 부분 이라고 할 수 있다. 일단 Dimension reduction과 관련된 문제 상황을 예로 들어보자. NLP에서의 Embedding을 생각해볼 수 있는데, 음, 먼저 RNN은 input을 Encoding하여 RNN계열의 모델이 학습하고, 다시 output을 Decoding하게 되는데, 이 때 Word2Vec과 같은 Embedding 기법은 차원을 축소하여 Encoding한다. 이 과정을 Dimension reduction이라고 할 수 있겠다. Dimension reduction은 ..

Novelty : 본질적인 데이터는 같지만 유형이 다른 관측치를 말한다. Annomaly : 대부분의 데이터와 본질적인 특성이 다른 관측치를 말한다. (전혀 다른 방식으로 생성되었을 것으로 추정) 이상치 탐지는 어떻게 하는 것일까 ? 가장 기본적으로 생각할 수 있는 것은 정상과 불량을 구별할 수 있는 모델을 만드는 것이다. 변수들의 값들을 기반으로 y 레이블이 0인지 1인지, 지도학습 기반으로 이상치를 탐지할 수 있다. Logistic Regression 이나 Gradient Boosting 모델 등의 분류 모델을 사용할 수 있다. 하지만, 특정 데이터가 정상인지 불량인지 Label을 정확히 모르는 경우에는 이를 적용하는데 한계가 있다. 비지도 학습 기반 이상치 탐지에는 다양한 방법론이 존재한다. 1. ..