일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 딥러닝
- Condensed neares neighbor rule
- XAI
- 프로세스 마이닝
- SQL 데이터 분석 첫걸음
- GAN
- Data Imbalance
- Grad-CAM
- Gausian Density Estimation
- Clustering 기반 이상탐지
- 병리 AI
- Meta heuristic
- 거리 기반 이상탐지
- PM4Py
- multi modal
- Random Undersampling
- Fixed Learning
- Petri net
- Digital Pathology
- auto encoder
- Inatance segmentation
- 국비지원교육
- Tomek links
- One-Sided Selection
- Process Mining
- 밀도 기반 이상탐지
- OCSVM
- Sequence data
- Text generation
- Generative modeling
- Today
- Total
목록전체 글 (51)
Create Opportunities

https://kimjaeyoonn.tistory.com/12 에서는 전반적인 프로세스 모델링의 한계점과 이벤트 로그로부터의 프로세스 마이닝을 어떻게 진행할 수 있는지를 살펴보았다. [데이터 애널리틱스] 프로세스 마이닝이란 ? (1) 프로세스 마이닝이란, Data dirven한 ML이나 DM의 Approach와 Process Centric한 BPM 관련된 내용을 모두 아우르는 분야이다. 이벤트로부터 프로세스 모델을 구축하거나, 기존의 모델을 가져와 사용하는 등 kimjaeyoonn.tistory.com 이번 챕터에서는 프로세스 모델을 표현하는 다양한 방식을 살펴본다. Event logs - 케이스들의 집합 - 케이스는 어떠한 Activity의 순서.. (trace) Event Logs의 확장 하나의 이벤..


프로세스 마이닝이란, Data dirven한 ML이나 DM의 Approach와 Process Centric한 BPM 관련된 내용을 모두 아우르는 분야이다. 이벤트로부터 프로세스 모델을 구축하거나, 기존의 모델을 가져와 사용하는 등의 Task를 수행할 수 있다. 프로세스 모델이란, 일정한 로테이션을 통해서 생겨나게 되며 작업들 혹은 세부 프로세스로 구성되어 있다. 이는 행위의 순서, 의사결정 지점, 시간 정보, 작업자 정보 등을 포함한다. 아래의 Petri net은 대표적인 Process model이다. 위 Petri net의 구성요소를 한 번 살펴보면, 1. 토큰 : 프로세스의 현 상태를 나타내는 점 (start에 위치한 점) 2. 활성화 : Transition 실행을 위한 모든 Place에 토큰이 있을..
보호되어 있는 글입니다.

Sampling method는 두 가지로 나뉘어진다. Under sampling : Majority class의 sample 수를 줄여. Over sampling : Minority class의 sample 수를 늘려. 1. Random undersampling : Majority class sample 수를 '임의로' 줄여. > Majority class에 overfitting 방지. 하지만, random seed에 따라 다양하게 결과가 도출됨. 2. Tomek links : 두 범주 사이를 탐지하고, 정리를 통해 부정확한 분류 경계선을 방지한다. x_i : 다수 클래스, x_j : 소수 클래스 d(x_i, x_k) < d(x_i, x_j) 또는 d(x_j, x_k) < d(x_i, x_j)가 되는 관..

부족한 레이블 데이터를 기준으로 어떻게 문제를 해결할 것인가, 1. 불균형 데이터의 특징 - Small disjuncts : 작은 군집의 데이터가 섞임 - Lack of density : 두 클래스가 있을 때, 특정 클래스의 데이터가 퍼져 있는 경우 (밀도가 상대적으로 sparse) - Overlapping or class separability (아래 이미지 참고) - Noisy data : 어떠한 기준에 의해 판별되는 값이 아니라, Outlier 그 이상의 오류값. Data handling 과정에서 발생 - Borderline examples : 정확도가 높은 학습 모델을 구축하기 어려운 case - Data shift : 데이터 분포의 형태가 점차 변화하는 경우 > 학습 모델 구축 어려움. 2. 데..

선형 계획법과 비선형 계획법 을 다루게 된다. 선형적인 모델링은 깊게 다루지 않는다. 데이터를 분석하는 데 있어서 선형적인 모델링을 하기에는 어렵다. 머신러닝, 딥러닝의 접근은 보통 비선형 계획의 접근이다. 최적화 : 어떤 목적에 대해서 가장 적절한 계획을 세워 설계하는 일, 그러한 선택을 하는 일. 수학적 최적화 : 특정 집합 위에서 정의된 실수값, 함수, 정수에 대해 그 값이 최대나 최소가 되는 상태를 해석하는 문제. 최적화를 위한 주요 요소 - 목적함수 (Objective function) - 결정 변수 (Decision variable) - 제약 조건 (Constraints) 절차 1) 주어진 문제에 대해 주요 요소를 확인하는 과정 (모델링) 2) 최적화 알고리즘을 적용하여 해답을 찾는 과정 Co..