Create Opportunities

[데이터 애널리틱스] 프로세스 마이닝이란 ? (1) 본문

데이터 애널리틱스

[데이터 애널리틱스] 프로세스 마이닝이란 ? (1)

kimjaeyoon 2022. 10. 2. 16:06

프로세스 마이닝이란,

Data dirven한 ML이나 DM의 Approach와 Process Centric한 BPM 관련된 내용을 모두 아우르는 분야이다. 이벤트로부터 프로세스 모델을 구축하거나, 기존의 모델을 가져와 사용하는 등의 Task를 수행할 수 있다. 

 

프로세스 모델이란, 일정한 로테이션을 통해서 생겨나게 되며 작업들 혹은 세부 프로세스로 구성되어 있다. 이는 행위의 순서, 의사결정 지점, 시간 정보, 작업자 정보 등을 포함한다.

아래의 Petri net은 대표적인 Process model이다.

Petri net의 구성요소를 한 번 살펴보면,

1. 토큰 : 프로세스의 현 상태를 나타내는 점 (start에 위치한 점)

2. 활성화 : Transition 실행을 위한 모든 Place에 토큰이 있을 경우

3. 점화 : 작업 활성화 

4. 마킹 : Petri net에서 Place에 토큰이 배치된 상태

 

Process Modeling의 목적 : insight, discussion, documentation, verification, performance analysis, animation, simulation, configuration, specification...

 

위와 같은 모델링은 도메인에 대한 전문가가 수작업으로 진행하곤 한다. 이상적인 모델과 실제 상황의 간극이 발생할 수 있음. 대표적인 사례로는 SAP가 있다. 여기서 많이 파는 software가 ERP system인데,,,  해당 시스템에서는 Reference로써 Best practice를 제공한다. 여기서는 20%의 결험(Deadlock, Livelock)을 포함함.

 

즉, 프로세스 모델에 관심이 있고, 이벤트 데이터가 충분하며, 수작업으로 작성한 모델의 한계가 있는 상황에서 이벤트 데이터와 모델을 연계하는 것은 의미가 있다.

 

BPM Lifecycle

프로세스 마이닝은 데이터와 모델을 모두 커버하는 측면이기 때문에, BPM lifecycle 전체 범위에서 충분히 활용될 수 있는 분야이다.

 

Event Logs

1. 이벤트 : 특정한 작업과 케이스에 관련

2. 작업 : 프로세스를 구성하는 명확하게 정의된 하나의 단계

3. 케이스 : 프로세스를 거치는 각 구분자

자취(Trace) : 케이스별로 기록되는 작업의 순서

 

# 프로세스 마이닝의 세 가지 종류 

1. 도출 (Discovery)

- 이벤트 로그에서 프로세스 관련 모델 생성

2. 적합도 검사(Conformace checking)- 프로세스 모델과 이벤트 로그 비교- 로그에 기록된 현실이 모델에 부합하는지, 모델이 현실에 부합하는지 확인- 부정 사례 발견 (Four eyes principle : 특정 작업은 한 사람이 수행 불가)3. 향상 (Enhancement)- 프로세스 관련 정보를 활용하여 모델 확장 및 개선- 모델 Repair, 확장

3. 향상

 

# 프로세스 마이닝의 네 가지 관점

1. Control-flow perspective(프로세스 흐름) : AND, OR, XOR

2. Organizational perspective (조직) : 자원(사람, 시스템,역할, 부서...)

3. Case perspective (케이스) : 특정한 케이스 중심

4. Time perspective (시간) : 병목 현상 도출, 서비스 수준 측정 

종류와 관점의 관계 (수평적, 수직적 구성)

 

프로세스 마이닝 적용 방법

- Off-line : 프로세스를 개선할 목적으로 사후에 분석하는 것

- On-line : 프로세스가 진행되고 있는 도중에 분석하는 것

 

 

- Event log -> Simplified Event log (Set of Trace) -> Alpha algorithm을 통해서 Petri net 구축할 수 있다. 

Set of Trace에서 일부만 가지고 모델링 한다면, underfitting 혹은 overfitting될 수 있다. 

 

- Process discovery를 진행할 경우 overfigging과 underfitting을 잘 고려해야 함.

- Concurrency(동시성)도 잘 고려해야 한다. 

- Incompleteness(이벤트 로그 중 일부만 포함된 경우), Noise도 잘 고려해야함. 

 

- Conformance : 프로세스 모델과 이벤트 로그를 비교하는 작업.

ex) 프로세스 모델로 설명이 되지 않는 Trace를 발견

 

 

- Play-Out

- Play-In

- Replay (event log & process model)

: 적합도 검사, 모델 확장, 에측 모형 구축, 운영 지원