일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- Digital Pathology
- 밀도 기반 이상탐지
- Inatance segmentation
- auto encoder
- Clustering 기반 이상탐지
- Fixed Learning
- 국비지원교육
- Meta heuristic
- XAI
- Generative modeling
- OCSVM
- Tomek links
- GAN
- PM4Py
- One-Sided Selection
- Random Undersampling
- Process Mining
- SQL 데이터 분석 첫걸음
- multi modal
- 프로세스 마이닝
- Sequence data
- 병리 AI
- Petri net
- 딥러닝
- 거리 기반 이상탐지
- Gausian Density Estimation
- Text generation
- Condensed neares neighbor rule
- Data Imbalance
- Grad-CAM
- Today
- Total
Create Opportunities
[데이터 시각화] Tableau Basic 본문
1. 데이터 연결
: 데이터를 분석하기 위해 여러 데이터를 결합하는 방법.
예전에는 Join 방식을 사용했는데, 태블로가 발전하면서, 자동으로 적절한 Join을 만들어줄 수 있게 되었다. Table을 가져다 놓기만 하면, 각각 Table을 유지하여 집계값이 중복되지 않도록 하면서 Join을 해준다.
2. Basic Chrat
1. Scatter Plot - 원의 크기 및 투명도 조절 가능
2. Line Chart - 추이 분석에 용이
3. Bar Chart - sort 활용, 개별 bar를 드래그하여 그룹 생성 가능
4. Map
+ 계층을 잘 사용하자.
1. +/- 버튼으로 뷰의 세부 수준을 쉽게 바꿀 수 있다. 즉, 좋은 UI로 차원/측정값을 빠르게 선택 가능하다.
2. 필터링을 할 때 상위 계층을 선택하면 거기에 해당하는 하위 카테고리만 필터링이 가능하다. (예: 시도 필터에서 '서울시' 선택 > 시군구 필터에서는 서울시 내의 구만 보이게 된다.)
3. 3가지 핵심 개념
1. 차원 / 측정값
차원은 숫자를 자루는 기준(범주형 데이터) / 측정값은 숫자(수치형 데이터)라고 볼 수 있다.
태블로의 모든 데이터는 둘 중 하나로 분류가 되며, 둘이 함께할 때 인사이트가 생긴다. 측정값은 차원으로 쪼개져야 의미를 갖게 된다.
2. 연속형 / 불연속형
불연속형이 파란색이고 연속형이 초록색이다.
불연속형 : 개별적으로 구분되는 데이터 / 머리글(Header) / 정렬 가능
연속형 : 연속적 순서가 있는 데이터 / 축 (Axis)
색상 마크에 올려놨을 때 / 필터 카드에 올려놨을 때 두 Type은 차이가 존재한다.
3. 태블로 집계 방식
계산된 필드 만들기 : 태블로 안에서 새로운 데이터를 만들어서 분석하기 위함.
Row-level 계산 vs Aggregate 계산 (= [Profit / Sales] vs [SUM(Profit) / SUM(Sales)] : Aggregate 계산이 옳다.)
Row-level 계산은 Profit / Sales를 따로 따로 계산한 뒤에 합한 결과이기 때문에 옳지 않다. (측정값은 결과적으로 집계되기 때문에 마지막으로 최종 합계로 계산해버리는 것임.)
쿼리문으로도 필드를 만들 수 있다.
Row-level : SELECT SUM(Profit / Sales) FROM Orders
Aggregate : SELECT SUM([Profit]) / SUM([Sales]) FROM Orders