- Article & User
- 쟝고
- regexp
- 완전검색
- 그리디
- 뷰
- 큐
- N:1
- 이진트리
- delete
- outer join
- count
- 백트래킹
- drf
- Django
- SQL
- create
- ORM
- migrations
- Queue
- M:N
- DB
- Vue
- Tree
- 트리
- stack
- 통계학
- 스택
- update
- distinct
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
목록데이터 분석/Tableau (8)
데이터 분석 기술 블로그
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bZdqOB/btsLTQcK4Or/4KOXTte6oVz1VlJDhLCkeK/img.png)
Left Join: 왼쪽 테이블의 모든 레코드와 일치하는 오른쪽 테이블의 레코드 출력Inner Join : 두 테이블의 교집합 출력Right Join: 오른쪽 테이블의 모든 레코드와 일치하는 왼쪽 테이블의 레코드를 출력Full Join: 두 테이블의 모든 레코드를 반환Union: 두 개 이상의 테이블을 수직으로 연결
데이터 합치기 및 결합: 여러 데이터 소스나 테이블 하나의 데이터 세트로 통합데이터 클렌징: 불필요한 공백, 특정 문자열의 삭제나 대체, 하나의 컬럼을 여러 컬럼으로 분리 및 병합집계 및 그룹화: 데이터를 그룹화하여 합계, 평균, 최대, 최소 등의 계산피벗: 엑셀의 피벗 테이블처럼 데이터를 재구성 가능플로우(Flow) 생성: 원본 데이터에서 시작하여 다양한 변형 및 처리 단계를 거처 최종 결과 데이터 세트를 생성하는 전체 과정을 저장하고 필요할 때마다 다시 실행해서 데이터 준비 가능실시간 미리보기: 데이터 분포, 중복된 값, 누락된 값 등을 시각적으로 빠르게 확인 가능완성된 데이터를 Tableau Desktop으로 직접 가져오거나, 다른 형식으로 저장하여 공유 가능
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/kzjm9/btsLQ5PuWhg/CYjPbmnNKNoy4sNer4cET1/img.png)
한 차트 내에서 두 개의 서로 다른 축을 가지는 그래프 표시 방법주로 두 가지 서로 다른 변수의 관계를 시각화하고 비교하는 데 사용 - 다른 척도나 단위로 측정이 가능두 번째 Y축을 이해하는 데 시간이 소요될 수 있음대안 1) 데이터 값을 직접 표시대안 2) 동일한 X축에 수직으로 별도의 Y축 만들기 왼쪽 축과 오른쪽 축을 모두 사용별도의 수직 축을 만들고 데이터를 직접 표시
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bGjWNj/btsLS6snvfd/p1lXulEZF3JgkLDlPxKQP1/img.png)
한쪽에서 다른 쪽으로 흐르는 선을 통해 두 개 이상의 범주 간의 전환을 보여주며 데이터의 흐름을 설명차트가 복잡해질 수 있어 상황에 따라 더 간단한 차트 유형이 효과적일 수 있음흐름 또는 관계를 시각화하려는 것인가요?너무 많지도 또는 적지도 않은 범주를 가지고 있나요?데이터 해석에 능숙한 대상을 위해 만드는 것인가요? Sankey Chart의 예) 너무 많은 범주를 추가할 경우 해석이 어려워질 수 있음
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/cE50DQ/btsLRoH46LK/bEJksdp762MI5eCkGOL84K/img.png)
데이터의 분포 파악에 용이함 - 최빈값, 최댓값, 중앙값, 사분위수를 시각적으로 제공아웃라이어 쉽게 파악 가능 - 상자 밖 위치한 데이터 값다른 변수 또는 그룹간의 분포 차이를 쉽게 확인 가능
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/ct4VGx/btsLQMJrvI1/0oCrgEkibXwQG1okyUoVhk/img.png)
가장 적합한 그래프는 무엇일까?청중이 쉽게 이해할 수 있는 그래프입니다.다양한 범주에 대한 총합 또는 서브 구성 요소들의 비교상/하단에 위치하지 않는 항목들 간의 상대적인 비교가 어려움비교하고 싶은 중요 값을 상/하단에 위치시키기 - 파란색 데이터가 주 데이터라면 가운데가 아닌 상/하단에 위치시키는 것이 좋음
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/c8yrZu/btsLN9wb2U3/YCJLaI2AXws4RcMLGHEsb0/img.png)
가장 적합한 그래프는 무엇일까?청중이 쉽게 이해할 수 있는 그래프이다.히트맵 (heatmap)행과 열로 구성된 테이블 형태의 데이터를 색상 또는 그러데이션을 활용해 시각화큰 장점은 많은 정보를 한 번에 효과적으로 시각화 가능여러 변수의 상호작용이나 패턴 쉽게 파악 가능범례를 꼭 포함 시키기해당 범위의 말단에 위치한 값을 신속하게 찾을 수 있음중요 항목을 상단에 위치시켜 전달하고자 하는 메시지를 사용자가 빠르게 인식하도록 하기사람들은 데이터를 읽을 때 위에서 아래로 읽는 경향이 있음내가 표현하고자 하는 중요 데이터는 항상 상단에 위치하는 것이 좋음
데이터 스토리텔링의 6가지 원칙 (Book - Storytelling with data)해당 상황 정보를 이해한다.적합한 시각적 디스플레이를 선택한다.불필요한 시각적 요소는 제거한다. (ex. 불필요한 레이블, 다양한 색 등.)원하는 곳에 집중시켜야 한다. (색상, 크기, 형태 등)청중처럼 생각한다.스토리를 전달한다.Tableau Prep 이란?데이터를 정리하고 변형하여 분석이나 시각화에 적합한 형태로 돕는 Data Prep 도구직관적인 드래그 앤 드롭 인터페이스와 미리보기 기능을 통해 복잡한 데이터 준비 작업을 훨씬 쉽고 빠르게 수행 가능Tableau Desktop에서 분석 및 시각화 작업을 시작하기 전에 사용Tableau Prep Builder와 SQL/Python 차이Tableau Prep Buil..