- 통계학
- ORM
- update
- Queue
- 큐
- create
- count
- 완전검색
- N:1
- migrations
- SQL
- 이진트리
- outer join
- 백트래킹
- Article & User
- 트리
- stack
- delete
- Vue
- regexp
- 그리디
- 뷰
- DB
- 쟝고
- Tree
- distinct
- M:N
- drf
- 스택
- Django
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
목록데이터 분석 (17)
데이터 분석 기술 블로그
Left Join: 왼쪽 테이블의 모든 레코드와 일치하는 오른쪽 테이블의 레코드 출력Inner Join : 두 테이블의 교집합 출력Right Join: 오른쪽 테이블의 모든 레코드와 일치하는 왼쪽 테이블의 레코드를 출력Full Join: 두 테이블의 모든 레코드를 반환Union: 두 개 이상의 테이블을 수직으로 연결
데이터 합치기 및 결합: 여러 데이터 소스나 테이블 하나의 데이터 세트로 통합데이터 클렌징: 불필요한 공백, 특정 문자열의 삭제나 대체, 하나의 컬럼을 여러 컬럼으로 분리 및 병합집계 및 그룹화: 데이터를 그룹화하여 합계, 평균, 최대, 최소 등의 계산피벗: 엑셀의 피벗 테이블처럼 데이터를 재구성 가능플로우(Flow) 생성: 원본 데이터에서 시작하여 다양한 변형 및 처리 단계를 거처 최종 결과 데이터 세트를 생성하는 전체 과정을 저장하고 필요할 때마다 다시 실행해서 데이터 준비 가능실시간 미리보기: 데이터 분포, 중복된 값, 누락된 값 등을 시각적으로 빠르게 확인 가능완성된 데이터를 Tableau Desktop으로 직접 가져오거나, 다른 형식으로 저장하여 공유 가능
한 차트 내에서 두 개의 서로 다른 축을 가지는 그래프 표시 방법주로 두 가지 서로 다른 변수의 관계를 시각화하고 비교하는 데 사용 - 다른 척도나 단위로 측정이 가능두 번째 Y축을 이해하는 데 시간이 소요될 수 있음대안 1) 데이터 값을 직접 표시대안 2) 동일한 X축에 수직으로 별도의 Y축 만들기 왼쪽 축과 오른쪽 축을 모두 사용별도의 수직 축을 만들고 데이터를 직접 표시
한쪽에서 다른 쪽으로 흐르는 선을 통해 두 개 이상의 범주 간의 전환을 보여주며 데이터의 흐름을 설명차트가 복잡해질 수 있어 상황에 따라 더 간단한 차트 유형이 효과적일 수 있음흐름 또는 관계를 시각화하려는 것인가요?너무 많지도 또는 적지도 않은 범주를 가지고 있나요?데이터 해석에 능숙한 대상을 위해 만드는 것인가요? Sankey Chart의 예) 너무 많은 범주를 추가할 경우 해석이 어려워질 수 있음
데이터의 분포 파악에 용이함 - 최빈값, 최댓값, 중앙값, 사분위수를 시각적으로 제공아웃라이어 쉽게 파악 가능 - 상자 밖 위치한 데이터 값다른 변수 또는 그룹간의 분포 차이를 쉽게 확인 가능
가장 적합한 그래프는 무엇일까?청중이 쉽게 이해할 수 있는 그래프입니다.다양한 범주에 대한 총합 또는 서브 구성 요소들의 비교상/하단에 위치하지 않는 항목들 간의 상대적인 비교가 어려움비교하고 싶은 중요 값을 상/하단에 위치시키기 - 파란색 데이터가 주 데이터라면 가운데가 아닌 상/하단에 위치시키는 것이 좋음
가장 적합한 그래프는 무엇일까?청중이 쉽게 이해할 수 있는 그래프이다.히트맵 (heatmap)행과 열로 구성된 테이블 형태의 데이터를 색상 또는 그러데이션을 활용해 시각화큰 장점은 많은 정보를 한 번에 효과적으로 시각화 가능여러 변수의 상호작용이나 패턴 쉽게 파악 가능범례를 꼭 포함 시키기해당 범위의 말단에 위치한 값을 신속하게 찾을 수 있음중요 항목을 상단에 위치시켜 전달하고자 하는 메시지를 사용자가 빠르게 인식하도록 하기사람들은 데이터를 읽을 때 위에서 아래로 읽는 경향이 있음내가 표현하고자 하는 중요 데이터는 항상 상단에 위치하는 것이 좋음
데이터 스토리텔링의 6가지 원칙 (Book - Storytelling with data)해당 상황 정보를 이해한다.적합한 시각적 디스플레이를 선택한다.불필요한 시각적 요소는 제거한다. (ex. 불필요한 레이블, 다양한 색 등.)원하는 곳에 집중시켜야 한다. (색상, 크기, 형태 등)청중처럼 생각한다.스토리를 전달한다.Tableau Prep 이란?데이터를 정리하고 변형하여 분석이나 시각화에 적합한 형태로 돕는 Data Prep 도구직관적인 드래그 앤 드롭 인터페이스와 미리보기 기능을 통해 복잡한 데이터 준비 작업을 훨씬 쉽고 빠르게 수행 가능Tableau Desktop에서 분석 및 시각화 작업을 시작하기 전에 사용Tableau Prep Builder와 SQL/Python 차이Tableau Prep Buil..