데이터 시각화는 데이터를 그래프와 차트로 표현하여 패턴과 인사이트를 발견하는 과정입니다.
1.6.1.1. 시각화의 목적¶
탐색적 분석 (EDA): 데이터의 분포, 패턴, 이상치 발견
설명적 시각화: 결과와 인사이트 전달
확인적 분석: 가설 검증
1.6.1.2. 차트 유형 선택 가이드¶
| 목적 | 권장 차트 |
|---|---|
| 분포 확인 | 히스토그램, 박스플롯, 바이올린 플롯 |
| 두 변수 관계 | 산점도, 선 그래프 |
| 범주별 비교 | 막대 차트, 점 그래프 |
| 시계열 추세 | 선 그래프, 영역 차트 |
| 비율/구성 | 파이 차트, 트리맵 |
| 다변량 관계 | 산점도 행렬, 히트맵 |
1.6.1.3. 색상 이론¶
import matplotlib.pyplot as plt
import seaborn as sns
# Qualitative (범주형)
sns.color_palette("Set2")
# Sequential (순차형 - 낮음에서 높음)
sns.color_palette("Blues")
# Diverging (발산형 - 중간값 기준)
sns.color_palette("RdBu")
# 색맹 친화적
sns.color_palette("colorblind")1.6.1.4. 좋은 시각화의 원칙¶
명확성: 메시지가 즉시 전달되어야 함
정확성: 데이터를 왜곡하지 않음
간결성: 불필요한 요소 제거
일관성: 스타일과 색상 통일
접근성: 색맹 고려, 명확한 레이블