본문 바로가기

Contact English

【알고리즘】 4강. 데이터 시각화

 

4강. 데이터 시각화

 

추천글 : 【알고리즘】 알고리즘 목차


1. 데이터의 표현 [본문]

2. 주요 시각화 그룹 [본문]

3. 상호작용 [본문]


 

1. 데이터의 표현 [목차]

 

 

2. 주요 시각화 그룹 [목차]

예시 프로그램

Tableau

Qlik

③ 파이썬 : Matplotlib, seaborn

④ R : ggplot2

⑤ java script : d3 (lower level), Vega (higher level)

⑵ 주요 저널

New York Times

② Washington Post

⑶ 주요 기업

Uber

Netflix

③ Facebook

 

 

3. 상호작용(interaction) [목차]

유형 1. DoD(details on demand)

① 정의 : 특정 데이터를 강조하여 보여주는 것

② 단점 : 데이터의 왜곡, 누락

1-1. 확대(focus) : 네비게이션 등

1-2. 팝업(pop-up)

1-3. 특정 지점 근처만 labeling을 하는 것

1-4. hyperbolic browser : context를 함께 보여주어 DoD의 단점을 개선

유형 2. 필터링(filtering)

① 정의 : 특정 조건의 데이터만 효시하는 것. DQ(dynamic query), dynamic filter라고도 함

② 예 : https://hogangnono.com/

③ 장점 : 빠름. 쉬움. 가역적. 특정 값에 대해 클러스터가 어떻게 달라지는지 알 수 있음

④ 단점 : 필터 부분이 자리를 차지. 두 개의 다른 쿼리에 대해 비교가 어려움. 데이터가 크면 느림

자료형에 따른 일반적인 전략

○ nominal scale (예 : binary variable) : 버튼

○ ordinal scale 중 cardinality가 낮은 경우 : 버튼

○ ordinal scale 중 cardinality가 높은 경우 : 슬라이더

○ interval scale : 슬라이더

○ ratio scale : 슬라이더

유형 3. 연결(linking)

① 정의 : 하나의 데이터를 두 개 이상의 뷰로 보여주는 것

예 1. 하나는 전체적인 context, 다른 하나는 DoD인 경우

예 2. brusing (filtering + DoD)

http://square.github.io/crossfilter/

https://observablehq.com/@d3/brushable-scatterplot-matrix

유형 4. 재구성

4-1. reconfigure : 주어진 데이터를 다른 arrangement로 재구성하는 것

https://bl.ocks.org/jasondavies/1341281

4-2. re-encode : 다른 종류의 그래프로 바꾸어 표현하는 것

유형 5. 애니메이션(animation)

① 정의 : 한 종류의 변수의 변화에 따른 그래프 개형을 보여주는 것

② 고려 사항 : 속도. user control vs automatic

 

입력: 2021.12.10 18:21