더 아름다운 데이터 시각화의 비법은 무엇일까?

By | 2012년 5월 16일

정보시각화(Information Visualization)라는 분야는 점점 우리 삶에 밀접하게 다가오고 있습니다. 요즘 흔히 접하게 되는 트위터의 파급력과 영향력을 보여주는 그래프에서부터, 얼마 전 있었던 국회의원 선거의 데이터를 분석한 그래픽까지…

[출처: http://media.daum.net/2012g_election/district/11/]

사실 정보시각화라는 개념이 체계적으로 연구가 되기 시작한 것은 비교적 최근의 일이라 할 수 있습니다. 기술의 발달과 정보혁명으로 인류가 관찰하고 기록하는 데이터의 양이 폭증하면서(Big Data) 간단한 방법만으로는 더 이상 복잡한 정보를 쉽게 이해하거나 전달하기가 점점 불가능해지고 있기 때문이죠.
『아름다운 시각화(Beautiful Visualization)』는 정보시각화 연구 영역에서 현재 이루어지고 있는 다채로운 사례들을 다루고 있습니다. 미디어 아티스트, 프로그래머, 작가, 디자이너, 과학자, 분석가, 통계학자 등 총 스물네 명의 다양한 분야의 시각화 전문가가 각 영역에서 활용되는 시각화 기법을 소개합니다. 때문에 일반적인 회사 같은 곳에서 다루는 평이한(?) 데이터 외에도 모든 분야의 데이터가 더 멋지게 가공될 수 있다는 점을 효과적으로 확인할 수 있는 책입니다.

예를 들어 다음과 같은 자료들이 수록되어 있습니다.

 

 위 그림은  제105회기에서 제110회기까지의 미국 상원 구조(1997년 1월 3일부터 2009년 1월 3일까지)를 시각화한 것인데요. 자세한 설명은 다음과 같습니다.

·제105회기(1997년 1월 3일~1999년 1월 3일). 이 회기 중에 공화당이 장악한 하원이 클린턴 대통령 탄핵안 표결을 했다. 민주당 구역에서 뚜렷한 분리가 나타나는데, 이 실험 기간 동안 규칙적으로 발생했다.
· 제106회기(1999년 1월 3일~2001년 1월 3일) 이 기간 중에 클린턴 대통령에 대한탄핵재판이 상원에서 열렸다. 하원처럼 상원도 공화당이 잡고 있었지만, 탄핵안은 부결되었다. 흥미롭게도 이 회기 중에 공화당 구역이 뚜렷하고 현저하게 분리가 되는데, 이는 전체 18년 간의 조사기간 중에 이렇게 뚜렷한 적은 흔치 않다.
· 제107회기(2001년 1월 3일~2003년 1월 3일) 9월 11일의 테러(그리고 나중에 상원을 겨냥한 탄저균 테러)가 이 회기 중에 일어났으며, 이라크 전쟁이 인가되었다. 진보적으로 분류되는 소수의 상원의원으로 구성된 민주당 구역에서 약간의 분열이 있었지만, 중심에서의 강도가 새로워진 기간으로, 1991년 이래로 어떤 때보다도 정당 노선을 넘어서는 강한 연결이 있었다.
· 제108회기(2003년 1월 3일~2005년 1월 3일). 이 회기 중에 이라크 전쟁이 발발했다. 이 기간은 벤 넬슨(민주당, 네브라스카 주) 이 올림피아 스노우(메인 주), 수잔 콜린스(메인 주), 놈 콜맨(미네소타 주) 로 구성된 소수의 공화당 온건파 집단과 투표 성향이 비슷했던 점을 예외로 두면, 104회 국회와 거의 유사했다. 나머지 공화당은 꽤 응집되어 있는 반면 민주당은 약간의 분열이 남아있다.
·제109회기(2005년 1월 3일~2007년 1월 3일) 공화당에게는 끔찍한 기간이었다. 톰 딜레이와 잭 아브라모프의 스캔들 법안 표결 시깊은 분열을 초래했던 테리 샤이보, 허리케인 카트리나 사건에 대한 대응 실패(‘브라우니, 당신은 일을 아주 엉망으로 했어!’) 가 모두 이 회기 중에 일어났다. 그럼에도 불구하고 공화당 구역은 놀랄만큼 긴밀하게 연결되어 있다. 반면에 커다란 민주당 구역이 작고 더 진보적인 그룹으로 쪼개지는 일이 지속되었다.
·제110회기(2007년 1월 3일~2009년 1월 3일) 이 회기 동안 민주당이 상원과 하원을 모두 장악했다. 이전과 달리 민주당 구역은 뚜렷하게 통합되어 보이는 반면, 공화당 구역은 쪼개지고 흩어져 있다.

또한 워들(wordle)이라는 새로운 개념도 살펴볼 수 있습니다. 워들은 자바 애플릿으로 구현된 텍스트 분석 도구입니다. 연설문 등에서 어떤 단어가 가장 많이 쓰이고, 중심이 되고 있는지를 분석하여 시각화할 수 있습니다.

[오바마의 연설문에서 나온 단어를 시각화한 워들]

위키백과 편집의 역사를 색상으로 시각화한 데이터도 있습니다.

[위키백과에 수록된 ‘Chocolate(초콜릿)’ 표제 문서의 역사 흐름 다이어그램. 각 색상은 같은 편집자가 작성한 텍스트를 뜻합니다.]

 

혹시 시각화에 대해 추가적으로 궁금하신 분이라면, 하단에 소개된 데이빗 맥캔들스의 TED 강연 “The beauty of Data Visualization”의 동영상을 보면 조금 더 도움이 될 것 같습니다.^_^

 

참고로, 국내에서도 인포그래픽을 전문으로 다루는 스타트업도 창업되고 있네요.
아래 인터뷰 기사들을 참고하세요.
인포그래픽웍스 http://www.channelit.co.kr/view/148597
바이스버사 http://www.channelit.co.kr/view/148624

 

☆ 아름다운시각화_sample.PDF ☆

2 thoughts on “더 아름다운 데이터 시각화의 비법은 무엇일까?

  1. Pingback: akaiving, seoul

  2. 레몬에이드

    요즘 인포그래픽이 한참 인기라서 그런지 발전도 빠른 것 같습니다

    아무래도 트랜트 토픽이 되면 보는 눈도 많고 그만큼 니드도 충분해서 그렇겠죠 ^^

    좋은 정보 감사합니다!

    Reply

댓글 남기기