R과 함께 떠나는 데이터 분석과 데이터 시각화 여행!

R 사용자 분들, 주목하세요-!

인사이트에서는 『R Cookbook』, 『R Graphics Cookbook』을 통해서 데이터 분석, 통계, 그래픽스 작업 등 다양한 분야에 활용할 수 있는 도구인 ‘R’을 소개해 왔습니다. 그리고 R 시리즈를 이을  세 번째 도서의 발간 소식을 전합니다~ 900페이지라는 방대한 분량에 R 데이터 시각화에 관한 (거의) 모든 것이 담긴 집필서!!
『R을 활용한 데이터 시각화』입니다.

『R을 활용한 데이터 시각화』(유충현, 홍성학 지음)
: 표지는 ‘먹’ 단색이지만.. 책장을 넘겨 보면 반전! 4도(컬러)로 제작된 책이랍니다’-' 

통계 및 데이터 분석용 언어인 R은 시각화에 대한 상당히 많은 기능을 포함하고 있습니다. 아래 그림은 R에서 다루고 지원하는 시각화 함수 및 패키지, 그래픽 장치에 대한 요약입니다. 간단해 보이지만, R 데이터 시각화가 얼마나 강력한 힘을 갖고 있는지를 담고 있습니다.

R 그래픽스 아키텍처

먼저 R은 윈도우, 유닉스 계열 등의 OS에서 작업한 시각화 결과를 다양한 그래픽 파일로 출력할 수 있습니다. 특히 데이터 시각화를 비교적 빠른 시간에 만들 수 있는 기본 기능과 부가적인 확장 기능을 갖고 있어 강력한 힘을 자랑하는데요! 점을 찍고 선을 그리는 등의 구현이 가능한 기초 함수(저수준 그래픽), 파이 차트나 막대 그래프와 같은 표현이 가능한 함수(고수준 그래픽) 뿐만 아니라 외부 시각화 애플리케이션(구글 맵 등)과 R을 연동할 수도 있습니다.

이렇게 시각화를 위한 R 그래픽 기능의 구조를 보고 나니, 데이터 시각화가 데이터 분석에 있어 중요한 자리를 차지하고 있다는 게 느껴지네요!

그런데 이처럼 강력한 R은 우리에게 친숙한 GUI 환경에서 마우스 클릭 몇 번으로 그래프를 짠! 하고 만들어 주지는 않습니다. R로 시각화 작업을 하려면 위에서 설명하는 그래픽 장치와 다양한 시각화 함수를 이해해야 합니다. 따라서 제대로 배우려면 다소 시간이 필요한데요. 조급함을 가진다면 금세 지치겠지요! 긴 여행이 될 수 있지만, 『R을 활용한 데이터 시각화』를 믿고(든든!) 시각화의 세계를 향해 본격적으로 떠나 보세요! 원시 데이터를 멋진 시각화로 다시 태어나게 하는 흥미로운 시간이 여러분을 기다리고 있습니다. :)

서울시 돌발상황을 HexBin 플롯으로 출력한 결과 (7장 ‘유용한 플롯’ 중)

* 이 책의 특징

- R 그래픽스, 씹고 뜯고 맛 보기!

데이터를 시각화하려면, R에서 제공하는 그래픽 관련 기능과 기술을 반드시 이해해야 합니다. 이 책은 데이터 시각화에 막 발을 디딘 분들을 위해 그래픽을 구현하는 장치에 대한 설명부터 시작해 저수준 그래픽 함수,  고수준 그래픽 함수를 꼼꼼히 소개합니다. 각 함수마다 빠짐없이 들어간 연습문제와 실행 결과로 책에 실용성을 더했고, 시각화 함수와 함수의 인수 인덱스를 부록으로 추가해 레퍼런스로서의 역할에도 충실합니다. 또한 사용자정의 함수 만들어 보면서 한 단계 더 나아갈 수 있는 길을 제시하고, 최근 R 그래픽스의 대세인 ggplot2를 200여 쪽 분량으로 상세히 다루고 있어 R의 강력한 기능을 제대로 정!복!할 수 있습니다.
그래픽스 기초뿐만 아니라 유용한 시각화 기법까지 깊게 다루는 이 책으로, R 데이터 시각화를 씹고 뜯고 맛 보세요!

- 데이터에 의미를 더해, 가치 있는 시각화 만들기!

데이터를 어떤 차트로 표현해야 자신의 의도를 ‘제대로’ 담아낼 수 있을까요? 데이터 분석을 위한 기능 위주의 시각화든, 공유를 목적으로 만든 미려한 시각화든 정보를 효율적으로 전달해야 한다는 본질은 변함이 없습니다. 이 책에는 어떻게 하면 ‘좋은 시각화’, ‘효율적인 시각화’를 만들 수 있는지에 대한 저자의 노하우와 그 사례가 담겨 있습니다. 데이터 분석가로서의 경험을 녹여 만든 유용한 팁과 제안은 시각화를 만드는 과정에서의 고민을 덜어 주고, 시행착오를 줄일 수 있는 가이드가 되어 줄 것입니다.

페이지를 넘기다 보면, 저자 분들이 오랜 시간동안 정리해 공 들여 만든 책이라는 게 느껴집니다. 곳곳에서 데이터 분석과 데이터 시각화에 깊은 애정을 갖고 계심을 알 수가 있는데요. 특히 저자 서문에서 두 분의 데이터 시각화에 대한 철학과 각별함이 고스란히 전달되어 굉장히 인상적이었습니다. 아래 링크에서 데이터 분석과 데이터 시각화를 향한 유충현, 홍성학 님의 남다른 열정을 느껴 보시길 추천합니다. *_*

>>『R을 활용한 데이터 시각화』미리보기 (☜ 클릭!)

‘R 시각화의 길잡이’가 될 수 있도록 전력을 다해 완성된 『R을 활용한 데이터 시각화』. 여러분께 책의 의도가 잘 전달되어, 시각화에 있어 의미있는 안내서로 남기를 바랍니다.

 

* 아래 서점에서 구입하실 수 있습니다.
[Yes24] | [교보문고] | [알라딘] | [인터파크]

40년 세월을 견뎌낸 고전, 『맨먼스 미신』

고전의 힘은 세월을 견뎌내고 단순히 어제의 지식이 아니라 미래를 위해 그 빛이 바래지 않는 통찰을 전달하는 데 있다고 할 수 있습니다. 인사이트의 ‘프로그램, 프로그래밍, 프로그래머’ 시리즈에서는 IT 세계의 주요 고전을 소개해 드리기도 하는데요. 2014년 『피플웨어 3판』을 소개해 드린 데 이어 2015년에도 고전 한 권을 준비했습니다. 바로 1975년 첫 출간 이래로 수십 년간 IT 세계에 꾸준한 영향을 미치고 있는 『맨먼스 미신』입니다.

이 책의 지은이 프레더릭 브룩스는 학계로 옮기기 전 IBM 재직 시절 IBM 시스템/360 컴퓨터와 그 운영 체제인 OS/360 개발 프로젝트 관리자를 맡아 일한 바 있습니다. 그 시기의 경험과 배움을 담은 여러 에세이를 엮은 책이 바로 『맨먼스 미신』으로 이번에 소개해 드리는 판본은 1995년 발간된 20주년 기념판입니다.

이 책에는 총 19편의 에세이가 실려 있고 그중 잘 알려진 것 중 한 편이 바로 이 책의 제목이기도 한 ‘맨먼스 미신’입니다. 프레더릭 브룩스는 이 책을 통해 소프트웨어 개발의 본질과 관련된 중요한 여러 주제를 제기합니다.

부족한 시간 탓에 망가진 소프트웨어 프로젝트 수는 다른 이유로 그렇게 된 경우를 모두 합한 것보다도 많다. – p.13

시스템 프로그래밍 일정 관리의 바탕을 이루는 잘못된 가정 중 첫 번째는 모든 일이 잘 될 거라는, 다시 말해 ‘모든 작업이 예정된 시간 내에 완료될 것’이라는 가정이다. – p.14

소프트웨어를 만든다는 것은 본래 조직적인 활동, 즉 복잡한 상호연관성을 가진 활동이기 때문에 의사소통에 품이 많이 들 수밖에 없으며, 작업 분할로 확보된 개별 업무 시간을 금방 잠식해 버린다. 따라서 사람을 더 투입하는 것은 일정을 단축시키기는커녕 더 늘어지게 만든다. – p.19

일반적인 방법으로 일정을 관리했던 프로젝트들을 살펴보다가 발견한 사실은, 일정의 절반을 테스트에 배정한 경우는 거의 없었지만 대부분 나중에는 그만큼의 시간을 결국 테스트에 썼다는 것이다. – p.20

나는 개념적 일관성이야말로 시스템 설계에서 가장 중요하게 고려할 사항이라 주장하고자 한다. 좋기는 하지만 연관성 없고 조율도 안 된 기능을 많이 넣기보다는, 이례적인 일부 기능이나 개선 사항을 빼더라도 일련의 설계 사상을 고수하는 편이 더 낫다. – pp.41-42

매뉴얼은 제품에 대한 ‘외부적인’ 명세로, 사용자가 보게 되는 모든 세부 사항을 기술하고 규정한다. 따라서 이것은 아키텍트의 가장 주요한 산출물이다. – p.61

공간 부족 때문에 골머리를 앓는 프로그래머라면, 스스로를 코드로부터 해방시킨 다음 한 발짝 뒤에서 데이터를 바라봄으로써 종종 최상의 결과를 얻을 수 있다. 표현 방법이 바로 프로그래밍의 정수인 것이다. – p.103

관리자의 과업은 계획을 세우고 그것을 실현하는 것이다. 그러나 오직 글로 적은 계획만이 명확하며 전달 가능하다. – p.111

“설계를 문서화함으로써 설계자는 모든 이의 비판에 스스로를 노출시키게 되며, 이제 자신이 작성한 모든 것을 방어할 수 있어야 한다. 만약 조직 구조가 어떤 면에서든 위압적인 상황이라면, 완벽한 방어가 가능해질 때까지 그 어떤 내용도 문서화되지 않을 것이다.” – p.118

기술 직군에서 해당 직급에 대응되는 관리 직군으로 재배치될 때는 결코 승급을 동반해서는 안 되며, 반드시 ‘승진’이 아닌 ‘재배치’로 공표되어야 한다. 그 역의 재배치는 항상 승급을 동반해야 한다. 그러한 과잉 보상은 문화적인 측면의 파급력을 감안할 때 필요한 일이다. – p.119

프로젝트는 어떻게 해서 1년 늦어지는가? … 한 번에 하루씩. – p.153

나는 한 발 더 나아가서, 고객들이 현대 소프트웨어 제품의 요구 사항을 완전하고 엄밀하고 정확하게 명세하는 일은, 그들이 설령 엔지니어들과 함께 일한다 해도 정말로 불가능하며, 그것은 명세하려는 제품의 실제 버전을 몇 개 만들고 시험해 본 후에나 가능하다고 주장하고자 한다. – p.210

예상되기는 하나 확실치는 않은 장래의 이익을 보고 돈을 미리 거는 행위는 투자자들이 날마다 하는 일이다. 하지만 상당수의 프로그래밍 조직에서는 이런 행위에 기술적 역량이나 행정적 능숙함보다 더 드문 덕목인 진정한 경영적 용기가 필요하다. – p.235

사용자가 인지하는 제품의 모든 측면에 개념적 일관성을 부여할 책임을 맡을 한 사람을 그 제품의 ‘아키텍트’로 임명하는 것이 가장 중요한 조치이다. – p.276

다 소개하지는 못하지만 이 외에도 여러 주제를 다루고 있습니다. 어찌 보면 당연하고 새로울 것이 없는 내용이고 그동안 많은 발전이 있어온 것도 사실이지만 IT 업계는 다른 분야에 비해 역사가 짧아서인지 이러한 질문에 대해 근본적인 답을 내지 못하거나 본질적 돌파구를 찾지도 못하고 있는 모습도 보입니다. “모두들 인용하고, 그중 일부는 읽어보기도 하지만, 거기 담긴 내용을 따르는 사람은 드물지요.”라는 브룩스의 말처럼 출간된 지 수십 년이 된 책의 내용이 여전히 다가와서 신경을 쓰이게 하는 것은 그 때문인 듯합니다.

이 20주년 기념판에는 1판에는 실리지 않았던 1986년 논문 「은 탄환은 없다」가 수록되었고 「은 탄환은 없다」 발표 이후 브룩스의 견해가 보충되었으며, 초판의 내용을 회고하고 브룩스의 주장을 재검토하는 장들이 추가되었습니다. 또 한국어판에는 이 책이 쓰일 당시의 컴퓨터 환경에 생소한 독자들의 이해를 돕기 위해 이 책에서 언급되는 옛날 컴퓨터에 대한 설명을 부록으로 실었습니다.

맨먼스 미신 발간 기념으로 작은 이벤트를 준비 중이고 인사이트 페이스북을 통해 공지할 예정입니다. 많은 관심 부탁드립니다.

다음 서점에서 구입하실 수 있습니다.

YES24 | 교보문고 | 인터파크 | 알라딘