R을 활용한 데이터 시각화

지은이: 유충현, 홍성학

정가 : 50,000원

페이지: 884

출간일 : 2015년 4월 30일
ISBN :  978-89-6626-142-0

<저자소개>

유충현

일찍이 데이터 분석 도구인 R의 매력에 흠뻑 빠져서, 지금껏 헤어나오지 못하고 있다. 데이터 분석의 본질은 데이터에 있고, 데이터 시각화가 데이터의 본질을 꿰뚫을 수 있는 최선의 방법이라는 신념을 가지고 있으며, R과 통계학에 대한 몇몇 서적을 집필하였다. 현재 R의 자유와 공유의 사상이 공공기관과 기업의 현장에서도 꽃피우는 세상을 꿈꾸며, 오늘도 R 코드를 주무르고 있다.

홍성학

대학원에서 텍스트마이닝과 기계학습을 전공한 후 글로벌 포털사의 검색 엔지니어로 근무하였다. 또 국내 통신사에서 빅데이터 분석 전문 데이터 사이언티스트로 근무한 바 있으며, 현재는 온라인 광고 전문 회사에서 맥락 분석 및 추천 시스템 관련 데이터 사이언티스트로 일하고 있다. 개인적으로는 데이터 시각화와 데이터 분석 자동화에 대한 연구를 하고 있다.

<책 소개>

R과 동행하는 데이터 분석과 데이터 시각화 여행

R은 데이터 분석과 데이터 시각화를 위한 언어다. 이 책은 R이 제공하는 다양한 함수를 통해서 데이터를 인상적인 그래프나 플롯으로 표현하는 방법을 알려준다. 또한 여러분이 만든 사용자정의 함수를 적용해 더욱 다채로운 시각화가 가능하도록 구성하고 있어, 고급 활용법까지 학습하고 싶은 모든 이에게 적합하다. 약 900쪽의 방대한 분량에서 제공하는 수많은 예제를 학습하다 보면 어느덧 R은 물론 데이터 시각화 기법에도 능숙해진 자신을 발견할 것이다.

 

<목차>

1장 데이터 시각화
1.1 데이터 시각화
1.2 데이터 시각화의 목적 및 접근 방법
1.2.1 데이터 분석을 위한 시각화
1.2.2 분석 결과 공유를 위한 시각화
1.3 데이터 시각화의 기능
1.3.1 커뮤니케이션
1.3.2 디스커버리
1.3.3 인사이트
1.4 R 그래픽스
1.4.1 R 그래픽 장치 – 그래픽 윈도우
1.4.2 R 그래픽 장치 – 그래픽 파일
1.4.3 저수준 그래픽
1.4.4 고수준 그래픽
1.4.5 외부 애플리케이션 인터페이스
1.4.6 외부 그래픽 장치
1.5 유용한 R 그래픽 도구들
1.5.1 graphics 패키지
1.5.2 lattice 패키지
1.5.3 ggplot2 패키지
1.5.4 ggmap 패키지
1.6 R 시각화를 위한 길잡이
1.6.1 예제의 실행 환경
1.6.2 학습 가이드
1.6.3 프로그램 소스

2장 R 그래픽스의 기초
2.1 그래픽 장치
2.1.1 그래픽 장치의 분류
2.1.2 그래픽 장치의 구조
2.1.3 그래픽 장치의 운용
2.2 고수준 그래픽 함수
2.2.1 plot( ) 함수
2.3 저수준 그래픽 함수
2.3.1 저수준 그래픽 함수의 종류
2.3.2 점을 찍는 함수
2.3.3 선을 그리는 함수
2.3.4 면을 그리는 함수
2.3.5 문자를 그리는 함수
2.3.6 범례를 그리는 함수
2.3.7 좌표축을 그리는 함수
2.3.8 기타 저수준 그래픽 함수
2.4 par( ) 함수
2.4.1 mfrow, mfcol 인수와 유사함수
2.4.2 fig 인수
2.4.3 new 인수
2.4.4 bty 인수
2.4.5 pty 인수
2.4.6 type 인수
2.4.7 pch 인수
2.4.8 lty 인수
2.4.9 xlab, ylab 인수
2.4.10 xlim, ylim 인수
2.4.11 col 인수
2.4.12 cex 인수
2.4.13 srt 인수
2.4.14 tck 인수
2.4.15 tcl 인수
2.4.16 mar 인수
2.4.17 oma 인수
2.4.18 family, font 인수
2.4.19 fg, bg 인수
2.5 색상 표현하기
2.5.1 색상 표현 방법의 종류
2.5.2 색상 상수로 표현하기
2.5.3 색상 이름으로 표현하기
2.5.4 RGB 색상으로 표현하는 방법
2.5.5 색상 팔레트
2.5.6 알파 채널
2.5.7 색상 관련 함수들
2.6 R을 이용한 도형 그리기
2.6.1 원 그리기
2.6.2 다각형 그리기

3장 데이터 시각화 함수
3.1 시작하기에 앞서 학습할 내용
3.1.1 차트, 그래프, 플롯
3.1.2 벡터라이제이션
3.1.3 리사이클링 룰
3.2 graphics 패키지
3.2.1 barplot( ) 함수
3.2.2 boxplot( ) 함수
3.2.3 dotchart( ) 함수
3.2.4 hist( ) 함수
3.2.5 pie( ) 함수
3.2.6 stripchart( ) 함수
3.2.7 curve( ) 함수
3.2.8 matplot( ), matpoints( ), matlines( ) 함수
3.2.9 qqnorm( ), qqline( ), qqplot( ) 함수
3.2.10 sunflowerplot( ) 함수
3.2.11 symbols( ) 함수
3.2.12 assocplot( ) 함수
3.2.13 fourfoldplot( ) 함수
3.2.14 mosaicplot( ) 함수
3.2.15 pairs( ) 함수
3.2.16 coplot( ) 함수
3.2.17 stars( ) 함수
3.2.18 persp( ) 함수
3.2.19 contour( ) 함수
3.2.20 image( ) 함수
3.3.21 filled.contour( ) 함수

4장 사용자정의 그래프
4.1 사용자정의 그래프를 위한 기초 지식
4.1.1 플롯 영역의 구조
4.1.2 플롯을 생성하는 순서
4.2 사용자정의 플롯 그리기
4.2.1 삼각형의 내접원 그리기
4.2.2 원에 가까워지는 다각형
4.2.3 레이더 플롯 그리기
4.3 사용자정의 그래픽 함수
4.3.1 함수 작성 시 주의사항
4.3.2 날짜를 표현한 추이 그래프
4.3.3 그림자와 입체감 있는 선 그래프
4.3.4 산점도를 품은 박스 플롯
4.3.5 피라미드 플롯
4.3.6 주제도-산점도
4.3.7 주제도-파이 차트

5장 트렐리스 디스플레이
5.1 래티스 그래픽의 이해
5.1.1 트렐리스 디스플레이와 래티스 그래픽
5.1.2 래티스 그래픽의 구조
5.2 래티스 그래픽 장치
5.2.1 래티스 그래픽 장치의 운용
5.2.2 trellis.device( ) 함수
5.2.3 래티스 그래픽 장치 환경설정
5.3 래티스 그래픽 시작하기
5.3.1 고수준 래티스 함수의 종류
5.3.2 패널 함수
5.3.3 formula
5.3.4 xyplot( ) 함수
5.4 래티스 함수의 주요 인수들
5.4.1 subset
5.4.2 groups
5.4.3 drop.unused.levels
5.4.4 allow.multiple, outer
5.4.5 panel
5.4.6 panel.groups
5.4.7 aspect
5.4.8 layout
5.4.9 as.table
5.4.10 between
5.4.11 skip
5.4.12 strip
5.4.13 par.strip.text
5.4.14 key 314
5.4.15 auto.key
5.4.16 legend
5.4.17 prepanel
5.4.18 subscripts
5.4.19 page
5.4.20 main, sub, xlab, ylab
5.4.21 perm.cond
5.4.22 index.cond
5.4.23 xlim, ylim
5.4.24 scales
5.5 단변량 래티스 함수
5.5.1 barchart( ) 함수
5.5.2 bwplot( ) 함수
5.5.3 densityplot( ) 함수
5.5.4 dotplot( ) 함수
5.5.5 histogram( ) 함수
5.5.6 qqmath( ) 함수
5.5.7 stripplot( ) 함수
5.6 이변량 래티스 함수
5.6.1 qq( ) 함수
5.6.2 xyplot( ) 함수
5.7 삼변량 래티스 함수
5.7.1 levelplot( ) 함수
5.7.2 contourplot( ) 함수
5.7.3 cloud( ) 함수
5.7.4 wireframe( ) 함수
5.8 초변량 래티스 함수
5.8.1 splom( ) 함수
5.8.2 parallelplot( ) 함수
5.9 기타 래티스 함수
5.9.1 rfs( ) 함수
5.9.2 tmd( ) 함수
5.10 trellis 클래스 객체
5.10.1 trellis 클래스 객체의 출력
5.10.2 print.trellis( ) 함수
5.10.3 update.trellis( ) 함수

6장 ggplot2 그래픽스
6.1 ggplot2 소개
6.1.1 ggplot2 설치
6.1.2 ggplot2 패키지 구조
6.1.3 ggplot2 플롯의 기본 성분
6.1.4 ggplot 객체
6.1.5 ggplot 레이어
6.1.6 함수 분류
6.2 Plot creation 함수군
6.3 Geoms 함수군
6.3.1 geom_point( ) 함수
6.3.2 geom_abline( ) 함수
6.3.3 geom_bar( ) 함수
6.3.4 geom_ribbon( ) 함수
6.3.5 geom_boxplot( ) 함수
6.3.6 geom_histogram( ) 함수
6.3.7 geom_density( ) 함수
6.3.8 geom_density2d( ) 함수
6.3.9 geom_contour( ) 함수
6.3.10 geom_text( ) 함수
6.3.11 geom_map( ) 함수
6.3.12 geoms의 기타 함수들
6.4 Statistics 함수군
6.4.1 stat_bin( ) 함수
6.4.2 stat_density( ) 함수
6.4.3 stat_hexbin( ) 함수
6.4.4 stat_ecdf( ) 함수
6.4.5 stat_function( ) 함수
6.4.6 Statistics의 기타 함수들
6.5 Scales 함수군
6.5.1 scale_alpha*( ) 함수
6.5.2 scale_*_brewer( ) 함수들
6.5.3 scale_*_gradient( ) 함수들
6.5.4 scale_*_gradient2( ) 함수들
6.5.5 scale_*_gradientn( ) 함수들
6.5.6 scale_*_grey( ) 함수들
6.5.7 scale_*_hue( ) 함수들
6.5.8 scale_*_identity( ) 함수들
6.5.9 scale_*_manual( ) 함수들
6.5.10 scale_linetype*( ) 함수들
6.5.11 scale_shape*( ) 함수들
6.5.12 scale_size*( ) 함수들
6.5.13 scale_*_continuous( ) 함수들
6.5.14 scale_*_reverse( ) 함수들
6.5.15 scale_*_log10( ) 함수들
6.5.16 scale_*_sqrt( ) 함수들
6.5.17 scale_*_discrete( ) 함수들
6.5.18 scale_*_date( ), scale_*_datetime( ) 함수들
6.5.19 guides*( ) 함수들
6.5.20 expand_limits( ) 함수
6.5.21 xlim( ), ylim( ) 함수
6.5.22 labs( ), ggtitle( ), xlab( ), ylab( ) 함수
6.5.23 update_labels( ) 함수
6.6 Coordinate systems 함수군
6.6.1 coord_cartesian( ) 함수
6.6.2 coord_fixed( ) 함수
6.6.3 coord_flip( ) 함수
6.6.4 coord_map( ) 함수
6.6.5 coord_polar( ) 함수
6.6.6 coord_trans( ) 함수
6.7 Faceting 함수군
6.7.1 facet_grid( ) 함수
6.7.2 facet_null( ) 함수
6.7.3 facet_wrap( ) 함수
6.7.4 label_both( ), label_value( ) 함수
6.7.5 label_parsed( ) 함수
6.7.6 label_bquote( ) 함수
6.8 Position adjustments 함수군
6.8.1 position_dodge( ) 함수
6.8.2 position_fill( ) 함수
6.8.3 position_stack( ) 함수
6.8.4 position_jitter( ) 함수
6.9 Annotation 함수군
6.9.1 annotate( ) 함수
6.9.2 annotation_custom( ) 함수
6.9.3 annotation_logticks( ) 함수
6.9.4 annotation_map( ) 함수
6.9.5 annotation_raster( ) 함수
6.9.6 borders( ) 함수
6.10 Fortify 함수군
6.10.1 fortity( ), fortify.lm( ) 함수
6.10.2 fortity-multcomp( ) 함수
6.10.3 fortify.map( ) 함수
6.10.4 fortify.sp( ) 함수
6.11 Themes 함수군
6.11.1 theme( ) 함수
6.11.2 theme_*( ) 함수들
6.11.3 테마 조작 함수
6.11.4 element_*( ) 함수들
6.11.5 기타 theme 함수
6.12 Aesthetics 함수군
6.12.1 aes( ) 함수
6.12.2 aes_all( ) 함수
6.12.3 aes_auto( ) 함수
6.12.4 aes_string( ) 함수
6.12.5 aes_colour_fill_alpha( ) 함수
6.13 Others 함수군
6.14 ggplot2에서 한글 사용하기
6.14.1 Mac/Linux
6.14.2 Windows
6.15 ggplot2 에필로그

7장 유용한 플롯
7.1 EDA 플롯
7.1.1 상관행렬 플롯
7.1.2 열지도
7.1.3 열지도 달력
7.1.4 테이블 플롯
7.1.5 트리맵
7.2 지리정보 그래프
7.2.1 maps, mapdata, mapproj
7.2.2 maptools 패키지
7.2.3 mapplots 패키지
7.2.4 ggmap 패키지
7.3 텍스트정보 그래프
7.3.1 twitter 검색하기
7.3.2 텍스트 데이터의 전처리
7.3.3 워드 클라우드
7.3.4 계통수
7.3.5 연관규칙 플롯
7.4 기타 유용한 그래프
7.4.1 다변량 데이터 시각화

8장 데이터분석 모델 지원 시각화
8.1 선형모형
8.1.1 회귀진단
8.2 의사결정 트리 모델
8.2.1 tree 패키지
8.2.2 party 패키지
8.2.3 모형성능 평가 곡선
8.3 군집분석
8.3.1 계층적 군집분석
8.3.2 K-Means 군집분석
8.3.3 모델기반 군집분석
8.4 분산분석
8.4.1 일원분산분석
8.4.2 이원배치법
8.4.3 다중비교
8.5 연관규칙 분석
8.5.1 트랜잭션 객체 생성
8.5.2 연관규칙 탐색하기
8.5.3 연관규칙의 시각화
8.5.4 규칙의 간결화
8.6 네트워크 분석
8.6.1 R 패키지의 네트워크 정보 만들기
8.6.2 네트워크 그래프 그리기
8.6.3 기타 네트워크 관계 시각화
8.7 시계열 분석
8.7.1 시계열 데이터 그리기
8.7.2 시계열 모형
9장 유용한 R 그래픽 팁
9.1 인포그래픽
9.1.1 가독성 좋은 파이 차트
9.1.2 가독성 좋은 막대 그래프
9.1.3 가독성 좋은 선 그래프
9.1.4 인포그래픽 만들기
9.2 한글 그래픽 환경설정하기
9.2.1 운영체제와 R의 한글 사용
9.2.2 한글 폰트 설치
9.2.3 폰트의 라이선스
9.2.4 Windows에서 한글 사용하기
9.2.5 Mac에서 한글 사용하기
9.2.6 Linux 서버에서 한글 사용하기
9.2.7 Mac과 Linux에서 PDF 플롯에 한글 출력하기
9.2.8 ggplot2에서 한글 사용하기
9.3 유용한 팁들
9.3.1 그래픽 파라미터 다루기
9.3.2 약어로 표현하기
9.3.3 축의 눈금 조정하기
9.4 삼차원 시각화
9.4.1 plot3D 패키지
9.4.2 rgl 패키지

10장 데이터 분석을 위한 시각화
10.1 데이터의 종류
10.2 단변량 플롯
10.2.1 수치 데이터를 표현하는 단변량 플롯
10.2.2 범주형 데이터를 표현하는 단변량 플롯
10.3 이변량 플롯
10.3.1 수치 데이터를 표현하는 이변량 플롯
10.3.2 범주형 데이터를 표현하는 이변량 플롯
10.4 다변량 플롯
10.4.1 수치형 데이터의 확장 시각화
10.4.2 범주형 데이터의 확장 시각화

참고자료
찾아보기
함수 찾아보기
함수의 인수 찾아보기

 

 

2 thoughts on “R을 활용한 데이터 시각화

  1. homy

    이 책에 실린 모든 프로그램 소스는 아래 URL에서 다운 받을 수 있습니다.

    https://www.dropbox.com/s/80f4fq4qz5fktfz/R_visualization.zip

    그렇지만 길이가 긴 사용자정의 함수 이외의 코드는 독자가 직접 입력하여 학습할 것을 추천합니다. 배포한 소스를 단순히 복사하여 실행하는 것보다 일일이 타이핑하여 실행해보는 것이 번거롭지만 학습 효과가 높기 때문입니다.

  2. 허성범

    안녕하세요.
    R 시각화 관련하여 많은 도움을 받고 있습니다.
    7.2.2.1 장에서 기술된 shape 파일 및 통계자료를 구할 수 없어서 연락드립니다.
    2010년도 행중구역경계 shape파일, 시군구정보, 읍면동정보, 인구 센서스통계자료 등 자료를 책에 기술된 사이트에서 구할 수 없었습니다.
    파일을 보유하고 있다면, 보내주시면 감사하겠습니다.

    메일은 flywhale@mappers.kr 입니다.
    감사합니다.

Comments are closed.