Rではじめるデータサイエンス
著者: Hadley Wickham (著), Garrett Grolemund (著), 大橋 真也 (監修), 黒川 利明 (翻訳)
単行本(ソフトカバー): 480ページ
出版社: オライリージャパン (2017/10/25)
言語: 日本語
ISBN-10: 487311814X
ISBN-13: 978-4873118147
発売日: 2017/10/25
書籍内容
ggplot2、dplyrといったRを代表するパッケージやRStudioの開発で知られる「Rの神様」ハドリー・ウィッカムと、『RStudioではじめるRプログラミング入門』の著者ギャレット・グロールマンドによる、Rプログラミングを通してデータサイエンスの理解と知識を深めるための一冊。
Rの機能と威力を知り尽くし、また、統計とデータサイエンス教育のプロフェッショナルでもある著者たちによるわかりやすくクリアな説明は、既存のデータサイエンス入門書とは一線を画します。
データサイエンスに必要な要素とプロセス(インポート、整理、変換、可視化、モデル、コミュニケーション、プログラミング)を明確に定義し、それぞれ順を追い、各節の最後には練習問題を掲載して、ていねいに説明します。データサイエンティストを目指すなら必読の一冊です。
目次
第I部 探索
1章 ggplot2によるデータ可視化
2章 ワークフロー:基本
3章 dplyrによるデータ変換
4章 ワークフロー:スクリプト
5章 探索的データ分析
6章 ワークフロー:プロジェクト
第II部 データラングリング
7章 tibbleのtibble
8章 readrによるデータインポート
9章 tidyrによるデータ整理
10章 dplyrによる関係データ
11章 stringrによる文字列
12章 forcatsでファクタ
13章 lubridateによる日付と時刻
第III部 プログラム
14章 magrittrでパイプ
15章 関数
16章 ベクトル
17章 purrrでイテレーション
第IV部 モデル
18章 modelrを使ったモデルの基本
19章 モデル構築
20章 purrrとbroomによる多数のモデル
第V部 コミュニケーション
21章 Rマークダウン
22章 ggplot2でコミュニケーションのためのグラフ作成
23章 Rマークダウンフォーマット
24章 Rマークダウンワークフロー