Rによるテキストマイニング入門

Rによるテキストマイニング入門

著者: 石田 基広
単行本: 192ページ
出版社: 森北出版; 第2版 (2017/6/28)
言語: 日本語
ISBN-10: 4627848420
ISBN-13: 978-4627848429
発売日: 2017/6/28

書籍内容

フリーの環境を使い,実践しながらひと通りの手法を学べる入門書です.ネット上にあふれる膨大なテキストデータを効率よく収集・分析する方法や,アンケート結果をデータに置き換えて分析する方法を紹介します.
初心者はもちろん,さまざまな手法を知りたいという読者にもおすすめです.

〈おすすめポイント〉
・基本的な手法のほか,ウェブスクレイピングやトピックモデルといった,最近注目の技術も紹介.
・ネットワークグラフ,ワードクラウドなどの可視化機能をふんだんに利用.データの特徴をつかむのに役立つ.
・実践には統合環境RStudioを導入.RStudioでは,マウスによる直感的な操作ができ,コードの補完機能などもあるので,簡単・快適に作業をすることが可能.

テキストマイニングの定番書を,Rのバージョンアップや新機能に対応して大幅にリニューアルしたものです.さらに使いやすく,充実した内容となっています.

目次

第1章 テキストマイニングとは何か
第2章 テキストマイニングの準備
第3章 R/RStudio 速習
第4章 文字処理と正規表現
第5章 RMeCab によるテキスト解析
第6章 口コミのテキストマイニング—ウェブスクレイピング
第7章 アンケート自由記述文の分析—対応分析
第8章 青空文庫データの解析—ワードクラウドとネットワークグラフ
第9章 テキストの分類—クラスター分析,トピックモデル
第10章 書き手の判別—漱石と鴎外の文体比較
第11章 Twitter タイムラインの分析—API の利用