後藤和智事務所OffLine サークルブログ

同人サークル「後藤和智事務所OffLine」のサークル情報に関するブログです。旧ブログはこちら。> http://ameblo.jp/kazutomogoto/

【C90新刊】Text Mining Maniax――フリーソフトで始める日本語計量テキスト分析

【書誌データ】
 書名:Text Mining Maniax――フリーソフトで始める日本語計量テキスト分析
 発行日:2016(平成28)年8月14日(コミックマーケット90)
 著者:後藤和智後藤和智事務所OffLine http://www45.atwiki.jp/kazugoto/

 サイズ:A5
 ページ数:60ページ
 価格:即売会…600円、書店…800円(税抜)
 通販取扱:とらのあな http://www.toranoana.jp/mailorder/article/04/0030/44/14/040030441422.html
  COMIC ZIN 委託予定

 国立国会図書館登録情報:納本予定

 電子版:Kindle

 サンプル:

www.pixiv.net

【目次】
はじめに
第1章 ソフトのインストール
 1.1 はじめに
 1.2 下準備:R、MeCabをインストールする
  1.2.1 R
  1.2.2 MeCab
 1.3 RMeCab、KH Coderをインストールする
  1.3.1 RMeCab
  1.3.2 KH Coder
 1.4 そろえておくべき書籍など
  1.4.1 OfficeもしくはOpenOffice.orgなど
  1.4.2 RStudio
  1.4.3 その他のソフト
  1.4.4 書籍

第2章 西田幾多郎善の研究』を分析する
 2.1 はじめに
 2.2 KH Coderの形式にデータを修正する
 2.3 KH Coderの基本動作と抽出水準の策定
 2.4 RMeCabを用いた分析
  2.4.1 単語のカウント
  2.4.2 N-gram
 2.5 KH Coderを用いた分析
  2.5.1 はじめに
  2.5.2 対応分析
  2.5.3 共起ネットワーク
  2.5.4 多次元尺度構成法
  2.5.5 自己組織化マップ
  2.5.6 関連語検索

第3章 ある日の新聞の社説を分析する
 3.1 はじめに
 3.2 複数のテキストファイルを対象としたRMeCabの操作(単語のカウント、N-gram
 3.3 KH Coderによる文章のクラスタリング
  3.3.1 クラスターの分析と保存
  3.3.2 クラスターごとの関連語
  3.3.3 クラスターを用いた分析

第4章 「東方Project人気投票」のコメントを分析する
 4.1 はじめに
 4.2 MeCabで任意の単語を使用できるようにする方法
 4.3 KH Coderと外部変数の読み込み
 4.4 コーディングを用いた分析