後藤和智事務所OffLine サークルブログ

同人サークル「後藤和智事務所OffLine」のサークル情報に関するブログです。旧ブログはこちら。> http://ameblo.jp/kazutomogoto/

【C94新刊】Text Mining Maniax Advance――R, KH Coder, Excelによる計量テキスト分析の拡張

【書誌データ】
 書名:Text Mining Maniax Advance――R, KH Coder, Excelによる計量テキスト分析の拡張
 発行日:2018(平成29)年8月12日(コミックマーケット94)
 著者:後藤和智後藤和智事務所OffLine http://www45.atwiki.jp/kazugoto/
 サイズ:A5
 ページ数:40ページ
 価格:即売会…600円/書店委託…800円(税抜)
 通販取扱:メロンブックス https://www.melonbooks.co.jp/detail/detail.php?product_id=390206
      COMIC ZIN(予定)
 国立国会図書館登録情報:納本予定
 サンプル:

www.pixiv.net


 電子書籍メロンブックスDL、BOOK☆WALKER

 

【目次】

目次
はじめに
 0.1 まえがき
 0.2 RとKH Coderのダウンロード

第1章 TwitteRによるツイッター分析
 1.1 はじめに
 1.2 TwitteRを始める
  1.2.1 キーとトークンの取得
  1.2.2 twitteRのダウンロードと利用
 1.3 取得データの特徴
 1.4 検索
 1.5 データの活用
 1.6 プログラミングの活用

第2章 KH Coderの本が(たぶん)教えないKH Coderの裏技
 2.1 はじめに
 2.2 未知のワード、強制抽出にするか?辞書登録するか?
  2.2.1 検証
  2.2.2 MeCabを使うメリット
  2.2.3 強制抽出を使うメリット
 2.3 Rソース活用術
  2.3.1 はじめに
  2.3.2 多次元尺度構成法
  2.3.3 クラスター分析

第3章 テキストマイニング芸人的Excel活用術
 3.1 はじめに――テキストマイニング芸人として
 3.2 OCRソフト「読取革命」を検証する
  3.2.1 はじめに
  3.2.2 読み込み結果はフォントで変わる?
  3.2.3 読取革命は横書きに弱い
 3.3 3時間で10冊データ化する私の方法
  3.3.1 はじめに
  3.3.2 テキストデータからExcelへの貼り付けについて
  3.3.3 Excelマクロによるデータの修正と整形
 3.4 なぜデータの整形が必要なのか