後藤和智事務所OffLine サークルブログ

同人サークル「後藤和智事務所OffLine」のサークル情報に関するブログです。旧ブログはこちら。> http://ameblo.jp/kazutomogoto/

【コミケ101新刊】Text Mining Maniax for Python――Pythonによる日本語計量テキスト分析の基礎

【書誌データ】

タイトル:Text Mining Maniax for Python――Pythonによる日本語計量テキスト分析の基礎

発行日:2022年12月31日(コミックマーケット101)

著者:後藤和智後藤和智事務所OffLine)

サイズ・ページ数:A5、40ページ

価格:即売会600円、書店800円(税抜き)

通販取り扱い:メロンブックス https://www.melonbooks.co.jp/detail/detail.php?product_id=1784228

電子版:BOOTH、BOOK☆WALKER、DLsite、メロンブックスとらのあな、技術書典オンラインショップ(いずれも予定)

サンプル:

www.pixiv.net

目次

はじめに

第1章 Pythonの導入

1.1 はじめに

1.2 Pythonの導入

1.3 MeCabの導入

1.4 ubuntu LTSとneologdの導入

1.5 Pythonを起動してみる

第2章 Pythonの基礎

2.1 はじめに

2.2 四則演算

2.3 関数を自作する

2.4 if/else構文

2.5 for構文

2.6 データセットの型

2.7 文字列の置き換え

2.8 pandasによる表の作成

第3章 Pythonによるテキストマイニングの基礎

3.1 はじめに

3.2 とにかくMeCabを使ってみる

3.3 neologdを使う

3.4 Toknizer

3.5 ファイルから文章を読み込む

3.6 単語数をカウントする

3.7 単語のクロス集計

第4章 対応分析とクラスター分析

4.1 はじめに

4.2 多数のファイルを読み込む

4.3 クラスター分析

4.4 対応分析

第5章 ウェブスクレイピングの基礎

5.1 はじめに

5.2 ウェブから情報を取得する

5.3 仙台市の市長記者会見のサイトからタイトルを抜き出す