後藤和智事務所OffLine サークルブログ

同人サークル「後藤和智事務所OffLine」のサークル情報に関するブログです。旧ブログはこちら。> http://ameblo.jp/kazutomogoto/

【C102新刊】Text Mining Maniax[word2vec編]――RとRMeCabによる日本語の単語埋め込みの基礎

【書誌データ】

タイトル:Text Mining Maniax[word2vec編]――RとRMeCabによる日本語の単語埋め込みの基礎

発行日:2023年8月13日(コミックマーケット102)

著者:後藤和智後藤和智事務所OffLine)

サイズ・ページ数:A5、40ページ

価格:即売会600円、書店800円(税抜き)

通販取り扱い:メロンブックス https://www.melonbooks.co.jp/detail/detail.php?product_id=2034072

サンプル

www.pixiv.net

【目次】

はじめに

第1章 word2vecとは何か

1.1 そもそもword2vecとは?

1.2 word2vecの背景:Word Embedding(単語埋め込み)とは何か?

1.3 word2vec作成のモデル

1.4 そもそも自然言語処理とは?

1.5 word2vecの問題点と、より発展的なモデル

第2章 RMeCabの導入と操作

2.1 Rの導入

2.2 MeCab・RMeCabの導入

2.3 RMeCabの基本的な操作

2.3 N-gramの頻度を分析する

2.4 フォルダの中にある複数のファイルに対する分析

第3章 RとRMeCabでword2vecをつくる

3.1 はじめに

3.2 分かち書き

3.3 前処理からword2vecの作成へ

3.4 word2vecで近い意味の単語を調べる