後藤和智事務所OffLine サークルブログ

同人サークル「後藤和智事務所OffLine」のサークル情報に関するブログです。旧ブログはこちら。> http://ameblo.jp/kazutomogoto/

【ツイート転載】憎悪表現の裏にある言論メディアの変質(H28.09.04)

評論という行為をする際には、常に「他者を見下す快楽」と闘わなければならないと最近感じる。その快楽に溺れると、人格が崩壊し、ありとあらゆるものを見下さないと気がすまなくなる。

Togetterやそのコメント欄を見ていると、東日本大震災以降、あらゆる陣営で「他者を見下す快楽」に溺れてしまった人間がかくも多く発生してしまったのかと感ずる。

―――――

昨今のツイッターにおける「評論」の消費のされ方を見ると、いまの「評論の読者」というのは「一緒に石を投げる存在」「自分の暴力狼藉を肯定してくれる存在」を求めて「評論」を消費しているのではないかと思えてならない。そして一部のメディアもこれに追従している。これは危機的状況ではないか。

憎悪表現の問題を考えるとき、「評論」のあり方がここ十数年で変わってしまったというのは避けて通れない論点だと思う。その変化の原点はおそらく80年代のニューアカだけど、90年代以降に限って話をすすめると、90年代の宮台学派の時代には、評論というのは論客の視線に自己を同一化してスノッブに振る舞ってみせるというように消費された。宮台も「ミニミニ宮台君」とか言ってそういう流れを肯定していた(『これが答えだ!』など)。2000年代の劣化言説の時代には、「評論」は特定の社会集団(特に若者)が自分より「劣っている」ことを示してくれる言説が好まれた。

この時点で十分問題なのだが、いまの状況はさらに悪化して、自分の暴力や蔑視を肯定してくれる存在としての「評論」が好まれているように見える。あくまでも中心は自分であり、「評論」は他者をバッシングする快楽のために消費される。これは言論が社会から乖離していくことを意味している。

しかし、逆説的ではあるけど、そういう社会から乖離した「評論の読者」の意識が、むしろ社会を形作っているように思える。一緒に石を投げている限りは自分の行為は免責されるという意識の広がりこそ、憎悪表現や嘲笑の根幹に思えてならない。そしてそれは言論メディアのあり方の変質が関わっている。

いまの言論メディアのあり方を考えるとき、90~2000年代の俗流若者論は決して避けて通れないんですよ。

【リリース】後藤和智事務所OffLine 9月のイベント参加情報【追記あり】

【直接】

9月4日 第1回文学フリマ岩手@岩手県産業会館

 各線「盛岡」駅より徒歩15分程度
 または都心循環バスで「盛岡城跡公園」下車すぐ
 スペース:「オ」ブロック05・06
 Webカタログ:https://c.bunfree.net/c/iwate01/7F/%E3%82%AA/5

f:id:kgotolibrary:20160829232904p:plain


9月18日 司書のお仕事(東方Project小悪魔オンリー)@東京卸商センター

 JR中央・総武線各駅停車、都営地下鉄浅草線「浅草橋」駅から徒歩5分程度
 スペース:「こあ」ブロック14

f:id:kgotolibrary:20160829233025p:plain


【委託】


9月11日 砲雷撃戦!よーい!合同演習四戦目@東京ビッグサイト

 ゆりかもめ「国際展示場正門」駅直結
 東京臨海高速鉄道りんかい線「国際展示場」駅より徒歩3分程度
 スペース:「L」ブロック03「胡玉書厨」様
 委託物:『艦娘たちの書斎』『天龍の空間統計学攻略作戦』

9月18日 こみっく☆トレジャー28@インテックス大阪

 大阪市交通局南港ポートタウン線「中ふ頭」駅より徒歩2分程度
 大阪市営地下鉄中央線コスモスクエア」駅より徒歩15分程度
 スペース:1号館「サ」ブロック26a「胡玉書厨」様
 委託物:『艦娘たちの書斎』『天龍の空間統計学攻略作戦』

9月19日 おでかけライブ in 青森 秋まつり2016@青森産業会館

 JR東北・北海道新幹線奥羽本線新青森」駅より車で25分程度
 各線「青森」駅より「問屋町」行きバスで「青森産業会館前」下車すぐ
 スペース:スタジオYOU委託スペース
 委託物:『艦娘たちの書斎』『東方Project×東北地方合同誌 東方六絢彩』

 体調不良により、委託物の送付ができない状況にあったため、こちらのイベントは辞退いたします。誠に申し訳ありません。

【2016.09.02追記 災害対応/2016.09.10 修正】

 平成28年台風10号災害に関しまして、犠牲になった方々へ深く哀悼の意を表すと共に、被災地の一日も早い復興をお祈りしております。後藤和智事務所OffLineでは、2016年9月2日付で岩手県岩泉町に5,000円を寄付すると共に、「第1回文学フリマ岩手」の売上の15%、「司書のお仕事」「砲雷撃戦!よーい!合同演習四戦目」「こみっく☆トレジャー28」の売上の6%を岩泉町に、6%を日本赤十字社北海道支部に寄付いたします。

 

後藤和智事務所OffLine コミックマーケット90参加情報

コミックマーケット90
3日目(8/14)
東4ホール「ム」ブロック48b
後藤和智事務所OffLine
Webカタログ:https://webcatalog.circle.ms/Circle/12704678/

f:id:kgotolibrary:20160809124733p:plain

f:id:kgotolibrary:20160809124804p:plain


コミックマーケット90新刊
『Text Mining Maniax――フリーソフトで始める日本語計量テキスト分析』
http://kazugoto.hatenablog.com/entry/2016/08/03/230653
要望の大きかったテキストマイニングの解説書を作りました。フリーソフト「RMeCab」と「KH Coder」を使って、単一の長文、複数の中程度の文章、多数の短い文章を分析する手法を解説。文章のクラスタリングや単語の配置など、テキストからエビデンスを抽出し、統計的に「行間を読む」技術を解説します。
委託…とらのあなhttp://www.toranoana.jp/mailorder/article/04/0030/44/14/040030441422.html
COMIC ZIN(予定)

 

『艦娘たちの書斎――「艦これ」文学統計解析論序説』
表紙:Azel(シュレ猫Online)
http://kazugoto.hatenablog.com/entry/2016/08/03/231105
艦隊これくしょん~艦これ~」のノベライズ4作品(「陽炎、抜錨します!」「一航戦、出ます!」「鶴翼の絆」「瑞の海、鳳の空」)全19冊をテキストマイニングによって分析。単語から見る各作品における傾向はもとより、キーワードから考える各作品における世界観の捉え方など、統計学による文学研究の可能性を切り拓く一冊です。
委託…メロンブックスhttps://www.melonbooks.co.jp/detail/detail.php?product_id=174843
とらのあなhttp://www.toranoana.jp/mailorder/article/04/0030/44/14/040030441423.html
COMIC ZIN(予定)
grep(在庫に応じて)

 

コミケ未頒布同人誌
第13回博麗神社例大祭新刊
『幻想郷市民大学1――自己・社会・メディアの理論』
表紙:おみなえし(たけのこ。)
http://kazugoto.hatenablog.com/entry/2016/04/05/210755
弊サークルが2013~2014年に発行してきた東方Project社会学系の〈講座系二次創作〉を総集編としてまとめました。自己の社会学、政治哲学、メディア論を親しみやすい東方二次創作で解説。若者論や商業主義的な「思想」では見失われがちな専門知の根幹を解説する一冊です。
収録作品:『古明地さとりの自己形成論講義』『香霖堂の社会思想ゼミ』『天狗組のメディアの世界を覗く旅』

 

第13回博麗神社例大祭新刊
東方Project×東北地方合同誌 東方六絢彩』
表紙:堕天使エレナ(だーくえんじぇぅ)
http://kazugoto.hatenablog.com/entry/2016/04/07/171305
「東北地方」をテーマにした東方Project二次創作の合同誌。東北の食文化の案内から、東北を舞台に東方の登場人物が活躍する小説、東北地方における東方の現状を解説する評論など、多種多様な二次創作や評論が集まりました。
参加者…【イラスト】堕天使エレナ/辻本奈央 【漫画】ビエルカ 【小説】S.Watanabe/赤城のく/藍もどき/シミヤ/アルトス 【評論】上條紗智/花羅 【SS】後藤和智

 

第22回文学フリマ東京新刊
『「働き方」と「生き方」を問う:〈若者〉をめぐる言説の現在と計量分析――平成日本若者論史Special3』
表紙:川泉ポメ(Penny Lane)
http://kazugoto.hatenablog.com/entry/2016/04/05/201722
弊サークルが2013~2014年に発行してきた、ポスト〈劣化言説の時代〉の言論、若者論を分析した同人誌を総集編としてまとめました。Kindleでベストセラーになった『「働き方」を変えれば幸せになれる?』をはじめ、「新しい生き方」論や「ヤンキー」論をテキストマイニングを用いて分析した同人誌も収録。関連するサークルペーパーも収録している、2010年代前半の言論の総括です。

 

第10回東方名華祭/幻想郷フォーラム2016新刊
『東方キャラソート統計――多変量解析で見る「愛され方」の研究』
表紙:ふみつき(踏月)
http://kazugoto.hatenablog.com/entry/2016/02/23/131743
東方Projectのキャラクター人気の現状を、2015年9月~12月にツイッター上に投稿された「東方キャラソート」の結果から分析した一冊。人気投票で上位に食い込むキャラクターの強みから、分析結果から見る回答者の性癖まで多角的に解説。

 

【2016/8/11 追記】

14日、仙台で夜勤で出ることが確定してしまい、そのため12時過ぎには会場を出なければならなくなりました。そのため12時以降は売り子に任せることになります。また14時には撤収する予定です。ご迷惑をおかけしますが、ご了承のほどお願いします。

【C90新刊】艦娘たちの書斎――「艦これ」文学統計解析論序説

【書誌データ】
 書名:艦娘たちの書斎――「艦これ」文学統計解析論序説
 発行日:2016(平成28)年8月14日(コミックマーケット90)
 著者:後藤和智後藤和智事務所OffLine http://www45.atwiki.jp/kazugoto/
 表紙イラスト:Azel(シュレ猫Online http://www.pixiv.net/member.php?id=2416323

 サイズ:A5
 ページ数:68ページ
 価格:即売会…800円、書店…1,000円(税抜)
 通販取扱:メロンブックス https://www.melonbooks.co.jp/detail/detail.php?product_id=174843
  とらのあな http://www.toranoana.jp/mailorder/article/04/0030/44/14/040030441423.html
  COMIC ZIN 委託予定

 国立国会図書館登録情報:納本予定

 電子版:メロンブックス

www.melonbooks.com

 サンプル:

www.pixiv.net

 備考1:本書は角川ゲームスDMM.comの作品「艦隊これくしょん~艦これ~」の二次創作作品となります。そのためコミティアなどの二次創作作品の頒布が禁止されている即売会では頒布いたしません。
 備考2:本書で分析に使用しているテキストファイルは、著者自らがテキストファイルに変換したものを使用しております。

【目次】
はじめに

第1章 全体の傾向
 1.1 はじめに、分析手法
 1.2 単語の単純集計
 1.3 対応分析による集計
 1.4 登場人物に関する集計
 1.5 関連語の分析

第2章 「一航戦、出ます!」
 2.1 対応分析と関連語
 2.2 N-gram

第3章 「陽炎、抜錨します!」
 3.1 対応分析と関連語
 3.2 N-gram

第4章 「鶴翼の絆」
 4.1 対応分析と関連語
 4.2 N-gram

第5章 「瑞の海、鳳の空」
 5.1 対応分析と関連語
 5.2 N-gram

第6章 世界観の分析
 6.1 はじめに
 6.2 提督
 6.3 艦娘
 6.4 深海棲艦

【C90新刊】Text Mining Maniax――フリーソフトで始める日本語計量テキスト分析

【書誌データ】
 書名:Text Mining Maniax――フリーソフトで始める日本語計量テキスト分析
 発行日:2016(平成28)年8月14日(コミックマーケット90)
 著者:後藤和智後藤和智事務所OffLine http://www45.atwiki.jp/kazugoto/

 サイズ:A5
 ページ数:60ページ
 価格:即売会…600円、書店…800円(税抜)
 通販取扱:とらのあな http://www.toranoana.jp/mailorder/article/04/0030/44/14/040030441422.html
  COMIC ZIN 委託予定

 国立国会図書館登録情報:納本予定

 電子版:Kindle

 サンプル:

www.pixiv.net

【目次】
はじめに
第1章 ソフトのインストール
 1.1 はじめに
 1.2 下準備:R、MeCabをインストールする
  1.2.1 R
  1.2.2 MeCab
 1.3 RMeCab、KH Coderをインストールする
  1.3.1 RMeCab
  1.3.2 KH Coder
 1.4 そろえておくべき書籍など
  1.4.1 OfficeもしくはOpenOffice.orgなど
  1.4.2 RStudio
  1.4.3 その他のソフト
  1.4.4 書籍

第2章 西田幾多郎善の研究』を分析する
 2.1 はじめに
 2.2 KH Coderの形式にデータを修正する
 2.3 KH Coderの基本動作と抽出水準の策定
 2.4 RMeCabを用いた分析
  2.4.1 単語のカウント
  2.4.2 N-gram
 2.5 KH Coderを用いた分析
  2.5.1 はじめに
  2.5.2 対応分析
  2.5.3 共起ネットワーク
  2.5.4 多次元尺度構成法
  2.5.5 自己組織化マップ
  2.5.6 関連語検索

第3章 ある日の新聞の社説を分析する
 3.1 はじめに
 3.2 複数のテキストファイルを対象としたRMeCabの操作(単語のカウント、N-gram
 3.3 KH Coderによる文章のクラスタリング
  3.3.1 クラスターの分析と保存
  3.3.2 クラスターごとの関連語
  3.3.3 クラスターを用いた分析

第4章 「東方Project人気投票」のコメントを分析する
 4.1 はじめに
 4.2 MeCabで任意の単語を使用できるようにする方法
 4.3 KH Coderと外部変数の読み込み
 4.4 コーディングを用いた分析

【テキストマイニング】恋色の日なので三魔女のコメントを比較した【東方Project】


この論考は「東方Project」の二次創作を兼ねています。登場人物の口調や性格などが原作と異なる可能性がありますのでご注意ください。

f:id:kgotolibrary:20160517011128p:plain


霧雨魔理沙(以下、魔理沙):5月14日の「こいしの日」に隠れて目立たない印象があるが、5月16日は「恋色の日」ということで私をお祝いする日になっているらしい。というわけで、お前ら、私のことを祝えよ。

アリス・マーガトロイド(以下、アリス):もう過ぎてるじゃない!

パチュリー・ノーレッジ(以下、パチュリー):で、「こいしの日」では「第12回東方Project人気投票」のコメントを分析したけれど、今回もそういうことでいいの?

魔理沙:そうだ。ただ前回の分析では、キャラクター1人だけの分析だったので、全体として少しグダグダな感じになってしまったのは否めない。こういうテキストマイニングでは、単一のものを対象にした分析だと中途半端な分析に終わってしまう。テキストマイニングの醍醐味と言えばやっぱり比較だ。そこで今回は、東方でも「三魔女」として知られる、私とお前ら、つまりアリスとパチュリーのコメントを比較してみようと思う。ちなみに16日に間に合わなかったのは、この記事の分析を始めたのが夜の21時という極めて遅い時間だったということが原因だ。

パチュリー:そんなことはどうでもいいよ。それはさておき、今回は私たち3人のコメントを分析して、その特徴を掴むということでいいんだよね。

魔理沙:分析には前回と同様、本稿の筆者の評論同人誌ではおなじみのフリーソフト「KH Coder」を使う。形態素解析エンジンも前回と同様MeCabを使い、MeCabはなにもカスタマイズせず、「魔理沙」「アリス」「パチュリー」「パチェ」「パッチェ」「マリアリ」「むきゅ」を強制抽出単語としてKH Coderの側に登録する。コメントはスプレッドシートを使って全角に変換して著者名を削除する。これによって3人合わせて3641のコメントを分析するぜ。

アリス:抽出水準はどのくらいに設定したの?

魔理沙:今回も全体での占有率が25%になる、出現数13以上の自立語180単語を分析対象としたぜ。参考までに、占有率が20%になるのは出現数27以上の81単語だ。

f:id:kgotolibrary:20160517011008p:plain


魔理沙:使用する単語は次の通り。

f:id:kgotolibrary:20160517011039p:plain


アリス:今回は複数の登場人物の分析を行うから、全体の傾向はあまり見なくていいわね。敢えていくつか挙げるとすると、「霊夢」という単語が多く見られるわね。ということは、この3人を採り上げると、霊夢も一緒に採り上げられることが多いってことになるのかしら。あと、固有名詞の欄に「こいし」ってあるわね。こいしちゃんも一緒に採り上げられているの?

魔理沙:いや、それはアリスへのコメントで、「こいし」という単語を並べたコメントがあったんだ。本稿の筆者も、「こいし」のカウント数が不自然に多かったんで、前回こいしへのコメントを分析したデータが混ざったのか、と考えてデータをチェックしたら見つけてしまったんだ。

アリス:入力ミスなのかしら……?

パチュリー:まあそれはいいとしよう。で、3人のコメントの違いを分析すると言うけれど、分析にはどういう手法を使うんだい?

魔理沙:まず最初に使うのは対応分析だ。対応分析を使えば、人物と単語を同一の空間内に布置することができる。今回はカテゴリが3つだから、主成分2つで寄与率は100%になる。対応分析を行って人物と単語を配置した結果がこれだ。

f:id:kgotolibrary:20160517011108p:plain


パチュリー:見事に3方向に別れたね。対応分析だと、それぞれの登場人物のまわりに、それぞれに特徴的な単語が配置される、という認識でいいの?

魔理沙:そうだな。

アリス:私のまわりを見てみると、私に特徴的な語は「美しい」「クール」「ツンデレ」「優しい」「綺麗」、一方で魔理沙のは「明るい」「男勝り」「努力」「乙女」「元気」という感じね。いずれも原作や二次創作におけるイメージをそのまま反映している感じね。あと、魔理沙の周りには「霊夢「レイ」があり、霊夢とセットで認識されている傾向が見られる一方で、私の近くには「マリアリ」があるわ。私は魔理沙とのカップリングで愛されてるってことでいいのかしら。

パチュリー:私の周りは「図書館」「本」「読む」。行動に関する単語が多い一方で、性格に関する言及はあまり見られないのか。

魔理沙:対応分析の得点も見てみよう。

f:id:kgotolibrary:20160517011150p:plain


魔理沙:もうひとつ、共起ネットワークでそれぞれに関連づけられている単語を見てみるぜ。Jaccard係数が大きい順番に60組を繋ぎ、最小スパニングツリーを強調した表示にした。

f:id:kgotolibrary:20160517011209p:plain


パチュリー:これも対応分析とあまり傾向は変わらないかな。ただここで新たに見られる知見があるとすれば、まず3人に共通して関連が強い単語は「かわいい」系統のものがあるね。あと、アリスと私に関連の強い単語が「嫁」か。これは魔理沙には見られない傾向かな。私とアリスについては所有権を主張したくなる方面での愛され方があるようだ。

魔理沙:このように、テキストマイニングを用いた分析では比較こそが重要になるぜ。複数の対象を比較すれば、特徴的なものが見えるかも知れない。本稿の著者は、2017年に開催される予定の「第11回東方名華祭/幻想郷フォーラム2017」を目標に、人気投票のコメントの分析を行おうと考えている。あまり期待せずに待っていて欲しい。

参考1:魔理沙へのコメントの共起ネット(全体での出現13以上、60本。以下同じ)

f:id:kgotolibrary:20160517011227p:plain


参考2:アリスへのコメントの共起ネット

f:id:kgotolibrary:20160517011245p:plain


参考3:パチュリーへのコメントの共起ネット

f:id:kgotolibrary:20160517011259p:plain


冒頭の図:多次元尺度構成法による単語の布置(出現26以上、バブルプロット)

参考文献:樋口耕一『社会調査のための計量テキスト分析―内容分析の継承と発展を目指して』ナカニシヤ出版、2014年

【テキストマイニング】5月14日はこいしの日【東方Project】


この論考は「東方Project」の二次創作を兼ねています。登場人物の口調や性格などが原作と異なる可能性がありますのでご注意ください。

f:id:kgotolibrary:20160514232607p:plain


古明地こいし(以下、こいし):5月14日はこいしの日だよ!みんながこいしのことを祝ってくれて、とっても嬉しいな。

古明地さとり(以下、さとり):これは恐らくpixivで始まったムーブメントで、5月14日に、あなた、つまり東方Projectの登場人物の一人である「古明地こいし」のイラストを上げようというユーザーの企画から始まったもののようね。「ピクシブ百科事典」によると、5月14日が《「5(こ)」「1(い)」「4(し)」と読める》ことから、このような動きが始まったものとされているわ。ツイッター上ではイラストのほか、コスプレ写真なども上がっているようね。本稿の著者がお世話になったイラストレーターの方のイラストもあるわね。

古明地さとりの自己形成論講義』『幻想郷市民大学1』表紙・おみなえし氏

 

『天狗組のメディアの世界を覗く旅』表紙・祭唄氏

 

『アリスのキャンパスライフ論講座』表紙・あーねすと氏

 

古明地こいしと不思議な数字の世界』表紙・杏飴氏

 



こいし:でも、この記事の書き手さんって、東方の同人誌は出してても、こういう講座系シナリオを中心とする文章か評論だよね。そもそもメインのジャンルも評論だし。どうやってこのお祭りに参加するの?

さとり:この記事では、「第12回東方Project人気投票」に寄せられたあなたへのコメントを分析して、あなたの人気の構造がどういう風になっているのか分析してみようと思うのよ。こいしは第11回の人気投票で1位を取るほどの人気を博しているし、第12回では3位に落ちたとは言えまだまだ根強い人気を誇っているわ。

こいし:人気投票のコメントを分析するってことは、テキストマイニングなの?

さとり:そうよ。本稿の筆者の評論同人誌ではおなじみのフリーソフト「KH Coder」を使って、コメントを分析してみることにしたの。分析の前提は、形態素解析エンジンは何もカスタマイズしていないMeCabで、KH Coder側で「こいし」「古明地」を強制抽出単語として設定しているわ。分析の対象としたコメントは、スプレッドシートを使って全ての文字を全角に変換し、なおかつ筆者名を消去したものよ。これによって1869のコメントを分析することができたわ。抽出できた単語の総数は19,395なのだけど、分析に使った単語は、このうち出現数が11以上の自立語108種類としたわ。

こいし:11以上、108種類って中途半端だね。

さとり:出現数11以上の自立語が単語全体に占める割合がほぼ25%なので、この水準としたわ。出現数ごとの単語数と占有率は表1の通りね。

f:id:kgotolibrary:20160514231710p:plain

 

さとり:これによって抽出した単語が次の通りね。ほとんどカスタマイズしていないMeCabの仕様上意味をなしそうにもない単語も抽出されているわ。

f:id:kgotolibrary:20160514231725p:plain


こいし:単語に注目してみよう。名詞で一番多くなってる「世界」は、第11回の人気投票でこいしが一位を取ったってことで、「世界一位」みたいな使われ方をしてるのが多い感じかな。これ関係だとサ変名詞に「連覇」っていうのがあるし。「無意識」はこいしの能力絡みだね。名詞以外だと、形容詞では「かわいい」「可愛い」が断トツで多いね。みんなこいしのこと、かわいいって思ってくれてるんだ。

さとり:「秘録」は深秘録、「霊殿」は地霊殿のことを指しているものといっていいでしょうね。「綺」は心綺楼かしら。

こいし:「ロッ」とか「しこ」とかってなんだろ?

さとり:「ロッ」は一人の投票者が「ペロッ」という文字列を延々と並べたコメントによるものね。「しこ」「ちゃんこ」は、ニコニコ静画などでこいしのイラストにつけられることがあるコメントである「こいしちゃんこしこし」から来ているわ。「prpr」は「ペロペロ」ね。なんでこれが組織名として抽出されたのか知らないけれど……。

こいし:こいしもお姉ちゃんのことペロペロしたいなぁ……。

さとり:こいし、よだれが垂れているわよ。閑話休題、本稿では第一に、これらのコメントに対してクラスター分析でクラスタリングを行い、コメントの傾向を見ていくことにするわ。まず出現数11以上の単語を用いてクラスタリングを行い、クラスターの併合水準を観察したわ。

f:id:kgotolibrary:20160514231756p:plain


さとり:これを見ると、だいたい5クラスターくらいが多くもなく少なくもなく、水準として妥当な線と言うことができるわね。5クラスターに分けると、第1クラスターに分類されたコメントが1255個、第2クラスターが55個、第3クラスターが85個、第4クラスターが93個、第5クラスターが171個、いずれのクラスターにも分類されなかったコメントが207個ね。第1クラスターにかなり偏っているけれど、これは措いておくことにしましょう。

こいし:5個のクラスターに分けたあとはどうするの?

さとり:対応分析によって単語とクラスターを布置することにするわ。その結果が次の図ね。

f:id:kgotolibrary:20160514231809p:plain


こいし:えーと……なんというか、コメントに困る図だね……。ひらがなの「かわいい」と漢字の「可愛い」の間に違いがあるってことはわかるんだけど……。

さとり:こんな感じになってしまったので、ここは具体的な数値を見ることによって判断することにしましょう。とは言っても、特徴的な単語を読み取ることはちょっと難しそうね。

f:id:kgotolibrary:20160514231825p:plain

f:id:kgotolibrary:20160514231839p:plain


さとり:次に、単語ごとの共起ネットワークを描いてみましょう。共起ネットワークは、Jaccard係数の大きい順番に単語を結んでネットワークを作るという分析よ。出現数11以上の単語で、Jaccard係数の大きい順から100組でネットワークを描画するとこんな感じになったわ。描画に際しては、最小スパニングツリーのみを強調表示しているわ。

f:id:kgotolibrary:20160514231911p:plain


こいし:こいしの名前が右下にあるけど、「可愛い」「かわいい」の両方が関連づけられてるんだ。やっぱりみんな、こいしのことかわいいって思ってくれてるんだね。あとは関連が強いのは「ちゃん」かな。「こいしちゃん」っていう呼び方が定着してるんだね。

さとり:関連語検索もやってみましょうか。「こいし」という単語を含むコメントについて、出現数11以上で上位60組で作るとこんな感じね。

f:id:kgotolibrary:20160514231925p:plain


こいし:シリーズ名で一群を作ってる場所があるけど、特徴的なのはあまりないかな。でも、「古明地」と「大好き」が繋がってるのを見ると、こいしはお姉ちゃんと一緒に愛されてるって見方もできるかもしれないね。こいしもお姉ちゃんのこと、大好きだよ。

(冒頭の図:多次元尺度構成法による単語の布置。出現11以上、バブルプロット)

参考文献:樋口耕一『社会調査のための計量テキスト分析―内容分析の継承と発展を目指して』ナカニシヤ出版、2014年