後藤和智事務所OffLine サークルブログ

同人サークル「後藤和智事務所OffLine」のサークル情報に関するブログです。旧ブログはこちら。> http://ameblo.jp/kazutomogoto/

【テキストマイニング】衆院選に出馬するらしいので長谷川豊のブログを分析する

www.huffingtonpost.jp

 

 いくつかのメディアが2月6日頃に伝えたように、フリーアナウンサーの長谷川豊が、次の衆院選に出馬することを表明しました。長谷川は、2016年9月に「自業自得の人工透析患者なんて、全員実費負担にさせよ!無理だと泣くならそのまま殺せ!」という記事を書いてたくさんの批判に遭い(この批判は正当なものです)、それが問題になってたくさんの仕事を降ろされました。

 先に挙げたハフィントンポストの記事によると、長谷川は「『自業自得』の線引きをするのが政治だ」ということを言っておりますが、どこからどこまでが「自業自得」かというのは確率的なもの、さらに医療関係においては遺伝的なものを含むため曖昧であり(極論すれば、例えば先天的疾患である1型糖尿病を患っている、阪神タイガース岩田稔に対して「そういう家系に生まれたことが悪い」などと言うことも可能になってしまいます)、未だにその発言の差別性を認識していないと言えるでしょう。

 長谷川の出馬に対しては一部のリベラル派からは「出馬すること自体を止めることはできない」という反批判がありましたが、そのような批判の問題点についてはこちらをご参照ください。

yongsong.exblog.jp

yongsong.exblog.jp

yongsong.exblog.jp

 

 さて、計量分析家としては、長谷川豊という人物がどのような人物であり、どのような人物が政治家になろうとしているのかということを、計量分析を用いて明らかにしようと思います。言うまでもなく長谷川はブログで有名であり、先の騒動の発端になったのもブログです。そこで、長谷川のブログを分析することにより、長谷川という人物を解き明かしていきたいと思います。

 2017年3月2日に、長谷川のブログの、2014年4月~2016年11月の文章(2016年12月は記事がなかった)をテキストエディタにコピー&ペーストし、四半期ごとにその変化を見ていくこととしました。使用する分析手法は対応分析と、多次元尺度構成法によって抽出した単語の集計です。形態素解析にはフリーソフトMeCab」を用い、辞書は「自民党」「自由民主党」「民主党」「民進党」「維新の会」「維新の党」「大阪維新の会」「おおさか維新の会」(固有名詞組織)「橋下」(固有名詞名字)「ウヨク」「サヨク」(一般名詞)を登録しました。

 まず対応分析の結果を見てみましょう。使用した単語は占有率が20%以上となる、主柘植数59以上の自立語598語です。第1,2主成分と単語のプロットは次の通りになりました。

f:id:kgotolibrary:20170303195918p:plain

 ただ、第1,2主成分までの寄与率の合計が30%程度と低いので、それ以外の主成分も見てみましょう。第5主成分までの変遷を示してみます。

f:id:kgotolibrary:20170303200303j:plain

f:id:kgotolibrary:20170303200321p:plain

f:id:kgotolibrary:20170303200338j:plain

 まず第1主成分を見てみると、第1主成分は2016年9月の問題発言に関する主成分と見ていいと思います。この主成分が2016年第4期に向けて大きくなるのはまあ当然でしょう。ただ政治的発言に関して注目すべきは第2,3主成分だと思います。第2主成分と第3主成分の正方向は、それぞれ政治的な発言になっています。第2主成分の正方向は主に右派的な政治発言、第3主成分は主に橋下維新的な政治発言と言えます。

 そしてこの2つの主成分がプラスの方向に傾いているのは、2016年ではなくむしろ2015年でした。2015年においては、この2つの主成分がほぼ一貫してプラスの方向に傾いているのです。2016年は、どちらかというと芸能関係の発言が多く見られましたが、長谷川の思考が橋下維新的なものに接近するのは、2015年であったと言うことができるでしょう。

 続いて、多次元尺度構成法を用いて、上位149単語を分類し、その使用頻度を調べました。ただし「:」や「.」が入っていたのでこれを除き、使用したのは147単語です。それぞれの単語のプロットとカテゴリーは次の通りです。

f:id:kgotolibrary:20170303201246p:plain

f:id:kgotolibrary:20170303201302j:plain

 各カテゴリーの意味は先の表の通りですが、それにしてもカテゴリー3に汚い言葉が目立ちます……。そしてこれらの単語が使用されている文の割合を調べたのが次の通りです。

f:id:kgotolibrary:20170303201408p:plain

 2016年に近づくにつれて、カテゴリー3,4の単語増加傾向になっていることが分かります。カテゴリー3は社会的な主張、カテゴリー4はブログに関する単語ですが、2016年になるにつれて強い言葉を使った、そして自分のブログに関する言及が多くなることが分かります。そして社会問題に関する発言(カテゴリー6)は、2014年頃に多くなるものの、その後はどんどん減少傾向になっていくことが分かります。

 このことから、件の発言は、社会問題に関するネタは既に尽きていて、そのような「ネタ切れ」の状況において発せられたものと言うことができるでしょう。社会問題に関する発言は2014年には既にある程度終わり、2015年に橋下維新的なものに近接しつつもそれについても先細りになり、そのような状況で社会に対して何らかの発言をしようとしてああなったのかもしれません。

 以上より、長谷川豊という人物がどのような人物なのか、そしてどのようなことをブログで書いていたのかということを分析してみました。ここから言えるのは、長谷川は結局の所身の回りのことでしか政治や社会に関して考えることができない人物であり、ある意味では「タレント文化人」として共通の傾向を持っていることが言えるでしょう。長谷川にはそのような「直言(悪く言えば暴言)タレント文化人」から脱却して欲しいのですが、まあ今回の出馬から考えるとそのようなことを期待することは絶望的なのかもしれません。

 

・出現数59以上の単語一覧

f:id:kgotolibrary:20170303201914j:plain

【秋コレ7サークルペーパー】大塚英志、東浩紀『リアルのゆくえ』分析

秋コレは初出展となります、後藤和智です。弊サークルは2007年の冬コミにおいて、当初は商業活動のプロモーション目的に設立されたサークルで、当初の活動ジャンルは評論の中でも若者論でした。そこから2008年から統計学の解説書を出すようになり、2011年には東方に進出して、さらに2013年からは評論分野にテキストマイニングを本格的に取り入れるようになり、現在はテキストマイニングを用いた評論本と、東方を中心とした学術解説書の刊行という2つの軸を持って活動しているサークルです。

今回「秋葉原」オンリーということで、当初はオタク関係の本をいくつか集めてテキストマイニングしようとしていたのですが、残念ながらタスクがいろいろとたまっていたこともあり今回の新刊の刊行は見送ることとしました。代わりと言ってはなんですが、本来であれば新刊の補論として収録予定だった、オタク関係の対談本の分析をペーパーとして配布することでご了承ください。

今回分析するのは、東浩紀大塚英志の2人の対談をいくつか収録した本である『リアルのゆくえ――おたく/オタクはどう生きるか』(講談社現代新書、2008年)です。この本では、2001年に『小説TRIPPER』(朝日新聞社。現在は朝日新聞出版)、2002年に『新現実』(角川書店)、2007年に『新現実』(太田出版)、そして2008年に本書のための取り下ろしで行われた対談をそれぞれ扱っております。今回は時系列での変化を中心に、この2人の対談の論点がどのように変化していったかを見ていくこととします(なお、本書にはまえがきとあとがきが存在し、まえがきは対談形式だが、あとがきは東による文章となっており、大塚の文章は大塚によって取り下げられたらしいです)。

とは言っても、本書の対談は、読む限りにおいては、サブタイトルの「おたく/オタクはどう生きるか」というものはあまり主題ではなくて、むしろ大塚が東の態度を問い詰めるというものになっています。その点では正しいサブタイトルは「東浩紀は論客としてどう生きるか」というのが正しいのかもしれません(とはいえ、先般のアメリカの大統領選やもう少し前の東京都知事選のように、いまの東は権力への欲望を隠さない、他人を見下すだけの存在になってしまったことを考えると、ここで大塚から言われていた警句がどれくらい活かされているのか疑問なのですが……。あと本書は東のみならず大塚も結構酷かったりして、OCR作業はかなり苦痛でした)。ただ議論の内容はいろいろと変わっているので、その点を見ていくことができればいいこととしましょう(なお、形態素分析にはMeCabを使い、辞書は「浩紀」「コゲどんぼ」(人名/名前)「おたく」「オタク」(一般名詞)「デ・ジ・キャラット」「エヴァンゲリオン」「エヴァ」(固有名詞)を単語として登録した。また「東 」「大塚 」を強制抽出単語として話者の設定に使い、分析の際には排除した。これにより占有率が20%となる、出現数14以上の自立語428単語を分析に用いている)。

まず、対応分析で、それぞれの章の論点と、その論点がどのように変化していったかを見ていきましょう。それぞれの章を文書として見なしたときの、文書ごとの対応分析の結果が表1及び図1となります。そして表2にそれぞれの主成分における単語の得点を掲載します。それぞれの主成分における単語を見てみると、第1主成分の正方向は『動物化するポストモダン』(講談社現代新書、2001年)に関する東の議論に関する内容、負方向は主に若年層の労働などに関する社会学であり、第2主成分は正の方向は世代論、負の方向はアニメやセキュリティといった「東浩紀の議論」に関する方向性ということになります。どちらの方向性にも東の議論が関わっており、このことから本書は東の議論に対する大塚による質問や問いかけと言うことができるでしょう。

表1

f:id:kgotolibrary:20170228105637j:plain


図1

f:id:kgotolibrary:20170228105647p:plain


この結果から、「はじめに」と「あとがき」を除いた本編だけを抽出したものが図2となります。これを見ると、2001年の議論では第1象限、2002年は第4象限、2007年は第3象限、2008年は第2象限という推移が見て取れます。第1主成分の推移で見ると、2001,2002年の議論は『動物化するポストモダン』における議論を巡って行われた対談で、2007,2008年は彼らが「ニート論壇」と呼ぶ、主に若い世代の労働に関して台頭した論客についての議論と呼ぶことができるでしょう。このあたりは分析しなくても分かるようなものです。他方で、一方第2主成分で見ると、2001,2008年の議論は世代論、若者論全体に関するものが主体で、2002,2007年は東の議論をめぐって行われたものと言うことができそうです。特に、2002年の議論は、東が『動物化するポストモダン』などで提起した若者の消費行動や社会の問題に対して大塚が東に質問しているというものと見なして良さそうです。つまり本書は、東の議論が軸になっていると言えるでしょう。

図2

f:id:kgotolibrary:20170228105657p:plain


続いて、多次元尺度構成法を用いて単語を分類し、それぞれの単語が章や話者においてどれくらいの頻度で使われているかを見ていくことにしましょう。分析に用いたのは、出現数45以上の102の自立語です。5つのカテゴリーを設定するため、1カテゴリーあたりの平均の単語数が20個程度となるように設定しました。多次元尺度構成法による単語のプロットを図3、これによる単語の分類を表3に示します。カテゴリー1の単語は全体で使用頻度が多いので特に意味づけは行いませんが、それ以外の単語を見る限りでは、「国家・システム」(カテゴリー2)「批評」(カテゴリー3)「時代」(カテゴリー4)「『動物化するポストモダン』」(カテゴリー5)というように分けることができそうです。章、話者、話者×章の使用頻度を表4に示します。

表3

f:id:kgotolibrary:20170228105715j:plain


図3

f:id:kgotolibrary:20170228105726p:plain


表4

f:id:kgotolibrary:20170228105737j:plain


章ごとの使用頻度の推移を見てみましょう。章ごとの、文単位での使用頻度をバブルプロットで示したのが図4です。2001年の段階ではカテゴリー1の単語の割合が多かったのですがどんどん減っていって、代わりにカテゴリー2,3,4の単語の割合が増えていくことが見て取れます。このことから、2001年の対談は『動物化するポストモダン』、及びそこで提起された問題を中心に語っていたもので、それが章を下って行くにつれてどんどん後景に移っていくという推移が見て取れます。この点においては、本書は『動物化するポストモダン』を読んでいなくても、同書で提起されたものがどういうもので、その議論がどのように推移していくかというのが分かるという構成になっています。

図4

f:id:kgotolibrary:20170228105748p:plain


それでは話者での違いは現れているのでしょうか。話者(東はあとがきを含む)ごとの使用率を見たのが図5になります。これを見ると、カテゴリー5は両者ほぼ等しいですが、カテゴリー2,3,4という、社会や時代に関する単語については大塚の使用頻度が高いことが示されております。また、大塚はカテゴリー2,3,4の使用頻度が増えていくのに対して、東はそれほど変わっていません。このことから、大塚は東の議論について現実の社会問題を絡めて論じているのに対して、東は大塚からの疑問に対して自分の議論を説明することに終始しているという印象を受けます。

図5

f:id:kgotolibrary:20170228105800p:plain

ただ、これは分析に現れていないところなのですが、一読した限りにおいては、大塚も東も、現代の若者論(特に、かつて私が『おまえが若者を語るな!』(角川Oneテーマ21)で論じたとおり、東の『動物化するポストモダン』はただの世代論に過ぎないと見なしていいと思います)によって作られた社会や若者の認識を疑わずそのまま受け入れていること、さらに2007年以降の議論については、労働や教育に関する(「批評」ではない)社会学の知識が明らかに欠落しているという問題点があります。2008年の議論では、彼らが「ニート論壇」と呼ぶものは東の作った下地に下の世代の論客が入ってきたものであると大塚が発言しているところがありますが、下地を作ったのはむしろ本田由紀などの教育社会学や労働に関する社会学と言った方が正しいでしょう。彼らは自分たちがいつまでも議論の中心にいるという幻想から抜け出せていないように思えます。そして、大塚は分かりませんが、少なくとも東は、自分こそが社会を全体的に見ることができるという幻想、というよりは妄想に未だにしがみついている様子です……(『中央公論』2017年1月号の論壇特集など)。

なお、『動物化するポストモダン』の間違いについては、山川賢一が既に論じているので、こちらもご参照ください。
「山川賢一の『動ポモのどこがクソなのか大会』」https://togetter.com/li/533391

付録

f:id:kgotolibrary:20170228105853j:plain

【ツイート転載】結局同じ穴の狢じゃないですか(2017.02.26)

左派批判のためにニセ科学批判の知見を借用している人たちの身勝手なところは、原発事故の自主避難者の扱いが表面上では一貫していないこと。あるときは左派にいいように使われている犠牲者として描き、またあるときは左派と結託してニセ科学を広める存在として描く。

しかし一貫しているのは、彼らは自主避難者と左派こそが復興を妨げている張本人であると主張し、避難しなかった人対現地の住民という偽の対立を作っていること。これは左派が「原子力村」や東京電力が復興を妨げている張本人であると主張するのと非常によく似ている。

そしてどちらにも共通しているのは、東日本大震災の被害が、広義の「フクシマ」(こういう表現は決して使いたくないのだが敢えてこう言う)のみであるという認識。実際には震災は様々なところで被害をもたらしたし、まだ終わったわけではないのに。仙台ではようやく仮設住宅が撤去されるが、他の土地にはまだたくさんある。常磐線だって前線復旧はまだまだ先の話。

そのような様々な被害を無視して、放射能関係ばかり強調するのは、結局ニセ科学批判者に乗っただけの左派批判者は、ニセ科学の伝道者と同様被災地を見ていないのだなと、義務教育の一時期を福島県で過ごし、また震災直後に千葉と宮城の被災地をまわり、福島の同人誌即売会に不定期的に出展している私としては思わざるを得ない。

【ツイート転載】「批評」の読者はどこへ行ったのか?(2017.02.24)

それにしても、2007,8年頃に、私の「宮台真司東浩紀には根拠がない」という批判に対し、「宮台や東の理論は社会を広く見ている」と的外れな批判を加えた、社会学系の「批評」の読者はどこに行ったのか。

ここ5年くらいで、社会学と「批評」の関係ってずいぶん変わった。かつては社会学の院生、学部生が「批評」の主要な読者だったり、東浩紀の周りに社会学者が集まっていたりしたけど、いまは読者は増えて折らず、東界隈にも学者はほとんど集まっていないようだ。

仮にかつて「批評」の読者だった院生が教員やポスドクになって、現実の問題に向き合うようになり、それで「批評」が役に立たないものだと知ったのだとしたら、それは私にとっては(かつて支持していたことの落とし前はどうつけるのかという問題はあるにせよ)歓迎すべきことではある。

「批評」界隈は「批評の未来」なるものを云々しているけど、現在の「批評」の現状があるのは、彼らが「批評」の特殊性にあぐらをかいて科学であることを拒絶し続けてきた結果であって、衰退は必然である。まして、「批評」がもう10年以上前から自分は特殊だと思いたい連中が他人を見下すためのツールと化している現状を直視しようとしない人たちに、果たして「批評の再生」なるものができるのだろうか。

「批評」がいまや限界集落であることは認識していても、それはひょっとして「大衆が莫迦だから」とか考えていないか?だとしたら「批評」はいつまで経っても限界集落だし、それは社会評論全体に悪影響しか及ぼさないのでやめてほしい。

【コミティア119新刊】続・統計学で解き明かす成人の日社説の変遷――平成日本若者論史14

【書誌データ】
 書名:続・統計学で解き明かす成人の日社説の変遷:計量テキスト分析で読み解く〈若者〉へのまなざし――平成日本若者論史14
 初版発行日:2017(平成29)年2月12日(コミティア119)
 オフセット版発行日:2017(平成29)年3月12日(仙台コミケ235)
 著者:後藤和智後藤和智事務所OffLine http://www45.atwiki.jp/kazugoto/
 サイズ:A5
 ページ数:40ページ
 価格:500円(即売会)、委託価格は未定
 通販取扱:メロンブックス (予定)
   COMIC ZIN (予定)
 国立国会図書館登録情報:納本予定
 電子書籍Kindle 

  Enty(有料支援者のみ) https://enty.jp/posts/37358

  Fantia(有料支援者のみ) https://fantia.jp/posts/5541


 サンプル:

www.pixiv.net

【目次】
まえがき
第1章 分析の概要
 1.1 はじめに
 1.2 分析手法
第2章 時期による変化
 2.1 はじめに
 2.2 関連語検索及び対応分析による時期ごとの特徴の検討
 2.3 対応分析による時系列の分析
第3章 クラスタリングによる分析
 3.1 はじめに
 3.2 クラスターごとの特徴の分析
第4章 カテゴリー別単語の集計
 4.1 はじめに:単語のカテゴリー分類
 4.2 時期ごとの分類
 4.3 クラスターごとの分類
付録1 極私的成人の日社説ベスト5&ワースト5(再掲)
 ベスト
  ベスト1:2013年朝日新聞――成人の日の社説で若者論を批判的に検討
  ベスト2:2004年中国新聞――「成人」をめぐる議論を紹介し、思考を促す
  ベスト3:2011年西日本新聞――日本の「年齢」イメージから考える
  ベスト4:2011年沖縄タイムス――「荒れる成人式」から10年、当事者の声を再発掘
  ベスト5:1995年朝日新聞――訓示系社説の手本
  ベストおまけ:2005年西日本新聞――こういうの嫌いじゃないです
 ワースト
  ワースト1:2002年産経新聞――日本社説史に残る「悪」社説、社説の名に値せず
  ワースト2:2007年朝日新聞――日本社説史に残る「迷」社説:迷走朝日、ついに携帯電話になる
  ワースト3:1998年西日本新聞――一方的な「成人式取り上げ」の正義に酔う
  ワースト4:2008年北國新聞――見ているこちらが恥ずかしくなる
  ワースト5:2012年朝日新聞――明らかに滑っている

Jaccard係数による東方Project人気投票パートナー部門分析


この論考は「東方Project」の二次創作を兼ねています。登場人物の口調や性格などが原作と異なる可能性がありますのでご注意ください。

f:id:kgotolibrary:20170127214337p:plain

図:多次元尺度構成法によるキャラクターの配置(条件は本文と同じ)

 

特設サイトを通じて第13回東方Project人気投票のパートナー部門の結果を見たんだ

そうしたら単純なポイント数だけでパートナーの強さを見られることが疑問に思えてな

Jaccard係数を計算しようと思ったんだよ

 

アリス・マーガトロイド(以下、アリス):……何これ。

霧雨魔理沙(以下、魔理沙):『東方鈴奈庵』における易者の台詞の改変だな。

アリス:いや、そうじゃなくてね。何よ、この企画は。

魔理沙:まあ先の改変の通りだ。「東方wiki」が主宰する第13回「東方Project人気投票」においては、この回から「ベストパートナー部門」が新設された。元々パートナーやカップリングに対する投票は、かつて「東方wiki」版の人気投票が行われなかった年で、ニコニコ動画上の東方Projectの二次創作祭りである「東方ニコ童祭」での人気投票、そして中国での東方人気投票で行われていたが、このたび本家でも行われるようになった。

アリス:結果を見てみると、まず霊夢魔理沙が圧倒的なポイントを集めて、続いて「秘封倶楽部」の2人、次に私と魔理沙、その次には咲夜とレミリアなどといった、原作や二次創作で有名なカップリングが高い得票を集める一方で、他方で下の方だと珍しいカップリングが意外な支持を集めてたりしてるわね。

魔理沙:ただ、単純な得票数だけではパートナーの「強さ」を測ることは難しいんじゃないかっていう考えも本稿の筆者の中にはあってな。例えば霊夢のパートナーの場合、私のほか、紫、早苗、文、萃香とかもあるし、今回また順位が大幅に上がった易者なんかも支持がある。他方で、例えばこいしのように、さとり、こころ、フランが圧倒的な支持を得ているが、それ以下はほとんど入っていないケースもあったりする。そのような状況下で、単純な得票数だけでパートナーの強さを測るのは限界がありそうだってのも分かるよな。

アリス:そこでJaccard係数を使うってわけね。Jaccard係数は2つの集合の共通度を測る指標だけど、どういう風に使うの?

魔理沙:元々Jaccard係数は、2つの集合における、積集合の要素の数を和集合の要素の数で除した値を用いる。この投票では、例えば私と霊夢の場合、私と霊夢のパートナーのポイント数を、私と霊夢のどちらかを含むパートナーの票数で割った値がJaccard係数となる。

霊夢魔理沙のJaccard係数 = 霊夢魔理沙のパートナーの得票数 / (霊夢を含むパートナーの票数 + 魔理沙を含むパートナーの票数 - 霊夢魔理沙のパートナーの得票数

魔理沙:この式を使えば、Jaccard係数はExcelで計算できる。少し前に本稿の筆者は「ソースファイルが重すぎてJaccard係数が計算できない」とかぬかしていたが、仕組みさえ分かれば計算は簡単だよな。

アリス:でも、ただ値を求めるだけだと分かりづらいんじゃない?

魔理沙:そこで、今回はKH Coderを使って、共起ネットワークを描くことによりつながりを見ていくことにしたい。集計も、MeCabをカスタマイズすればKH Coderで行うことが可能だ。今回は、下記の条件で、Jaccard係数を求めてみた。

分析対象とするパートナー:11ポイント以上(全体の結果で公表されているもの)

集計を行うキャラクター:個別でのポイントが30ポイント以上

1ポイントを1票とする。

 

魔理沙:集計の対象となったパートナーは別表の通り。グレーは30ポイントに満たなかったため集計対象外とした。これらのキャラクターにおける共起の強さを発表するぜ。

アリス:それでは、まずは1~30位です。

f:id:kgotolibrary:20170127220245j:plain

f:id:kgotolibrary:20170127220310p:plain

アリス:最も強い30の組み合わせとはいえ、3つ以上繋がってるのがないわね。これらは「定番」を通り越して、「鉄板」と言える組み合わせかしら。

魔理沙:特にユキとマイ、及び「蓬莱人形」のジャケット娘とレーベル娘のJaccard係数は、理論上の最高値である1を記録している。これは、「蓬莱人形」の2人で考えると、ジャケット娘にはレーベル娘以外の、レーベル娘にはジャケット娘以外の組み合わせがないということだ。もちろん詳細な結果を見てみれば、ほかの組み合わせにも入っているが(例:ジャケット娘)、全て10ポイント以下(集計対象外)だ。これらの組み合わせは、アリスも言った通り、定番中の定番の組み合わせであり、二次創作でもよく見かけるものだな。

アリス:続いて、31位~60位を見てみましょう。

f:id:kgotolibrary:20170127221314j:plain

f:id:kgotolibrary:20170127221326p:plain

アリス:このくらいまでが定番の組み合わせと言えるかしらね。3つとか4つとか繋がったところも見られるけど、まだまだ独立してる感じね。

魔理沙:一輪を中心とする組み合わせと、鈴仙を中心とする組み合わせで小さな島ができているほか、文・椛・はたての天狗組、光の三妖精、紅魔館メンバー、プリズムリバー姉妹などといった連環が少しずつ生まれてきているのがわかる。

アリス:61~90位は次の通りになっています。

f:id:kgotolibrary:20170127221638j:plain

f:id:kgotolibrary:20170127221647p:plain

アリス:島のサイズがどんどん大きくなってきたわね。こいしちゃんの島とレミリアの島がフランを通じて繋がったり、ぬえを中心に命蓮寺組、小傘ちゃんの島、正邪の島とかが繋がったりと、どんどん巻き込んでく感じね。

魔理沙:とはいえ、まだまだ散発的な印象は否めないな。ここからどんどん繋がっていくぜ。というわけで、今度は91位~120位だ。ここからは、図が煩雑になるため、全ての共起を描いたものと、最小スパニングツリーだけを描いたものを併記する。

f:id:kgotolibrary:20170127222059j:plain

・全ての組み合わせ

f:id:kgotolibrary:20170127222113p:plain

・最小スパニングツリーのみ

f:id:kgotolibrary:20170127222204p:plain

アリス:すごい!一気に繋がったわね。上位120個だけでもこんなに大きくなるのねぇ。

魔理沙:ここまで来ると、島と島の間をつなぐ存在が重要になってくるな。特に霊夢と早苗が繋がったことの影響が大きいと見られる。また細かいところではあるが、文-チルノ-レティ-幽香-魅魔のつながりが生まれたことによりいくつかの小島が結ばれたし、周辺の小島も、例えばルナチャイルドとルナサのつながりが生じたことで音楽組と三月精の島が合わさった。

アリス:それにしても、「抗鬱薬おじさん」-易者-ウワバミのつながりって…。まあいいわ。121位~150位はこのようなものになっています。

f:id:kgotolibrary:20170127223131j:plain

・全て描画

f:id:kgotolibrary:20170127223149p:plain

・最小スパニングツリーのみ

f:id:kgotolibrary:20170127223213p:plain

アリス:ここまで来ると、周辺の島もいよいよ逃げ場がなくなるわね。三月精と音楽組の島は、サニーちゃんとクラウンピースちゃんのつながりを介して大きな島と繋がってしまったし、易者の島ですら、「抗鬱薬おじさん」と鈴仙ちゃんが繋がっちゃった。

魔理沙:Jaccard係数も0.02程度と低いし、これ以上つなげる必要はないとは思うが…、最後に151位~180位を公開しよう。こんな感じだ。

f:id:kgotolibrary:20170127224035j:plain

・全て描画

f:id:kgotolibrary:20170127224056p:plain

・最小スパニングツリーのみ

f:id:kgotolibrary:20170127224115p:plain

魔理沙:最早大きな島は他とのつながりをほとんど持たず、島の中のネットワークを強化するだけになっちまったな。とはいえこれで分かるのは、東方のキャラクターの中には、島の中で複数のキャラクターを取り持っているような、例えば小傘やぬえ、幽香などのように多様な組み合わせがあるものと、ここまで広げてもなお島の袋小路にいるような美鈴やさとりなどといった特定の組み合わせが特に強い支持を得ているもの、そして秋姉妹や清蘭と鈴瑚などといった、ほとんど特定の組み合わせしかないものというように分かれるということだ。もっとも、描画する共起を210にすると、静葉とレティが繋がるんだが、それはどうでもいいよな。

アリス:今回は先行研究の参照はしなかったけど、例えば本稿の筆者が去年出した『東方キャラソート統計』だと、最大で10人名前を上げることができるから、これと若干違う図ができるわよね。ただ、ここでは好きな組み合わせを最大で5個選ぶことができるけど。

魔理沙:あと、ニコ童祭や中国版人気投票と比べてどうなっているかという比較もしなかったが、やってみると面白いかもしれないな。

アリス:今回の集計結果は、下記のGoogleドライブに公開しておりますので、是非ご参照ください。ここでは触れなかったキャラクター別の結果も記載しております。

東方パートナー投票統計表.xlsx - Google ドライブ

 

参考文献

樋口耕一『社会調査のための計量テキスト分析――内容分析の継承と発展を目指して』ナカニシヤ出版、2014年

後藤和智『東方キャラソート統計――多変量解析で見る「愛され方」の研究』後藤和智事務所OffLine、2016年

www.melonbooks.com

 

※集計に用いたキャラクター一覧(灰色は集計に用いていない)

f:id:kgotolibrary:20170127220017j:plain

【新春テキストマイニング初め】イケダハヤトは消耗しているのか?

あけましておめテキストマイニングございます。本年も後藤和智事務所OffLineをよろしくお願いいたします。昨年はあまりテキストマイニングができず、東方の書き下ろし同人誌もあまりかけませんでしたが、2017年はもっと積極的に動いていくつもりです。よろしくお願いいたします。

さて、2017年初のテキストマイニングは、冬コミの評論新刊『間違いだらけの論客選び』でも採り上げた論客、イケダハヤトについて採り上げることとします。というのも、昨年、イケダはホメオパシーを好意的に採り上げたことでネット上で話題になりました。ブログ時代、そして2012年に出版され、『間違いだらけの~』や2014年に書いた『「新しい生き方」は誰のため?』(総集編『「働き方」と「生き方」を問う:〈若者〉をめぐる言説の現在と計量分析――平成日本若者論史Special3』(後藤和智事務所OffLine、2015年)に収録)でも採り上げた『年収150万円で僕らは自由に生きていく』(星海社新書、2012年)以降、若い世代として社会の常識や通念に挑発的に斬り込んでいくというスタイルを保ち、のちに東京を離れて高知に移住してからは、東京で主にサラリーマンとして生きている人たちを挑発していくことで話題になりました。

イケダとホメオパシーの関係については下記の記事がよくまとまっています。

hagex.hatenadiary.jp

 

interdisciplinary.hateblo.jp

これが話題になっていたので、私も俗流若者論専用の書庫の奥底からイケダの著書『まだ東京で消耗してるの?』(幻冬舎新書、2016年)を引きずり出して読んだのですが、通読した感想は、どうも「~ですよ。」「~(し)ますよ。」という表現が目立つということです。ここまで自分を必死に売り込んでいても、言っているのは自分が「これから凄いことをやる」という主張(悪く言えば妄想、夢想)だけで、その社会的なインパクトなどについては主張が薄い気がしました。今までのいくつかの著書で見られた社会的ビジョンなどのようなものは捨て去られてしまった印象を受けます。

それだけではありません。私がイケダという”論客”に対して根本的な疑念を持つようになったのは、次のようなLINEスタンプを売っていることを知ったからです。

store.line.me

 

 

これを見ると、イケダは最早言論の中身ではなく「キャラ」で売っているとしか思えません。言説の科学性や実現性を重視する論客というのは、最早過去のものなのか――。イケダのような〈若手論客〉を見ていると、そのような印象を受けます(だからこそ『間違いだらけの~』を書いたのですが)。

※私の『まだ東京で~』の感想はこちら。

 

 

 

 

さて、新春テキストマイニング初めは、このイケダについて分析してみたいと思います(当初の予定では、柳美里『仮面の国』を検証しようと思っていたのですが、これは後にとっておきます)。分析する書籍は、2012年に刊行された『年収150万円で~』(以下、『年収』)と、2014年の『なぜ僕は「炎上」を恐れないのか』(光文社新書、2014年。以下『炎上』)、そして2016年の『まだ東京で~』(以下『消耗』)です。いずれも新書であり、また刊行時期がちょうど2年おきになっているので、イケダという論客の変遷を追っていく上ではいいセレクションかと思います。

まず各書籍のプロフィールを示す前に、文章表現を集計してみます。RMeCabでN-gramを集計した後、代表的な文末表現についてコーディングを作成し集計してみました(書籍は全て敬体で書かれている)。

# 文末
*「~(して)います。」
'ています。'
*「~(して)しまいます。」
'てしまいます。'
*「~と思います。」
'と思います。'
*「~考えています。」
'考えています。'
*「~できます。」
'できます。'
*「~のです。」
'のです。'
*「~いました。」
'いました。'
*「~なりました。」
'なりました。'
*「~(して)きました。」
'てきました。'
*「~でしょうか。」
'でしょうか。' | 'でしょうか?'
*「~(して)ください。」
'てください。'
*「~でしょう。」
'でしょう。'
*「~しましょう。」
'ましょう。'
*「~ですよ。」「~ますよ。」
'すよ。'
*「~ません。」
'ません。'

これを集計した結果が次の通りです。
表1

f:id:kgotolibrary:20170105220103j:plain

図1

f:id:kgotolibrary:20170105220126p:plain


集計結果を見ると、『年収』『炎上』では、「~のです。」「~でしょう。」が高かったのに対し、『消耗』では、私の読みの通り「~ですよ。」「~ますよ。」が圧倒的に多くなっています(特に『年収』では1回も使われていなかった)。ここからも、イケダにおける言説が、『消耗』では「自分がどんなことができるか」「自分が何をやっているのか」ということを主張することがメインになっていることが見受けられます。

さて、本格的な分析に入っていきましょう。まず、書籍のプロフィールと、対応分析による単語のプロットを示します。対応分析には、占有率が20%となるような自立語である、出現数18以上の自立語を使っています。

表2

f:id:kgotolibrary:20170105220137j:plain

図2

f:id:kgotolibrary:20170105220150p:plain


今回は、多次元尺度構成法を用いて、単語をカテゴライズしてみました。用いた単語は上位100単語に近い、出現数58以上の103単語です。この単語を5つのクラスターに分けてみます。集計基準は段落としました。

図3

f:id:kgotolibrary:20170105220202p:plain


ここから、単語を下記の5カテゴリーに分けました。

表3

f:id:kgotolibrary:20170105220212j:plain


集計結果は下記の通りです。

表4

f:id:kgotolibrary:20170105220222j:plain


図4

f:id:kgotolibrary:20170105220249p:plain


カテゴリー1については、集計結果でおしなべて高いので、敢えて意味をつける必要はないだろうと思い意味は「なし」としております。それ以外の単語を見てみると、カテゴリー2は『年収』で高く、カテゴリー3,4は『年収』と『炎上』で、そしてカテゴリー5は『消耗』がそれぞれ使用率が高くなっています。カテゴリー3,4については、イケダにとってブログが社会とつながり、そして自分の考えを発信する手段「であった」ことを考えれば、『年収』や『炎上』では使用率が高いということはわかります。

しかしそのイケダの論客としての特徴もしくは特殊性を、『消耗』ではかなぐり捨ててしまって、逆にパーソナルな記述が急増してしまっていると言えます。文末表現も含めて、イケダの関心が社会から自分に向かっているのは、ひたすら自分を虚飾しなければ論客としてやっていけなくなったということなのでしょうか(それこそ前述のLINEスタンプなども含めて)。

だとすれば、これはイケダと我が国の言論メディア双方にとっての危機だと思います。まずイケダに関しては、ただ「若さ」、もう少し言えば「ブログ世代としての特殊性」以外になにも持つものがないということです。『「新しい生き方」は誰のため?』では、最近の論客は、「働き方」と「生き方」の2つを書いてしまうと、もう論客としてネタ切れになってしまい、後が続かなくなるということを書きましたが(本稿で分析した書籍だと、『年収』が働き方、『炎上』が生き方ということになる)、少なくともイケダについてはその予感が当たってしまったとしか言えません。

そして出版側の問題として、このような中身がなく、ただかつて「若者代表」のひとりとしてもてはやされた論客が、自分を虚飾するだけの文章が売り出されてしまうということです。イケダが『消耗』を出したという事実は、我が国の言論が「キャラ」に支配されていることの一端を示しているということです。2017年は、1990年代終わり~2000年代の劣化言説の時代の解明と共に、このような「キャラ」化した言論、論壇の現状についても、テキストマイニングを用いて斬り込んでいこうと思います。

※イケダも登場する冬コミ評論新刊、現在メロンブックスCOMIC ZINにて委託中です。

kazugoto.hatenablog.com

www.melonbooks.co.jp

COMIC ZIN 通信販売/商品詳細 間違いだらけの論客選び――2010年代「日本社会論」の計量テキスト分析

『年収』の共起ネットワーク

f:id:kgotolibrary:20170105220337p:plain

『炎上』の共起ネットワーク

f:id:kgotolibrary:20170105220351p:plain

『消耗』の共起ネットワーク

f:id:kgotolibrary:20170105220401p:plain

付録1

f:id:kgotolibrary:20170105220413j:plain

付録2

f:id:kgotolibrary:20170105220433j:plain