後藤和智事務所OffLine サークルブログ

同人サークル「後藤和智事務所OffLine」のサークル情報に関するブログです。旧ブログはこちら。> http://ameblo.jp/kazutomogoto/

【テキストマイニング】衆院選に出馬するらしいので長谷川豊のブログを分析する

www.huffingtonpost.jp

 

 いくつかのメディアが2月6日頃に伝えたように、フリーアナウンサーの長谷川豊が、次の衆院選に出馬することを表明しました。長谷川は、2016年9月に「自業自得の人工透析患者なんて、全員実費負担にさせよ!無理だと泣くならそのまま殺せ!」という記事を書いてたくさんの批判に遭い(この批判は正当なものです)、それが問題になってたくさんの仕事を降ろされました。

 先に挙げたハフィントンポストの記事によると、長谷川は「『自業自得』の線引きをするのが政治だ」ということを言っておりますが、どこからどこまでが「自業自得」かというのは確率的なもの、さらに医療関係においては遺伝的なものを含むため曖昧であり(極論すれば、例えば先天的疾患である1型糖尿病を患っている、阪神タイガース岩田稔に対して「そういう家系に生まれたことが悪い」などと言うことも可能になってしまいます)、未だにその発言の差別性を認識していないと言えるでしょう。

 長谷川の出馬に対しては一部のリベラル派からは「出馬すること自体を止めることはできない」という反批判がありましたが、そのような批判の問題点についてはこちらをご参照ください。

yongsong.exblog.jp

yongsong.exblog.jp

yongsong.exblog.jp

 

 さて、計量分析家としては、長谷川豊という人物がどのような人物であり、どのような人物が政治家になろうとしているのかということを、計量分析を用いて明らかにしようと思います。言うまでもなく長谷川はブログで有名であり、先の騒動の発端になったのもブログです。そこで、長谷川のブログを分析することにより、長谷川という人物を解き明かしていきたいと思います。

 2017年3月2日に、長谷川のブログの、2014年4月~2016年11月の文章(2016年12月は記事がなかった)をテキストエディタにコピー&ペーストし、四半期ごとにその変化を見ていくこととしました。使用する分析手法は対応分析と、多次元尺度構成法によって抽出した単語の集計です。形態素解析にはフリーソフトMeCab」を用い、辞書は「自民党」「自由民主党」「民主党」「民進党」「維新の会」「維新の党」「大阪維新の会」「おおさか維新の会」(固有名詞組織)「橋下」(固有名詞名字)「ウヨク」「サヨク」(一般名詞)を登録しました。

 まず対応分析の結果を見てみましょう。使用した単語は占有率が20%以上となる、主柘植数59以上の自立語598語です。第1,2主成分と単語のプロットは次の通りになりました。

f:id:kgotolibrary:20170303195918p:plain

 ただ、第1,2主成分までの寄与率の合計が30%程度と低いので、それ以外の主成分も見てみましょう。第5主成分までの変遷を示してみます。

f:id:kgotolibrary:20170303200303j:plain

f:id:kgotolibrary:20170303200321p:plain

f:id:kgotolibrary:20170303200338j:plain

 まず第1主成分を見てみると、第1主成分は2016年9月の問題発言に関する主成分と見ていいと思います。この主成分が2016年第4期に向けて大きくなるのはまあ当然でしょう。ただ政治的発言に関して注目すべきは第2,3主成分だと思います。第2主成分と第3主成分の正方向は、それぞれ政治的な発言になっています。第2主成分の正方向は主に右派的な政治発言、第3主成分は主に橋下維新的な政治発言と言えます。

 そしてこの2つの主成分がプラスの方向に傾いているのは、2016年ではなくむしろ2015年でした。2015年においては、この2つの主成分がほぼ一貫してプラスの方向に傾いているのです。2016年は、どちらかというと芸能関係の発言が多く見られましたが、長谷川の思考が橋下維新的なものに接近するのは、2015年であったと言うことができるでしょう。

 続いて、多次元尺度構成法を用いて、上位149単語を分類し、その使用頻度を調べました。ただし「:」や「.」が入っていたのでこれを除き、使用したのは147単語です。それぞれの単語のプロットとカテゴリーは次の通りです。

f:id:kgotolibrary:20170303201246p:plain

f:id:kgotolibrary:20170303201302j:plain

 各カテゴリーの意味は先の表の通りですが、それにしてもカテゴリー3に汚い言葉が目立ちます……。そしてこれらの単語が使用されている文の割合を調べたのが次の通りです。

f:id:kgotolibrary:20170303201408p:plain

 2016年に近づくにつれて、カテゴリー3,4の単語増加傾向になっていることが分かります。カテゴリー3は社会的な主張、カテゴリー4はブログに関する単語ですが、2016年になるにつれて強い言葉を使った、そして自分のブログに関する言及が多くなることが分かります。そして社会問題に関する発言(カテゴリー6)は、2014年頃に多くなるものの、その後はどんどん減少傾向になっていくことが分かります。

 このことから、件の発言は、社会問題に関するネタは既に尽きていて、そのような「ネタ切れ」の状況において発せられたものと言うことができるでしょう。社会問題に関する発言は2014年には既にある程度終わり、2015年に橋下維新的なものに近接しつつもそれについても先細りになり、そのような状況で社会に対して何らかの発言をしようとしてああなったのかもしれません。

 以上より、長谷川豊という人物がどのような人物なのか、そしてどのようなことをブログで書いていたのかということを分析してみました。ここから言えるのは、長谷川は結局の所身の回りのことでしか政治や社会に関して考えることができない人物であり、ある意味では「タレント文化人」として共通の傾向を持っていることが言えるでしょう。長谷川にはそのような「直言(悪く言えば暴言)タレント文化人」から脱却して欲しいのですが、まあ今回の出馬から考えるとそのようなことを期待することは絶望的なのかもしれません。

 

・出現数59以上の単語一覧

f:id:kgotolibrary:20170303201914j:plain