Jaccard係数による東方Project人気投票パートナー部門分析
注
この論考は「東方Project」の二次創作を兼ねています。登場人物の口調や性格などが原作と異なる可能性がありますのでご注意ください。
図:多次元尺度構成法によるキャラクターの配置(条件は本文と同じ)
特設サイトを通じて第13回東方Project人気投票のパートナー部門の結果を見たんだ
そうしたら単純なポイント数だけでパートナーの強さを見られることが疑問に思えてな
Jaccard係数を計算しようと思ったんだよ
アリス・マーガトロイド(以下、アリス):……何これ。
霧雨魔理沙(以下、魔理沙):『東方鈴奈庵』における易者の台詞の改変だな。
アリス:いや、そうじゃなくてね。何よ、この企画は。
魔理沙:まあ先の改変の通りだ。「東方wiki」が主宰する第13回「東方Project人気投票」においては、この回から「ベストパートナー部門」が新設された。元々パートナーやカップリングに対する投票は、かつて「東方wiki」版の人気投票が行われなかった年で、ニコニコ動画上の東方Projectの二次創作祭りである「東方ニコ童祭」での人気投票、そして中国での東方人気投票で行われていたが、このたび本家でも行われるようになった。
アリス:結果を見てみると、まず霊夢と魔理沙が圧倒的なポイントを集めて、続いて「秘封倶楽部」の2人、次に私と魔理沙、その次には咲夜とレミリアなどといった、原作や二次創作で有名なカップリングが高い得票を集める一方で、他方で下の方だと珍しいカップリングが意外な支持を集めてたりしてるわね。
魔理沙:ただ、単純な得票数だけではパートナーの「強さ」を測ることは難しいんじゃないかっていう考えも本稿の筆者の中にはあってな。例えば霊夢のパートナーの場合、私のほか、紫、早苗、文、萃香とかもあるし、今回また順位が大幅に上がった易者なんかも支持がある。他方で、例えばこいしのように、さとり、こころ、フランが圧倒的な支持を得ているが、それ以下はほとんど入っていないケースもあったりする。そのような状況下で、単純な得票数だけでパートナーの強さを測るのは限界がありそうだってのも分かるよな。
アリス:そこでJaccard係数を使うってわけね。Jaccard係数は2つの集合の共通度を測る指標だけど、どういう風に使うの?
魔理沙:元々Jaccard係数は、2つの集合における、積集合の要素の数を和集合の要素の数で除した値を用いる。この投票では、例えば私と霊夢の場合、私と霊夢のパートナーのポイント数を、私と霊夢のどちらかを含むパートナーの票数で割った値がJaccard係数となる。
霊夢と魔理沙のJaccard係数 = 霊夢と魔理沙のパートナーの得票数 / (霊夢を含むパートナーの票数 + 魔理沙を含むパートナーの票数 - 霊夢と魔理沙のパートナーの得票数)
魔理沙:この式を使えば、Jaccard係数はExcelで計算できる。少し前に本稿の筆者は「ソースファイルが重すぎてJaccard係数が計算できない」とかぬかしていたが、仕組みさえ分かれば計算は簡単だよな。
アリス:でも、ただ値を求めるだけだと分かりづらいんじゃない?
魔理沙:そこで、今回はKH Coderを使って、共起ネットワークを描くことによりつながりを見ていくことにしたい。集計も、MeCabをカスタマイズすればKH Coderで行うことが可能だ。今回は、下記の条件で、Jaccard係数を求めてみた。
分析対象とするパートナー:11ポイント以上(全体の結果で公表されているもの)
集計を行うキャラクター:個別でのポイントが30ポイント以上
1ポイントを1票とする。
魔理沙:集計の対象となったパートナーは別表の通り。グレーは30ポイントに満たなかったため集計対象外とした。これらのキャラクターにおける共起の強さを発表するぜ。
アリス:それでは、まずは1~30位です。
アリス:最も強い30の組み合わせとはいえ、3つ以上繋がってるのがないわね。これらは「定番」を通り越して、「鉄板」と言える組み合わせかしら。
魔理沙:特にユキとマイ、及び「蓬莱人形」のジャケット娘とレーベル娘のJaccard係数は、理論上の最高値である1を記録している。これは、「蓬莱人形」の2人で考えると、ジャケット娘にはレーベル娘以外の、レーベル娘にはジャケット娘以外の組み合わせがないということだ。もちろん詳細な結果を見てみれば、ほかの組み合わせにも入っているが(例:ジャケット娘)、全て10ポイント以下(集計対象外)だ。これらの組み合わせは、アリスも言った通り、定番中の定番の組み合わせであり、二次創作でもよく見かけるものだな。
アリス:続いて、31位~60位を見てみましょう。
アリス:このくらいまでが定番の組み合わせと言えるかしらね。3つとか4つとか繋がったところも見られるけど、まだまだ独立してる感じね。
魔理沙:一輪を中心とする組み合わせと、鈴仙を中心とする組み合わせで小さな島ができているほか、文・椛・はたての天狗組、光の三妖精、紅魔館メンバー、プリズムリバー姉妹などといった連環が少しずつ生まれてきているのがわかる。
アリス:61~90位は次の通りになっています。
アリス:島のサイズがどんどん大きくなってきたわね。こいしちゃんの島とレミリアの島がフランを通じて繋がったり、ぬえを中心に命蓮寺組、小傘ちゃんの島、正邪の島とかが繋がったりと、どんどん巻き込んでく感じね。
魔理沙:とはいえ、まだまだ散発的な印象は否めないな。ここからどんどん繋がっていくぜ。というわけで、今度は91位~120位だ。ここからは、図が煩雑になるため、全ての共起を描いたものと、最小スパニングツリーだけを描いたものを併記する。
・全ての組み合わせ
・最小スパニングツリーのみ
アリス:すごい!一気に繋がったわね。上位120個だけでもこんなに大きくなるのねぇ。
魔理沙:ここまで来ると、島と島の間をつなぐ存在が重要になってくるな。特に霊夢と早苗が繋がったことの影響が大きいと見られる。また細かいところではあるが、文-チルノ-レティ-幽香-魅魔のつながりが生まれたことによりいくつかの小島が結ばれたし、周辺の小島も、例えばルナチャイルドとルナサのつながりが生じたことで音楽組と三月精の島が合わさった。
アリス:それにしても、「抗鬱薬おじさん」-易者-ウワバミのつながりって…。まあいいわ。121位~150位はこのようなものになっています。
・全て描画
・最小スパニングツリーのみ
アリス:ここまで来ると、周辺の島もいよいよ逃げ場がなくなるわね。三月精と音楽組の島は、サニーちゃんとクラウンピースちゃんのつながりを介して大きな島と繋がってしまったし、易者の島ですら、「抗鬱薬おじさん」と鈴仙ちゃんが繋がっちゃった。
魔理沙:Jaccard係数も0.02程度と低いし、これ以上つなげる必要はないとは思うが…、最後に151位~180位を公開しよう。こんな感じだ。
・全て描画
・最小スパニングツリーのみ
魔理沙:最早大きな島は他とのつながりをほとんど持たず、島の中のネットワークを強化するだけになっちまったな。とはいえこれで分かるのは、東方のキャラクターの中には、島の中で複数のキャラクターを取り持っているような、例えば小傘やぬえ、幽香などのように多様な組み合わせがあるものと、ここまで広げてもなお島の袋小路にいるような美鈴やさとりなどといった特定の組み合わせが特に強い支持を得ているもの、そして秋姉妹や清蘭と鈴瑚などといった、ほとんど特定の組み合わせしかないものというように分かれるということだ。もっとも、描画する共起を210にすると、静葉とレティが繋がるんだが、それはどうでもいいよな。
アリス:今回は先行研究の参照はしなかったけど、例えば本稿の筆者が去年出した『東方キャラソート統計』だと、最大で10人名前を上げることができるから、これと若干違う図ができるわよね。ただ、ここでは好きな組み合わせを最大で5個選ぶことができるけど。
魔理沙:あと、ニコ童祭や中国版人気投票と比べてどうなっているかという比較もしなかったが、やってみると面白いかもしれないな。
アリス:今回の集計結果は、下記のGoogleドライブに公開しておりますので、是非ご参照ください。ここでは触れなかったキャラクター別の結果も記載しております。
東方パートナー投票統計表.xlsx - Google ドライブ
参考文献
樋口耕一『社会調査のための計量テキスト分析――内容分析の継承と発展を目指して』ナカニシヤ出版、2014年
後藤和智『東方キャラソート統計――多変量解析で見る「愛され方」の研究』後藤和智事務所OffLine、2016年
※集計に用いたキャラクター一覧(灰色は集計に用いていない)