人気ブログランキング | 話題のタグを見る
ブログトップ

今日から始めるゲーム統計学

tsubame30.exblog.jp

かつては麻雀およびエロゲのデータを統計解析して遊んでました。今では日本酒に夢中です。

【エロゲ解析】ErogameScapeで因子分析 ~得点を決めている想いは何?

ErogameScapeにおいては、ユーザーは数多あるエロゲーにそれぞれ点数をつけます。
その点数じたいはそのエロゲーのタイトルに応じて当然偏りがあるのですが、その点数の評価基準といいますか、根拠のようなものはおおよそ一定のはずです。(そこがバラつくこともあるんじゃない? という指摘はごもっともですが、ひとまず変わらないものとしましょう。クソゲーは3年寝かせてもだいたいクソゲーじゃないか? という感じでお願いします)
その評価基準という目に見えない心理的傾向を、因子分析という手法でなんとかしてみようというのが今回の記事です。

ゲームを評価する心理的傾向が、今回は2因子(因子1、2)あるとして、2つの因子がそれぞれの点数に影響を与えるというモデルで考えてみます。ものすごく雑ペイントですが、図にするとこんな感じです。
【エロゲ解析】ErogameScapeで因子分析 ~得点を決めている想いは何?_d0279358_23165436.png



以前からErogameScapeのデータを使って因子分析したら面白いのではと思い、Rのfactanalコマンドを使っていろいろ試しているのですが、説明変数が多すぎたり、サンプルが少なすぎたりでエラーが出まくってろくに成果が出せていません。今回は、多少いろんなものを割り切っても、エラーのでない結果を出して因子分析を練習してみようということで以下のようにやってみました。





----◆解析手順◆----

① 今回は因子分析に用いるゲームの点数データとして以下9つのゲームに入力された点数を利用しました。

『AIR』
『Fate stay night』
『ToHeart2XRATED』
『ゴア・スクリーミング・ショウ』
『超昂閃忍ハルカ』
『ましろ色シンフォニー』
『DRACU-RIOT!』
『この大空に、翼をひろげて』
『聖娼女』


この9作品は、4月9日に放送された電脳妄想開発室275回放送のテーマメール「新人さんは、まずこちら」に寄せられたメールの内容に挙げられたゲームから筆者が独断で選別したものです。


② 以下のSQLにより、対象の9作品に点数を入力したユーザーと点数の対応を取得しました。

SELECT game, uid, tokuten FROM userreview WHERE game IN (9967,6467,17911,3254,11463,16506,16212,17039,6093,84) AND tokuten IS NOT NULL


③ エクセルのピポッドテーブルを用いて、ユーザーと点数の対応をとりました。9作品のうち5作品に点数を入力しているユーザー(347名が該当)についてのデータのみを使用し、たくさんある欠損値には、そのゲームの既に埋まっている値の平均値を代入しました。

④ 以下のようなcsvを作ります。値の基準化は今回していません。
  ※イメージ画像
【エロゲ解析】ErogameScapeで因子分析 ~得点を決めている想いは何?_d0279358_2318457.png



④ Rにより、以下のようにコマンド実行します。


data <- read.csv("fac01.csv", header=T)
result <- factanal( data, factors=2 , score="regression" ,rotation="promax")


今回は、factanalコマンドにより、プロマックス回転による2因子分析を行いました。因子得点は回帰法で求めました。



----◆結果・考察◆----

結果は以下のとおりとなりました。
【エロゲ解析】ErogameScapeで因子分析 ~得点を決めている想いは何?_d0279358_23185238.png



因子負荷量(2因子が9つのゲームに与える平均的な影響を示す値)については、0.4を超えるものに赤の網掛けをしています。
因子1は『ましろ色シンフォニー』『DRACU-RIOT!』の点数上昇に大きく影響しており、『ToHeart2XRATED』も0.37とそこそこ高い値になっていることから、該当するゲームの相対的な特徴を鑑みて、因子1を「キャラ萌え」と名づけてみました。
因子2は『AIR』『Fate stay night』の点数上昇に大きく影響しています。シナリオという言葉を使うといろいろ揉めそうなので、因子2は「ドラマ性」と名づけてみました。

※イメージ図
【エロゲ解析】ErogameScapeで因子分析 ~得点を決めている想いは何?_d0279358_2318547.png




共通性というものは、2つの因子から変数(今回ではゲームの点数)がどのくらい説明できるかを示すものです(※参考 Rによるやさしい統計学 http://www.slideshare.net/holidayworking/r-16)。
たとえば、『聖娼女』の点数は今回の2因子からではほとんど説明ができていません。これは平均値を代入する前の元データの欠損数が多すぎたためではないかと思われます。欠損数は289であり、点数入力のなかった289名全員が平均値にあたる点数を入力したことにして分析しています。「キャラ萌え」を重視するユーザーも「ドラマ性」を重視するユーザーもほぼ平均値をつけたような状態になっているので、因子の影響が実際のそれよりも大幅に丸められていると考えられます。

このようにおおむね欠損が大きいほど共通性が小さい傾向にあります。ただ、『DRACU-RIOT!』は欠損数140でありながら因子負荷量が0.20を超えており、「キャラ萌え」の影響がある程度大きいように思われます。逆に『ゴア・スクリーミング・ショウ』は、サンプル数を考慮しても因子負荷量が相対的に小さく、他と比べて「キャラ萌え」でも「ドラマ性」でも説明できないものの影響があるように考えられます。

今回はプロマックス法なので、因子間の相関を考慮する形で行いました。因子間相関は-0.581となっており、「キャラ萌え」と「ドラマ性」に負の相関が出るという結果になりました。「キャラ萌え」重視の作品は「ドラマ性」を平均的には軽視しており、逆も同様ということです。なかなか両刀使いとはいかないようですね。
因子負荷量のプロットからも、いかにもな負の相関ぽさがでていますね。回帰直線を引きたくて仕方ないのですが、マルチコの問題があるかもしれないので我慢しました。


以下のグラフは各ユーザーの因子得点のプロットです。
【エロゲ解析】ErogameScapeで因子分析 ~得点を決めている想いは何?_d0279358_23403928.png



ユーザーの分布を象限ごとにカウントすると、
「ドラマ性」も「キャラ萌え」も両方影響する人は全体の28%、
「ドラマ性」に特化した人が31%、
「キャラ萌え」に特化した人が29%、
どちらもさほどという人が12%程度でした。


エロゲーを企画して売る側から見ると、「ドラマ性」を重視して買うユーザーの数、「キャラ萌え」を重視するユーザーの数なんかは気になるのではないかと思います。今回の結果だけ見れば、「ドラマ性」も「キャラ萌え」のどちらを重視しても対象ユーザー数はさほど変わらないということになります。
とはいえ、今回解析に使った9作品がエロゲー市場のミニチュアとするにはさすがに乱暴すぎるので、あくまで参考程度に留めるべきだとは思います。


----◆総括◆----

・エロゲーの採点において、「キャラ萌え」と「ドラマ性」の2要素が影響することが示唆される。
・「キャラ萌え」を重視するユーザー数と「ドラマ性」を重視するユーザー数はさほど変わらないことが示唆される。


どこかにエロ因子があるのではと疑い、3因子でも分析したのですが、結果がイマイチピンとこなかったので今回は2因子を採用しました。
ゲーム数(変数)をもっと増やしてやりたいのですが、そうなるとサンプル数が足りず、サンプルを無理やり増やすと欠損が増えるという非常に悩ましい事態になっています。
いい落とし所がないものでしょうか。ご意見待ってます。
by tsubame30 | 2015-04-18 23:34 | エロゲ解析

by tsubame30