人気ブログランキング | 話題のタグを見る
ブログトップ

今日から始めるゲーム統計学

tsubame30.exblog.jp

かつては麻雀およびエロゲのデータを統計解析して遊んでました。今では日本酒に夢中です。

【エロゲ解析】2012年は本当に不作なの?

「プリズム◇リコレクション」が延期して2012年\(^o^)/オワタ
という風潮になっている今日この頃いかがお過ごしでしょうか。

各地で「今年は不作だ~~」と嘆く声をよく耳にします。
個人的には、7月に出た「終わる世界とバースデイ」が大当たりしたので、
「今年はダメだな」という声を聞くとちょっと悔しくなってしまいます。

そこで僕は思いました。
みんな豊作不作言うけど、個人のさじ加減なんじゃないか。
懐古主義の延長なんじゃないかと。

そんな疑問を解決すべく、ゲームの発売年別の得点分布に
本当にそこまでの差が出るのかどうかを調べてみることにしました。




◆対象
・ある年に発売されたゲーム(同人・非18禁全て含む)と、それにつけられた得点すべて
※2012/12/1現在のもの

SELECT gamename, tokuten FROM userreview AS u, gamelist AS g WHERE u.game=g.id AND u.tokuten IS NOT NULL AND sellday >= '2012/01/01' AND sellday < '2013/01/01' ORDER BY gamename, tokuten DESC

このSELECT文をSQL実行フォームに入力すると、2012年発売のゲーム名と得点の表が得られます。
日付の条件を変えれば他の年度のデータも取得できます。




◆結果

・2012年の得点分布のヒストグラム
【エロゲ解析】2012年は本当に不作なの?_d0279358_20552794.png

frequency関数で今年発売のゲームについてのヒストグラムを作成しました。
得点の「100」は100~91点、「90」は90~81点、……「10」は10~1点、「0」は0点を表し、
その点数に該当するものを数えてグラフにしたものです。
これと同様のヒストグラムを各年について作成し比較してみました。




・2007年の得点分布のヒストグラム
【エロゲ解析】2012年は本当に不作なの?_d0279358_2056372.png

これが、「大不作」と称された2007年のヒストグラムです。
別々のグラフを見てはっきり差がわかるほど分布のグラフは変わっていません。
よく見ると「90~81」の値がごく微差ながら「70~61」の値に負けており、
2012年と比べて2007年が奮っていないのはわかりますが、
80>90>60>100>50以下という全体の概形に影響を及ぼすレベルの差は出ていません。




・年別の比較(平均値と中央値)
【エロゲ解析】2012年は本当に不作なの?_d0279358_20564450.png

まず、年代別の平均値・中央値の変遷を見てみました。



●中央値

中央値を見ると、まず目立つのは2005年の77点です。
それ以外の2001年以降は張り付いたように75点となっています。

ここまで75で張り付くとは思わず、
少しプログラムでシュミレーションして調べたのですが、
中央値という値は他の統計量に比べて、非常に収束が早いようです。
サンプルが50000前後になるような今回のデータだと、
結構な差がつかないと1差がつかないようです。
このあたりの話はまた今度詳しくやろうと思います。

そんな中、中央値で2点差をつけている2005年は大豊作といえるでしょう。

●平均値

平均値を見ると、70点前後で変遷してきた値が73点前後までぐっと上り、
大豊作2005年に74点越え、それ以後は不調年にへこみをみせながらも
概ね73点前後を維持しています。

今年の値を見ると、2005年、2011年に次いで3位という結果になっています。
これだけみると、今年はかなり出来のいい年に思えます。





・年別の比較(得点分布)
【エロゲ解析】2012年は本当に不作なの?_d0279358_20582052.png

さらに細かい分布を比較するべく、
このように積み上げグラフにして並べてみました。




●100~91点の全体%の値(青色だけ)に注目すると……

2003年~2006年の4年間は、全体の10%が91点を超えています。
また豊作と言われている2011、2009では9%代です。

一方不作と言われてる今年、2010年では7%代、
2007年に至っては6.77%と落ちています。


一見数%の違いしかないように思いますが、
2003年以降は、参照しているデータ数はほとんど50000を超えています。
(まだデータが蓄積していない最近のものは除く)
ここで4%の差が出ると、単純に考えると2000データ分もの差が出ることになります。
無視できるものではなさそうです。


今年は7.45%。2007年ほどではないにしろ、かなりの不調であると言えます。
先ほどの平均値評価とは印象が違いますね。
では今度は低得点の分布を見ていきましょう。



●100~61点(緑色まで)に注目すると……

1999年は全体で見たときに低得点率が高く、61点を超えている率が70%を割っています。
しかし、業界が少しずつニーズをつかんできたのか、00年、01年とぐぐっと上がっていき、
2003年以降は61点を超える割合80%前後をキープし続けています。
そして、不作と言われる今年に至っては、
超豊作の2005年を微差で抑えて過去13年でトップとなっています。





以上のことから、今年の点数傾向は、

「90点を超えるような高得点となる作品は少ないが、60点を割るような低得点作品も少なく手堅い年である」
「全体平均ではハイレベルだが、今年はこれだ! といえるレベルの好印象の作品がない」

ということが言えそうです。

豊作かどうかが、「今年はこれだ!」という出来の良い作品があるかどうか、ということならば
今年は(他の年と比べて)不作であるが、同時に全体平均ならかなり成績のいい年でもあります。


・番外編 ~ 年別の比較(データ数とゲーム本数)
【エロゲ解析】2012年は本当に不作なの?_d0279358_20584297.png

得点のデータの数と、対象となったゲームタイトル数を出しました。
最新のゲームはまだデータが蓄積されていないためか、ここ3年のデータ数はまだ少ないです。

●データ数

特徴的な2003年、2005年、2007年のポイントを参照すると、
直感的ではありますが、データ数と全体得点の平均値にはかなり相関がありそうです。
評判のいいゲームを皆こぞってプレイする背景が垣間見れます。


●ゲーム本数

2008年まではほぼ単調増加していたゲームタイトル数が、ここ最近は減少傾向にあります。

2012年は得点が投稿されていない11月末以降のゲームはカウントされていないので、
最終的にどうなるかはわかりませんが、
それにしたってかなりゲームタイトル数が少なくなっています。

暫定2012年のデータ数を10月発売までと仮定しても、
753本/10*12 = 903.6本です。
減少傾向があると考えることは出来るでしょう。


このことと、得点の全体平均は高いレベルを維持していることを考えると、

①ゲームの開発期間が延ばしている(延びている)?
②メーカー側が慎重になって企画数を抑えてる?
③メーカーそのものが淘汰されてきてる?
などいろいろ邪推することができます。

なにが真実かはこれだけではわかりませんが……





◆総括

簡単に結論を言えば、

年ごとの出来の差は存在し、この年は良かった悪かったの印象論は結構当たってる。

ということになるでしょうか。

印象論も結構侮れないものです。
まあ印象論を唱えてる母集団が点数の評価をしているのですから、
まあ当然といえば当然なのかもしれませんが(笑)


今年は、低得点作品も少なく平均レベルは高いが、
高得点作品も少ない、という結論を得ました。

このことは、昨今危惧されているエロゲの閉鎖的な感じを反映しているようでもあります。

平均レベルが上がることはいいことなのですが、
印象的な作品に出会いにくくなっていることは寂しいことです。

今後どうなるかはわかりませんが、なんとか盛り上がって欲しいものです。
by tsubame30 | 2012-12-02 22:00 | エロゲ解析

by tsubame30