ブログトップ

今日から始めるゲーム統計学

tsubame30.exblog.jp

かつては麻雀およびエロゲのデータを統計解析して遊んでました。今では日本酒に夢中です。

先日、コアントローさんという方とツイッターを通じて、@でやり取りをたくさんさせていただきました。
色々面白いと思うところがあったので、ブログにまとめて見ようと思います。

https://twitter.com/kinako003/status/337996653875306497
↑発端となった僕のツイートと、コアントローさんの@のやりとり


ちょっと前に、「エロゲ業界の衰退」と銘打たれたminori代表のインタビューが話題になりました。
平均年収は300万円以下?! 衰退化が止まらない美少女ゲーム業界の現状


minori代表酒井氏によれば、昨今は短い時間で消費できるものが好まれる傾向にあり、エロゲの長さは時代の求めるボリューム感と相反するとのことです。
じゃあ短くすればいいじゃん、というのが素人発想としてあるのですが、そんなに単純な問題でもないようです。


>ならば安く、短めのものを作ればいいかといえば、そういったものは
>美少女ゲームの市場では軽く見られてしまいがちです。
>企画にかかる労力を考えると、短いものを安く短期間で作ることは
>制作上のストレスにもなります。


長くすると予算がかさむし、リスクも大きい。
短くすると軽くみられるし、企画の労力も増える。
実に八方塞がっています。
長さを調整する、以外の打開策は無いのでしょうか。


>それを避けるために、ライトノベルや漫画などは
>ひとつの作品を完結していなくともある程度たまったところで単行本として発刊し、
>コストを回収するのですが、美少女ゲームが同じことをすると“分割”と称され、
>避けられる傾向にあるようです。


ライトノベルや漫画では、当たり前に行われている「分割」。
なるほど、これは資金的には非常に有効な手段です。
しかし、同じことをやろうとすると、エロゲ界では敬遠されてしまう。
どうしてエロゲ界では分割が嫌われるのでしょうか。

それは、エロゲというものは「それ単体で完結している」という性質があるからだと思います。

「単体で完結している」
これは、さり気なく、他のメディアにない非常に特徴的な性質ではないでしょうか。
「完結している」ことが当たり前になっているから、完結していないと敬遠する。
そういうことであれば、自然な流れではあるでしょう。


個人的には「単体で完結してる」という特徴を消して欲しくはないなぁと思っています。
というより、「完結していないこと」が「ボリューム不足」より致命的になるイメージがあったので、
長さが問題になるなら人数削ったりプロット簡略化したりするほうが理想的じゃないのかなぁと。

しかし、勿論、理想的なだけで現実的ではありません。
企画コストの増大等の問題が消えるわけではない。


では、どのように対策すればいいのか。
そのひとつの解答として「分割商法を浸透させる」という方法があるのではないか

というのが今回のお話です。


分割は嫌われる、ということはあるのですが、
分割がまったくもって許されていないか、と言えばそんなこともありません。
例えば、一世を風靡した「WHITE ALBUM2」。
例えば、まさに先月フィナーレを迎えた「グリザイア」。
分割されていても受け入れられる場合もある。

今は分割作品で成功しているのは、ぽつぽつありながらも当然少数派。
「分割」をもっと抵抗なく普及させる方法はなにかないだろうか。

僕が考えたことは、
①作品向上という名目の分割  ②アペンド商法
の2つでした。


分割が受け入れられるための要素の1つとして、
「分割してること自体が、作品演出として機能している」ということが挙げられるのではないか。
例えば、「ひぐらしのなく頃に」なんかは、鬼隠し編、綿流し編……など○○編と分けることに意味が用意されていた。
そういう作品の質に絡んでくるような工夫があれば、分割という『負の遺産』は『作品の演出』として解釈され、抵抗感が薄まるのではないか、と。

前述のように、ノベルゲームプレイヤーは、「まとまった作品であって欲しい」という願望を「ゲーム」という媒介に託しているように感じます。ですから分割を嫌うのですが、逆にいえばこういった「作品向上」という名目があれば、分割自体は許されやすくなるように思います。


あるいは、アペンド商法という形。
最初に1作目で舞台等の設定を提供し、後から攻略キャラやプラグインなどを増やしていくという方法。
この方法、「カスタムメイド3D」や「真剣恋A」など、一部では似たようなことが既に行われています。
この例に挙げた二作では、第1作目からかなり力を入れていましたが、この第1作目の部分がコンパクトになれば投資リスクも抑えられ、うまいこと回りやすくなるのではないか。
なにより、1作目の段階でも「完結」の形をとれることが僕の中でとても大きい方法です。



僕がそんなことを妄想する中、コアントローさんが提案する分割の方法はもっとシンプルなものでした。
ズバリ、漫画やライトノベルと同じように、未完結な1作目をまず出してから反応を見て2作目以降の製作を考慮する、というものでした。
資金的なリスク管理という意味ではこれ以上ない方法ではあります。

しかし、そんなことをすればユーザーは黙っていないのではないか。
作品を途中で投げるようなことをすると不誠実だって感じになって心証がうんぬんなるのではないか、と直感的には思いました。

とはいえ、よくよく考えてみれば、面白くなかったゲームの続編が出ないことを嘆くプレイヤーも居ないのではないか、というのはあります。
いくらかは続編(完結)を望む者が居ても、「売れなかった」を理由にそれらは握りつぶされ、十分な結末が与えられないのは、連載漫画の世界では日常茶飯事です。

この方法、資金的リスク管理の面だけでなく企画の手数も増えるというメリットも大きい。
この業界、今のままの規模でやっていたら1回ポシャったときの被害額が甚大です。
しかし、ずっと毎回ヒット企画を打ち出すことは難しいでしょう。
どんな実績のある老舗メーカーでも、ずっと数をこなしていけば、1つや2つ不発も必ず出てきます。
この方法であれば、ポシャったものには手をかけず、うまく育ったものだけに傾注して育てていける。
また、その続く続かないの基準は売上げという民主主義的なパラメーターであり、ユーザーの意向を最大限に汲んだ方法と言えなくもない。
とても合理的な方法です。



問題なのはただ一点。この合理性をエロゲユーザーが受け入れることができるかどうか。


あくまで僕の中の主観的には、受け入れることが難しいことではあります。
「完結している」という特徴ゆえに、この業界に投資し続けているという部分が大きいからです。
そこが守られないのであれば、エロゲはほどほどに引退して、より手軽な漫画やラノベに流れていった可能性は非常に高い。
ただでさえ、ラノベの客層がエロゲの客層に似てきているという現状、「完結」という特徴は堅持してほしいし、逆に堅持しないと保たないのではないか。


しかし同時に、客観的には、やり方次第で目があるのでは、とも思っています。
「完結」していようがいまいが、すでに「PCノベルゲーム」というインターフェースからしてエロゲというものは独自性を確立しているという点はある。
ならば、漫画やラノベと同じ販売体制をとっても、そこまで人が流れ出ていかないのではないか。
むしろ価格が落ちることによって逆に人が入ってくるのではないか。
また、無駄なコストが減って余裕ができれば、クオリティが上がってくるのでは、という長期的なメリットも小さくない。



実際にやったらどう転ぶかは、なかなか予想がつかないことではあるのですが、
ともかく、分割商法には現状を打開する可能性があるということをコアントローさんのやりとりの中で認識しました。


コスト的な面を考えると、現状は不合理ではあります。
しかしエロゲーマーは、どこか同人的素質があるというか、不合理的なものを好むような側面もある気がします。現状これはこれで魅力はある。

しかし、それじゃ後が続かない。
うまく回す方法を模索しないことには、ますます衰退の一途をたどるでしょう。


なかなか繊細な問題ですが、10年後も20年後も、エロゲが楽しくプレイできる
世の中であればいいなぁ
と思いながら、今回はこのあたりで締めたいと思います。


(資金云々の前にまずは児ポ法か……。敵が多いなこの業界……。)
[PR]
# by tsubame30 | 2013-06-01 22:12 | エロゲ雑談 | Comments(2)
チートイツは、待ち枚数が一番少ない単騎待ちでのテンパイが確定している役なだけに、「待ち換えやオリを見据えてダマにすべきか」「リーチかけて押さえつけるべきか」の感覚判断がなかなか難しい役だったりします。

そんなチートイドラドラ。
北HAZさんという方がリーチ判断に関する統計を出してくださっています。
【牌譜解析】チートイドラドラはリーチ? : HAZの研究する人生

これは、鳳凰卓牌譜において「チートイツをテンパイした場面」を抜き出し、「リーチをした場合」「リーチをしなかった場合」のそれぞれについての局収支を出し、それらの平均を比べたものです。

北HAZさんの統計によれば、「チートイドラドラはリーチした方が局収支がよくなる」という結果が得られています。この統計をソースにした、チートイドラドラはリーチした方がいいんだ、という言説が多く見られます。

しかし、一方で、「こういった統計から、正着判断できるかどうかはわからないんじゃないの」という指摘があります。麻雀AIの研究をされているkmo2さんは、ブログにてこのような記事を書かれています。

統計的手法の問題点: マッタリプログラミング日誌

>そもそも、鳳凰民というのは相当にレベルの高い集団であり、
>立直して不利ならば、立直なんてしないわけです。
>実際に立直したデータには、それだけ立直した方が有利である状況のデータばかりが
>そろっているわけです。


「優秀なプレイヤーが、リーチの方が良いだろうと判断した局面」だけ抜粋してるんだから、優秀な結果(局収支が上回ってる)が出ること自体は当然なんじゃないの?というのが、kmo2さんの意見です。



例えば、「どこの会社の車が好きですか?」というアンケートをとり、その統計をとったとして、A社という回答が一番多かった、という結果を得たとします。
これだけ見ると、A社が多くの車のブランドの中で一番人気であるかのように思えます。

しかし、これが「A社の営業所、ディーラーでとったアンケート」だったとしたらどうでしょうか?
そりゃあ、A社が好きな人多いに決まってるじゃん、って思いますよね?
そんな統計であれば、結果からA社が一番人気である、なんてことは当然判断できません。

統計において最も重要なことの1つは、「母集団のランダム化」です。
この場合は、アンケートをとる対象を可能な限りランダムにすることが必要であるということです。
そうすることによって得られた統計は、十分な意味を持つでしょう。

kmo2さんの指摘は、これと同じことで、「リーチをした場合」というサンプリングの段階で、既に「リーチが優秀になる局面」が多く選択されているはずだろう。これで局収支が大きくならないはずがない。ということです。



また、ランダム化がされていないと「因果関係の方向」がわからない、という問題も隠れています。

ただいま僕のTLでは「児ポ法」の話で盛り上がっていますが、
例えば、性犯罪を犯した者とそうでない者という条件で「性処理目的で児童ポルノを所持しているかどうか」
をそれぞれ数えて調べたとして、性犯罪を犯した者の方がポルノ所持率が高かったとします。
これだけ見ると、児童ポルノが性犯罪をほう助してるんだ! 規制だ! 規制! となりそうですが、
じゃあ、児童ポルノ規制したら性犯罪減るのか、っていうとこれだけではなんにもわかりません。


なぜなら、児童ポルノ所持うんぬんとは全く違う「性的暴力性」みたいなものが先にあって、だからこそ性犯罪を犯し、その発散先として児童ポルノを所持していた、という因果関係の方向も考えられるからです。
もし、こっちの因果関係の方が正しかった場合、規制したところで性犯罪は減らないどころか、性犯罪を減らすために行った規制によって発散先を失い、却って性犯罪が増えるなんていう展開になる可能性まで出てきます。

このように、因果関係の方向まではわからない。
これをちゃんと調べようと思ったら、他の条件はまったく同じだけど、「児童ポルノの所持」だけが異なっている
(「性的暴力性」などの他の要因の程度がランダムである)集団同士を比べる必要が出てくる。



先ほどのリーチ判断の例で言えば、もしかしたら
「局収支が高い(低い)ような手だったから鳳凰民がリーチ(ダマに)することが多かった」のかもしれないわけですよ。
因果関係の方向が逆の場合だって成り立ってしまう。
そして、この結論がなにか正着戦術に使えるかというと……難しいですよね。



このkmo2さんのブログ記事に対して、北HAZさんはこんなコメントをなさっています。

>的確にリーチ判断なされているならば、ダマにする時もこっちが有利だという的確な判断がなされていて、
>その結果の優劣というのは収支または和了率、放銃率、ひいては最終着順などに必ず影響が出ると思っています。



「リーチをした場合」というサンプリングの段階で、既に「リーチが優秀になる局面」が多く選択されている
のはそうなんですが、「ダマをした場合」は、既に「ダマが優秀になる局面」が多く選択されているはずなので、
結果的に「リーチ」と「ダマ」の比較はできるのではないか、というのが北HAZさんの意見です。
『鳳凰民がこっちの方が良さそうだと思って選択した』という点ではリーチもダマも同じで、
結果的に母集団は揃っている、ちゃんとランダム化されているのではないか
、ということです。



正直申しまして、母集団のランダム化がされているのかどうかという点は、僕には判断できません。
統計において、ランダムサンプリングされているかっていうのはものすごく重要なことなのに、
リーチ・ダマにした判断以外の部分がどのくらい揃っているかどうかなんてわからない。



もうすでにランダム化されているかもしれませんが、もしそうでなかったときにどうすればいいのか。
どうすればランダムになるのか。麻雀という同じ局面が訪れないゲームにおいて、どのように場面を揃えればいいか。

ここからは、僕の妄想が入ってくるので話半分でお願いします。
どれくらい正しいこと言えているか自信ないです。




その方法の1つは、「局収支に影響しそうな他のデータも同時に追跡する」です。
例えば、「アガリ牌の見た目の残り枚数」「待ち」「ドラの位置」「巡目」など、
局収支に影響しそうな他の要素も追跡してあげて、
少なくとも追跡した要素に関しては揃えて比較を行う、という方法です。
一個一個やると死ぬほどめんどくさそうなので、重回帰分析的にやれないかなぁという妄想はあります。
(結果変数が連続値、離散値のどちらにすべきかすら、僕には判断できないのですが……)


もう1つの驚きの方法。それは「技能戦の牌譜を解析する」です。

技能戦は、すべてが平場です。少なくとも、点数状況という条件は全て完璧に揃っています。
また、打ち手のレベルも二段以上と多様です。誤打になるリーチも増えるでしょう。
(誤打になるダマも、誤打になる脇の放銃も増えるでしょうが)
もしかしたらこういう環境の方が、統計を使って正着戦術を考える上ではいいのかもしれない。

過疎ってて、固定メンツが打っててランダム化されてない、だとか、統計するサンプル数自体が足りないだとか、そういうリアルなツッコミもきそうですし実際その通りです。

ただ、技能戦という過疎卓を無理やり使うことまでしなくても、
「特卓、上卓の牌譜で同じことをやる」っていうのは参考になるんじゃないか、とは思います。
むしろ「3卓全部均等に混ぜる」方がよかったりするのかもしれない。

実力レベルを全部攪拌してしまった方が、統計正着を知る上ではいいのかもしれません。
どのような比で混ぜるくらいが丁度いいのか、とかは難しいのですが、
プレイヤーの実力をランダムにする、という考え方はそこまで的を外していないのでは、と思います。




というわけで、こんな感じの話でした。
ここ最近、ツイッターで@が飛んでいるのが見えたので、触発されて書きました。


誤読しないで頂きたいのは、「チートイドラドラはダマ正着だ」って言ってるわけではないです。
この方法ではどっちが正解かわからない、っていうことです。

こんな背景があるので、麻雀解析に関しても色々やろうと思っていたのですが、
どうアプローチしたものか途方に暮れている状況です。





参考文献:「統計学が最強の学問である」(西内啓)
[PR]
# by tsubame30 | 2013-05-29 23:01 | 統計・プログラム雑談 | Comments(0)
関連:【エロゲ解析】ErogameScapeにおける「80点」の価値


以前おこなった、解析では、
「70点」「75点」「80点」「85点」というErogameScapeにおける最頻の4点についてのみ、
どのくらいの価値があるのかということを上位%という形で評価をしました
が、
せっかくなので、0~100点の全範囲(5点刻み)について同じことをやってみました。

データ元のSQLおよび計算方法は、以前のものと同様です。


●各点の偏差値(平均および90%信頼区間)
d0279358_19251590.png

<※追記>
以前のグラフと色の対応がめちゃめちゃだったので差し替えました。



偏差値の平均を見ますと、もう見事なまでに直線ですね。



●各点の上位%(平均および90%信頼区間)
d0279358_19253714.png

<※追記>
以前のグラフと色の対応がめちゃめちゃだったので差し替えました。



平均に注目すると、45点の段階でもう上位100%近似できるところまで来てしまいました。
(※35点と書いていましたが、45点の方が適切だと判断を改めました)
0点も、45点も、上位%という観点ではあまり差が無さそうです。
しかし当然ながら、信頼区間の上限は点数に応じて下がっており、
全く点数に担保がないわけでもありません。

45点からは少しずつ点数差が価値を持っていき、
60点を超えたあたりから、5点上がるごとの上位%の上昇幅が物凄い勢いで大きくなってます。
「65点より少し上」あたりに上位80%ポイント(100本中80位)がありますが、
わずか25点上の「90点」は上位10%ポイント(100本中10位)のところまで到達しています。



信頼区間の上下幅に注目すると、「70点」「75点」のあたりが最も大きく、
ユーザーの感覚の違いによる価値の変化が最も大きい範囲であると考えられます。

「70点」「75点」あたりは、『良い』としてるひとも『良くない』としてる人もそれぞれそこそこ多い、ということで、
参考にする際には、どういった意図で付いた点数なのかを考えたいところです。



信頼区間の下限に注目すると、80→85点、85点→90点の遷移の際に大きく上昇しており、
85~90点はある程度質の担保を認めてつけられていると考えられます。
特に、「90点」は信頼区間の下限ですら50%ポイントを超えています。
「90点」は本当にお気に入りのゲームが並ぶようです。



それで、この結果をどう参考にするかなんですけども、
80点の価値の記事にて、totoさんという方が非常に鋭いコメントを書いてくださってます。

>ユーザー心理としては、駄作は回避(=評価しない)するし、評価高いゲームはやってみようって気になるから、70点が100本中73位だとしても、実はそれほど悪い点じゃない気がする。

ご指摘の通り、この分布を作った元にしたデータからして、
駄作を積極的に回避(=評価しない)し、評価高いゲームを積極的にやった(=評価した)ことによって生まれたもの
ですから、
ここで使用している『上位%』は、「全てのエロゲ」という母集団での上位%という意味ではありません。
「その人が興味を持ったゲームという母集団」での『上位%』
になるので、
仮に73%だったとしても、そこまで酷いものではないものと思われます。


しかし、実際これを参考にして自分がゲームを選ぶにしても、
全く興味のないゲームは何点ついていてもやらないと思うので、
「自分が興味を持ったゲーム」という母集団と大きな差異はないと考えていいのではないかと思います。
その上で、そっくりそのまま得られた点数と上位%の関係を使っていいのではないかと思います。
自分が特別甘口or辛口の自覚があれば、それに応じて感覚で少しずらせば参考になるかなと。

上位何%からが「満足できるか」「クソゲーか」というのは完全に主観になりますけども……。
<追記>
例えば、「満足したゲームの数/今まで自分がやってきたゲーム全体の数」から、
『自分が満足する作品』の上位%のラインを考えてみると参考になるかもしれません。


totoさんのコメントの視点はかなり面白いと私は考えてまして、
なんで、35点にして既に上位100%なのか、
50%ポイントがなぜ75~80点の間という結構高い所にあるか、
そういったことの理由がこのあたりに隠れてる気がします。
普通は面白そうと思ったゲームしかやらないだけに、分布が上に偏ってこうなるのでしょうね。
そりゃあ点数と価値が線形にはならんよなぁ、などと改めて実感しました。
[PR]
# by tsubame30 | 2013-04-13 19:52 | エロゲ解析 | Comments(3)
先日、「反省しない」という考え方という記事を書きました。
この記事に対してOYOYOさんからコメントにて
「北家で安手の仕掛けを入れて、親の手番を増やすのは損ではないのか?」
という指摘を頂きました。

これに対するコメントレスを書いたところ、モーレツに長くなってしまったので、
記事として投稿することと致しました。

More
[PR]
# by tsubame30 | 2013-04-10 23:33 | 麻雀雑談 | Comments(0)
70点「なかなか面白かった」
80点「ちょっとイマイチだった」

こういうコメントと点数の差異に違和感を感じた経験はないでしょうか?


ErogameScapeにおいて各個人の点数というのは重要なパラメーターなのですが、
点数の付け方に共通の「決め」のようなものはなく、各個人が自由に採点しているものです。
そのため、「Good」の位置が85点なのか、80点なのか、70点なのかは本人にしかわかりません。
勿論、その点数をつけたユーザーのサマリーから全体の分布を見ればおおよそ察しはつくのですが、
それを毎回行うのも難しいところです。


そこで、今回はErogameScapeにおける「80点」って、実際問題どのくらいの価値をもつのか、ということを偏差値の考え方を使って考えてみたいと思います。

More
[PR]
# by tsubame30 | 2013-03-31 20:07 | エロゲ解析 | Comments(11)