ブログトップ

今日から始めるゲーム統計学

tsubame30.exblog.jp

かつては麻雀およびエロゲのデータを統計解析して遊んでました。今では日本酒に夢中です。


おくさんのブログの記念企画の記事を読み、その得体の知れなさ故に興味を持ち、怖いもの見たさで購入してしまった「やきにくくりぷうぴ」というミラクルクソゲー。


「こんなゲームが世に存在してよかですか」(C)ゲームセンターCX


クソゲーでもクソゲーなりの瞬発力がある。
そんなことを期待してのことでしたが、正直舐めてました。
面白くない。非常に面白くない。
面白くなさの純度が高すぎました。


二番煎じとはいえせっかく買った(¥840の新品)のでネタにしないのも勿体ない。
そこで、あらゆる面白さを削ぎ落としてある本作品を反面教師に、
エロゲーの面白さがどこにあるかを考えてみたいと思います。


グラフィック、声、システムやインターフェース面は、
まあ、いろいろ指摘したいところもありますが(キリがないので)割愛して
物語とかストーリーに絞って書きます。




1、意志がない(行動の根拠)
登場人物に○○のために××をしよう、という流れがなく、あらゆる行動が場当たり的です。
プレイヤーとしては本当に眺めているだけになってしまいます。


2、感情がない(意志の根拠)
競合の猛威にも唐突なエロシーンにも微動だにしない登場人物の鋼のようなメンタルは、あらゆるシーンを淡白にします。
プレイヤーとしては本当に眺めているだけになってしまいます。


3、脈絡がない(展開の根拠)
「お父さん」や「睡眠薬」を始め、思いつきのような設定や行動が多すぎます。
プレイヤーとしては本当に眺めているだけになってしまいます。


「やきにく」のダメな部分をさっと列挙しました。
もう正直ちゃんと考えるのもキツイのでこのあたりにしておきますが、だいたいこんな感じでした。


あるゲームシナリオのハウツー本には、
「物語は事件でなく、人の内面」と書いてあります。
読んだ時は、ふむふむなるほどと納得したのですが、今回の件でこの言葉にかなり実感が伴った感覚があります。
「やきにく」の登場人物には「内面」がないのです。
(※加えて言えば事件もないのでもう救いようがないです)


「正直面白くなかった」と思った過去のゲームでも、
意志、行動、展開の根拠(1~3)は存在します。
その上で、
「感情(2)に説得力がない」だとか
「感情(2)に対して行動(1)が伴ってない」だとか
「展開(3)に無理がある」だとか、
1~3の繋げ方で物語を評価してるのではないかと思います。
(自覚的にやっているわけではないですが、多分こうなんじゃないかと)。
さらにその上で、
「展開が好みでない」「キャラがハマらない」「なんがガツンとこない」とか
フィーリングや好き嫌いの部分で「イマイチ」という結論に到達します。


しかし「やきにく」は、そんな感覚の土俵にすら立ててない。
なにしろ1~3がそもそもから示されてないのです。
だから、フィーリング評価どころか、1~3の接続にすらツッコミが入れられない。
もう凄まじいまでになにもない。
これはもはや物語と呼んでいいのか……。



ゲームの評価というものは非常に主観的で感情的なものですけども、主観が左右される領域に到達するまでは、非常に客観的で理性的な選抜がかかっているのではないかと思います。

素材の力、それらの結合技術、そして味付け。
しかし、味付けや結合技術の評価の前に、まず素材の力がなければならない。
そうでなければそもそも作品として成立しない、と言っても過言ではない。


その意味では「やきにく」を批評することは非常に困難かもしれませんw。



「やきにくくりぷうぴ」は、物語の本質を考えさせられた作品となりました。
登場人物の内面が存在しないこの作品には、ダメな作品のダメたる理由が詰まっていると言えるでしょう。
皆さんは限りある時間を無駄にしないようにしてください。
[PR]
# by tsubame30 | 2013-02-02 01:10 | エロゲ雑談 | Comments(0)
統計という考え方に一番最初に出会ったのは、大学での分析化学実験でした。


中学・高校の理科や化学で、『中和滴定』ってやったの覚えてないですか?
濃度がわからない塩酸に、濃度が分かる水酸化ナトリウム加えていって中和させて、
塩酸の濃度調べるっていうあれ。

統計ブログなんか運営してますが、私の本業は化学だったりしまして、
高校でもやった滴定を、大学で改めて授業でやることになりました。
そこで習ったのが、統計の「信頼区間」の考え方。

先ほどの例だと「水酸化ナトリウムを加えた量」が肝なわけですが、
じゃあその測定、本当に正確なんですか? という話。

濃度決定という意図を考えれば、1滴2滴の差は決して小さくない。
そして、適した器具を使うとはいえ、結局は人の仕事。あまつさえ学生。
誤差が出ないわけがありません。

レポートには、ミニマム5回は測定して、その平均、標準偏差を出し、
場合によっては外れ値を棄却して、改めて平均、標準偏差を出し、
その値を用いて、95%信頼区間に相当する濃度を求めて提出することになりました。

その時はちゃんとした考え方は全く分かってませんでした。
計算式は教科書に与えられていたので、
完全にマニュアル化した作業としてデータ処理をこなしてました。


単位が出てからはすっかり頭から抜け落ちていたその分析実験の経験が再び呼び起されたのは、
研究室配属されてひとつのテーマを任されるようになった時でした。

測定結果をボスに持って行ったときにボスから言われたある言葉。
実験系の理系学生にはおそらく頻出であろう、この言葉。

「再現性は取れてるの?」


自身の知識やスキルのなさ、それ以前の拙さもろもろを棚に上げて、
それを言われた時の正直な気持ちを書きますと、
「再現性ってどうやって取るのよ。そんなことできるわけねーじゃん」でした。

あまり詳しくは書けませんが、当時私がやっていた測定に影響する要素なんていくらでもありました。
温度、湿度、物質Aの濃度・純度、物質Bの濃度・純度、その他その他。
それら全てを一致させるなんて、とてもじゃないですができるわけありません。

同期に「再現性ってどうやってとるものなの?」と相談したところ、
「もう1回同じ実験やって、だいたい同じだったらだいたいとれてるでしょ」とのこと。
正直な感想は、「ああ、そんなんでいいんだ」でした。
確かに『再現』性ではありますが、それにしたって恣意的じゃないのかなぁと思うところもあったりなかったり。


ここまできて、あるひとつのことを「正しい」ということがいかに難しいかということを今更ながらに実感しました。
完全に手順化された実験ですら結果はバラつきます。
あるひとつの結果の「正しさ」を担保することは想像以上に難しいことを思い知りました。






そのこととは時を同じくしつつも全く別の話。

僕が統計に興味を持ったきっかけは、麻雀の実況動画でした。
ニコニコ動画で実況動画を山盛りうpしていらっしゃる、ぐっさんという方の実況動画です。
(最近はお忙しいのかめっきり更新がなくなりさびしい限りです。)



大学のサークルの仲間内で頻繁に麻雀を打っていた私が、
ネット麻雀に興味を持ち、天鳳にハマり、雀力向上を志すのは自然の流れでした。
同じく天鳳にハマっていた友人と段位の競争をする日々の中、
その友人に紹介されたのがぐっさんの動画でした。

ぐっさんは数学畑の統計屋さんで、統計的数理的視点をもって麻雀の正着研究しておられる方です。
動画は、打牌意図を解説しながら麻雀を打つという、これ以上に参考になるものもない形式でした。
統計を土台にした打牌解説の「もっともらしさ」に好感を覚え、アーカイブを辿る日々が始まりました。



麻雀の打牌は人によってさまざまです。
しまいには、打牌意図から打牌根拠までがさまざまです。
しかも、語られる打牌根拠は省略されている場合があります。

 「この手は押し。(受け入れが一番多くなる)Aを切る」
 「(放銃しても安いから)この手は押し。Aを切る」
 「この手は押し。(打点がマックスになる)Bを切る」

 「(テンパイだけどこの牌は通らないから)この手はオリ。Xを切る」
 「(放銃が致命的な点数状況だから)この手はオリ。Yを切る」
 「(なんとなく)この手はオリ。Yを切る」

早い話が、誰が正しいことを言ってるのかさっぱりわかりません。


加えて言えば、()内の打牌根拠が本当に正しいかというと簡単にはわかりません。
本当に「放銃しても安い」のか。「この牌は通らない」のか。
何をもってそう判断したのか、そもそもその判断は正しいのかが非常に評価が難しい。

なぜそうなるのかというと、麻雀が不完全情報ゲーム(相手の手牌の情報が完全でない)だからです。
将棋や囲碁のように、自分と相手の状況が完全公開されていないゲームなので、
同状況同打牌でも、8000放銃でトップ転落したり、1000点放銃でトップキープしたり、アガってトップ確定したりと結果がばらつきます。しかも劇的に。


更に言うなら、()内の打牌根拠の判断が正しかったとしても、
その話を聞いて私がその判断が行えるかというと、そう簡単にはいきません。

先ほどの例を挙げれば、「この牌は通らない」ことが本当に正しかったとして、
今後の実戦において、「通らない牌を探っていけるか」というと非常に難しいという話です。





そんな何が正しいかわからない中、統計をベースにした打牌解説は(少なくとも、動画で流れてくる
「そんなわけねぇだろww」的なコメントなんかよりはよっぽど)説得力がありましたし、
加えて、統計を土台にするその戦術は、セオリーレベルまで落とせるものも少なくなく、比較的私にも容易に使えるものでした。





同じことをやっても結果がずれてしまうという意味では、共通項を持ってしまった本業と趣味。
そんな合わせ技で、「わからないなりにもっともらしいものを見つけようとする」統計という考え方が好きになって、今では拙い知識ながらこんなブログを運営しております。


万が一にも勘違いされたくはないので一応但し書きをしますと、
個人が何を言おうが意味などない、統計が全てだ、などとは全く思っておりません。
個人の意見は貴重ですし、「正しい」ことが全てだとも思ってないです。



ただ、「正しい」ことを担保するのは想像以上に難しいから、
あやふやなものに振り回されずに、ちゃんと精査できるようになりたいと思っています。
あと、単純に面白いじゃないですか。数数えて、グラフ作って、いろいろ想像するの。

私が統計を好きな理由は、だいたいこんな感じです。






本当はこんな文章を書いている場合じゃないのですが、
ちょっとした現実逃避に、このブログ設立のきっかけでも書き記してみました。
リアルがしっちゃかめっちゃかでブログも固まってますが、もう少し固まってると思います。
[PR]
# by tsubame30 | 2013-01-23 17:51 | 統計・プログラム雑談 | Comments(0)
新年明けましておめでとうございます。
今年もよろしくお願いいたします。

解析記事はなかなかどうして時間がかかるので、
たまにこういう雑談記事も挟んでいくスタイルをやったりやらなかったりしようと思います。

今日のネタは、先日行われた天鳳チーム対抗戦の予選についてです。

予選はおなじみ連続5戦の収支で競うルールで行われました。
普段は段位戦という名のラス回避順位戦しか打たず、
しかも、新年はほとんど天鳳を打てず、多少心配ながら予選に臨んだのですが……

d0279358_11563064.png


+9.0、+50.5、+46.9、+47.1、+55.0 = +208.5!!
無限の可能性えええええ!!!!!!


チーム「ぬる特ファイブ」は、無事に予選突破できました!
これからもどうぞ応援してあげてください!




d0279358_11573678.jpg

段位戦しか打たないなりに収支戦にアジャストした打ち方を心がけました。
例えばこんな局面。

普段の段位戦だと、こういうテンパイはほとんど外さないのですが、
「素点は大事だ!」の意識のもと、テンパイ崩してホンイツ移行しました。

特に今回は、巡目も浅く、役役あって比較的容易にミニマム1300からマックス8000の打点上昇が見込めます。
打ってる時は『素点意識』で頭がいっぱいだったのですが、
改めて場面を見ると段位戦でもはずしていいのかなーと思いました。





d0279358_11581838.jpg

すごく悩んだこの局面。
南3局、超微差の2着目。
6400の3s単騎をダマっていたら、トビ寸のラス目(子)からリーチが入った状態。

直れば飛ばしトップ、そうでなかったとしてもアガればかなりトップ当確です。
しかし、4mを押した挙句3s単騎は、リーチが入ってしまった以上心もとなさすぎるというのはあります。
これは段位戦でも収支戦でも判断が微妙なところだと思います。いまだによくわかりません。

ただこの時頭でいっぱいだったのは、
「素点は大事だ!」「ここで8000振ってトップ率減らした挙句スコア-8はみすみす損だ!」
ということでした。
歯を食いしばって東トイツ落としてオリました。
この局は流局に終わりました。

最終的には100点差の2着のままオーラスに突入し、
トップ目が3確手に放銃しタナボタトップとなりました。
±2000点差は大事理論が生きましたね!





実は収支戦は「順位戦より考えることが少なくなる」のではないかなぁと思ってます。
正確には、「セオリーを壊す判断をしなければならないタイミングが少ない」と言うべきでしょうか

順位戦だと、平場でなくなれば通常の押し引き判断を使わない局面が出てきます。
アシスト、差し込み、極端なシボリ、配牌オリ、2シャンテンからのフルゼンツなどなど。
順位のために、点数を獲得する方法論のその一切が崩壊する瞬間があります。

一方収支戦だと、ラス目からでも、少ないなりに素点の維持のためにオーラスベタオリがあり得ます。
オーラス親のダントツトップでも、配牌オリではなくストレートに打点を叩きに行くようになります。
着順の寄与が大きい場面であっても、平場のそれに近い判断をしても大きく間違えないところがあるので、比較的打ってて楽だったりします。


個人的には、着順のために全てがひっくり返るあの瞬間が好きみたいなところがあるので、
順位戦の方が好みではあります。
ただ、今回久しぶりに収支戦を打って思ったのは、ここのところアシスト等に頼りすぎて、
素直な打ち方をないがしろにしすぎてた節があったかもかなぁと。

段位戦であったとしても、
打点上昇のためにテンパイを外したり、
オリれる愚形テンパイからはオリを選んでみたり
素点に素直な打ち方を取り入れてみるのもいいかもしれないなぁ
などと思いました。



続く本戦は1週間後です。
副将で当たるプレイヤーさんは、皆さん揃って安定段7.0を超えており、
サバ読んでも安定段6.0に届かない私は泡を吹いていますが、
ぬる特の無限の可能性魅せていきたいですね。
[PR]
# by tsubame30 | 2013-01-06 12:09 | 麻雀雑談 | Comments(3)
2ちゃんねるエロゲネタ&業界板では、毎年1月に『2chベストエロゲー投票』というものが行われています。

投票という形式は、点数で評価する場合よりも、個人の好き嫌いが大きく出るのではないかと思ってます。
手堅い80より尖った70が評価されやすくなる形式、とでも言えばいいのでしょうか。
「手堅さ」よりも「確変力(造語)」が試される、そのために小粒が浮かびやすい環境。
僕はそんな投票形式が好きで、この『ベストエロゲ投票』毎年楽しみにしています。

今回は、批評空間のデータを用いて、投票という形式で今年のゲームを評価した場合どうなるか?
ということをやってみました。

More
[PR]
# by tsubame30 | 2012-12-16 22:44 | エロゲ解析 | Comments(0)
ゲームの感想や点数は、本人の趣向、値段、プレイ時期、
贔屓にしているクリエイターもろもろの影響がもろにでるデータです。
要するに非常にばらつき、ホイっと異常値が出ます。
そのため、異常値の影響を受けやすい「平均値」はあまり信頼されず、
ErogameScapeでは「中央値」がゲームの評価を代表する値として多くの場合使用されています。

そんなわけで中央値を眺めるのですが、あまり知られていないゲームだと、
データ数が非常に少ないということがままあります。
この中央値、ホントに信頼できのかなぁと思った経験ありませんか?。

そんな訳で、今回は「データ数に対して中央値がどのくらい信頼できるか」を、
プログラムを用いたシミュレーションで検証してみました。
※今回は「統計解析」ではなく、「シミュレーション」なのですが、めんどいのでカテゴリはそのままです。

毎回毎回記事が長いので今回から追記を採用してみることにします。

More
[PR]
# by tsubame30 | 2012-12-09 20:35 | エロゲ解析 | Comments(6)