ブログトップ

今日から始めるゲーム統計学

tsubame30.exblog.jp

かつては麻雀およびエロゲのデータを統計解析して遊んでました。今では日本酒に夢中です。

【統計・プログラム雑談】「統計」という考え方との出会い

統計という考え方に一番最初に出会ったのは、大学での分析化学実験でした。


中学・高校の理科や化学で、『中和滴定』ってやったの覚えてないですか?
濃度がわからない塩酸に、濃度が分かる水酸化ナトリウム加えていって中和させて、
塩酸の濃度調べるっていうあれ。

統計ブログなんか運営してますが、私の本業は化学だったりしまして、
高校でもやった滴定を、大学で改めて授業でやることになりました。
そこで習ったのが、統計の「信頼区間」の考え方。

先ほどの例だと「水酸化ナトリウムを加えた量」が肝なわけですが、
じゃあその測定、本当に正確なんですか? という話。

濃度決定という意図を考えれば、1滴2滴の差は決して小さくない。
そして、適した器具を使うとはいえ、結局は人の仕事。あまつさえ学生。
誤差が出ないわけがありません。

レポートには、ミニマム5回は測定して、その平均、標準偏差を出し、
場合によっては外れ値を棄却して、改めて平均、標準偏差を出し、
その値を用いて、95%信頼区間に相当する濃度を求めて提出することになりました。

その時はちゃんとした考え方は全く分かってませんでした。
計算式は教科書に与えられていたので、
完全にマニュアル化した作業としてデータ処理をこなしてました。


単位が出てからはすっかり頭から抜け落ちていたその分析実験の経験が再び呼び起されたのは、
研究室配属されてひとつのテーマを任されるようになった時でした。

測定結果をボスに持って行ったときにボスから言われたある言葉。
実験系の理系学生にはおそらく頻出であろう、この言葉。

「再現性は取れてるの?」


自身の知識やスキルのなさ、それ以前の拙さもろもろを棚に上げて、
それを言われた時の正直な気持ちを書きますと、
「再現性ってどうやって取るのよ。そんなことできるわけねーじゃん」でした。

あまり詳しくは書けませんが、当時私がやっていた測定に影響する要素なんていくらでもありました。
温度、湿度、物質Aの濃度・純度、物質Bの濃度・純度、その他その他。
それら全てを一致させるなんて、とてもじゃないですができるわけありません。

同期に「再現性ってどうやってとるものなの?」と相談したところ、
「もう1回同じ実験やって、だいたい同じだったらだいたいとれてるでしょ」とのこと。
正直な感想は、「ああ、そんなんでいいんだ」でした。
確かに『再現』性ではありますが、それにしたって恣意的じゃないのかなぁと思うところもあったりなかったり。


ここまできて、あるひとつのことを「正しい」ということがいかに難しいかということを今更ながらに実感しました。
完全に手順化された実験ですら結果はバラつきます。
あるひとつの結果の「正しさ」を担保することは想像以上に難しいことを思い知りました。






そのこととは時を同じくしつつも全く別の話。

僕が統計に興味を持ったきっかけは、麻雀の実況動画でした。
ニコニコ動画で実況動画を山盛りうpしていらっしゃる、ぐっさんという方の実況動画です。
(最近はお忙しいのかめっきり更新がなくなりさびしい限りです。)



大学のサークルの仲間内で頻繁に麻雀を打っていた私が、
ネット麻雀に興味を持ち、天鳳にハマり、雀力向上を志すのは自然の流れでした。
同じく天鳳にハマっていた友人と段位の競争をする日々の中、
その友人に紹介されたのがぐっさんの動画でした。

ぐっさんは数学畑の統計屋さんで、統計的数理的視点をもって麻雀の正着研究しておられる方です。
動画は、打牌意図を解説しながら麻雀を打つという、これ以上に参考になるものもない形式でした。
統計を土台にした打牌解説の「もっともらしさ」に好感を覚え、アーカイブを辿る日々が始まりました。



麻雀の打牌は人によってさまざまです。
しまいには、打牌意図から打牌根拠までがさまざまです。
しかも、語られる打牌根拠は省略されている場合があります。

 「この手は押し。(受け入れが一番多くなる)Aを切る」
 「(放銃しても安いから)この手は押し。Aを切る」
 「この手は押し。(打点がマックスになる)Bを切る」

 「(テンパイだけどこの牌は通らないから)この手はオリ。Xを切る」
 「(放銃が致命的な点数状況だから)この手はオリ。Yを切る」
 「(なんとなく)この手はオリ。Yを切る」

早い話が、誰が正しいことを言ってるのかさっぱりわかりません。


加えて言えば、()内の打牌根拠が本当に正しいかというと簡単にはわかりません。
本当に「放銃しても安い」のか。「この牌は通らない」のか。
何をもってそう判断したのか、そもそもその判断は正しいのかが非常に評価が難しい。

なぜそうなるのかというと、麻雀が不完全情報ゲーム(相手の手牌の情報が完全でない)だからです。
将棋や囲碁のように、自分と相手の状況が完全公開されていないゲームなので、
同状況同打牌でも、8000放銃でトップ転落したり、1000点放銃でトップキープしたり、アガってトップ確定したりと結果がばらつきます。しかも劇的に。


更に言うなら、()内の打牌根拠の判断が正しかったとしても、
その話を聞いて私がその判断が行えるかというと、そう簡単にはいきません。

先ほどの例を挙げれば、「この牌は通らない」ことが本当に正しかったとして、
今後の実戦において、「通らない牌を探っていけるか」というと非常に難しいという話です。





そんな何が正しいかわからない中、統計をベースにした打牌解説は(少なくとも、動画で流れてくる
「そんなわけねぇだろww」的なコメントなんかよりはよっぽど)説得力がありましたし、
加えて、統計を土台にするその戦術は、セオリーレベルまで落とせるものも少なくなく、比較的私にも容易に使えるものでした。





同じことをやっても結果がずれてしまうという意味では、共通項を持ってしまった本業と趣味。
そんな合わせ技で、「わからないなりにもっともらしいものを見つけようとする」統計という考え方が好きになって、今では拙い知識ながらこんなブログを運営しております。


万が一にも勘違いされたくはないので一応但し書きをしますと、
個人が何を言おうが意味などない、統計が全てだ、などとは全く思っておりません。
個人の意見は貴重ですし、「正しい」ことが全てだとも思ってないです。



ただ、「正しい」ことを担保するのは想像以上に難しいから、
あやふやなものに振り回されずに、ちゃんと精査できるようになりたいと思っています。
あと、単純に面白いじゃないですか。数数えて、グラフ作って、いろいろ想像するの。

私が統計を好きな理由は、だいたいこんな感じです。






本当はこんな文章を書いている場合じゃないのですが、
ちょっとした現実逃避に、このブログ設立のきっかけでも書き記してみました。
リアルがしっちゃかめっちゃかでブログも固まってますが、もう少し固まってると思います。
[PR]
by tsubame30 | 2013-01-23 17:51 | 統計・プログラム雑談 | Comments(0)