記事更新日: 2018年07月23日, 26日, 27日, 08月01日, 4日
大数
だいすう
の
弱法則
じゃくほうそく
- What is weak law of large numbers?
裸眼でギャンブルの背後に巨大なピラミッドが見えたら お前は統計の世界に入門するだろうなんだぜ☆
- If you see the huge pyramid behind the gambling with the naked eye you will be going to the world of statistics ☆.
目次
- Table of contents.
1. コインを投げて、表が出るか裏が出るか☆
- Throwing a coin, whether the table comes out or the back side ☆.
1.5. 三叉路☆
- Three way☆.
2. 真ん中のグループから離れているやつは ひとあじ違うぜ☆
- He who is away from the middle group is different from others ☆.
3. 長いとか短いって何基準だぜ☆?
- What criteria is long or short ☆?
4. 確率を数えようぜ☆
- Let's count the probabilities ☆.
戻る - back
1. コインを投げて、表が出るか裏が出るか☆
- Throwing a coin, whether the table comes out or the back side ☆.
今、仕込み中……☆ まだ待てだぜ☆
ブゥーン☆
はい、はい! ピラミッドが見えたんだけど!
どこに☆?
ここよ!
どんな意味があんの?
知らないわよ!
じゃあ不正解だな☆ 部分点で 90点あげよう☆
多っ!
コインがあるとして……☆
X
エックス
というのは 表か裏がある ぐらいの意味で使うぜ☆
で、表を1、裏を0 としよう☆
X は 1 か 0 のどちらか片方だぜ☆ 両方一辺に出てくることはない☆
偏りなく出るとするぜ☆ 偏りがなくても、真ん中が無いんで どちらか片方が出るんだぜ☆
パスカルの三角形の見方なんだが、
左に行くか、右に行くか の 2通りがある、という意味だぜ☆
なんで 左と右なのか☆?
上でも下でもいい☆
コインを例に出したが、 さいころ も確率変数に当てはまるぜ☆
変数の名前は 被って困らない程度に 好きに付けろだぜ☆
アルファベットの X から使っていく例が多いが、 Dice の頭文字 D を使う習慣があるなら、使えばいい☆
コインなら 表と裏の2つ、
さいころなら 1, 2, 3, 4, 5, 6 の目をそのまま使えるな☆
コインと さいころ を 2回振ってみよう☆
2倍、 6倍 になるのが 思いつきやすい図だと思うが……☆
どう通ってきたかは関係ないと考えれば 増え方を 半分近くに 減らせるぜ☆
パスカルの三角形は、通りの数 を 数えるんだぜ☆
全ての通り方を 1回ずつ 通るんだぜ☆
青いコインの裏表で言うと、裏が3回出るのと、裏が2回出るのと、裏が1回でるのと、裏が出ない 4種類のゴールだな☆
さらに増やして 4回トライする場合、
目的地は -きりん、 -ぞう、 らいおん、 ぞう、 きりん の 5つに増えるが……☆
ここは数学っぽく、目的地の名前は 数字 0.0625、 0.25、 0.375、 0.25、 0.0625 にしようぜ☆
これで いろいろな計算式の中に 目的地を登場させることができる☆
ここで 通りの数 と 目的地の番号は 区別しろだぜ☆
通りの数 は全部で 16
way
ウェイ
あるな☆
目的地は 5つだぜ☆ プラスマイナスを気にしなければ 3つだぜ☆
的に向かって矢を投げて どこに当たりやすいかを
Probably
プロッブプリー
と呼ぶ☆
日本語では
確率
かくりつ
と呼ぶ☆
さっきの数字が、的の色に対応するぜ☆ プラスとマイナスの区別はつかなくなるぜ☆
ここで注意して欲しいのは……☆
Probably
プロッブプリー
は、中身を取っていく くじ、
Lottery
ロードリー
とは別物ということだぜ☆
日本語でも英語でも ダーツも、くじ も
確率
かくりつ
と呼ぶ☆
数学は 日本語でも英語でもないのね
表だけが出るとか、裏だけが出る という期待は どんどん小さくなっていく☆
6回トライすれば、4つ目の色が出てくるぜ☆
もちろん 数字も計算し直しだぜ☆
全体の中での 通りの数の割合 のことを慣習で
P( )
ピー
とか
Pr( )
ピー アール
と書き、
丸括弧の中は めんどくさいんで かわいいネズミでも描いて省略するが……☆
ギャー ネズミーッ!
…………☆
数学のいつものことで 別に P( ) じゃなくても F( ) でも A( ) でも何でもいい☆
例えば 0.3125 なら Pr(黄色ネズミ)☆
例えば 0.1875 なら Pr(青ネズミ)☆
例えば 0.46875 なら Pr(緑ネズミ)☆
例えば 0.3125 なら Pr(赤ネズミ)だぜ☆
このネズミが何なのかは、また今度だぜ☆
…………
戻る - back
1.5. 三叉路☆
- Three way☆.
なんで表と裏で2叉路のコインを例にしたのか☆ 絵柄が3つのスロットで 3叉路にしようぜ☆?
3叉路は 描くのが むずかしいんだよな……☆
VRなら 見やすいのかもしれないが……☆
ワラちゃん! 2叉路にしましょう、2叉路!
3叉路の線の引き方には 決まりがあるのかだぜ☆?
原点から遠い方に進む、というルールはあるが……☆
交差点は、通った X、y、z 軸 の数が同じになるぜ☆
方眼用紙とか、ジャングルジムを思い出せだぜ☆
それって 赤1、緑1、青1 というのは
x 1、 y 1、 z 1 の言い換えじゃないの?
いかにも☆
3次元は いい描き方はないものかだぜ☆
3叉路は 箱と同じだからな☆ 壁面は 2叉路 が貼り付いているのと同じだぜ☆
なんだ、3叉路 つまんないな☆
65点 減点な☆
パスカルのおっさんが言ってるのは 通った軸の数 ではなく、 通り方の数 だぜ☆
そんなの数えて 何が嬉しいの?
まあ数えてみようぜ☆
画用紙や 箱の
角
かど
から出発して、角から離れるように ふらふら 移動していたら
中心と言っていいぐらいの中心を通る、と 数の世界 は言っている☆
ただし、画用紙や 箱 は でかい とするぜ☆
そんなん、画用紙も 箱も 大きいんだから、
中心じゃないところだって 通るんじゃないの?
ピラミッドが見えていないようだな☆
さっきの 90点 は取り消しだぜ☆
えーっ!
パスカルの言い分を聞かせてくれだぜ☆
赤、緑、青と 誤差が少なくなるように バランスよく通っていると 中央に近づく☆
赤ばっか通っていたら 中央から離れる☆
色の棒の数が おんなじなら
いかなる組み合わせでも 中心を通る 対角線上にきてしまうけど……。
分散
ぶんさん
が 0 だな☆
バランスよく通るったって、赤、緑、青が 同じ数になるなんて
無理があるんじゃないの?
同じ数になれ、とは言ってない☆
極限というのは 端っこ ではなく、 限りなく 0 に近いが、0 ではないところだぜ☆
インチキよ インチキ!
なんで はっきりと 中心を通る、と言わないんだぜ☆?
腰抜けか☆?
極限って、まあ、0じゃないが、0 と考えていい☆
中心が極限と言われたら まあ、中心と考えていい☆
疑似科学よ 疑似科学!
永遠に 0 になることはないが、
永遠に 今日よりは明日が 0 に近づいているんだから、 中心と考えていいじゃないか☆
永遠に 0 にならないんだから、 0 じゃないのよ!
中心を通ると言ったり、近づくと言ったり、はっきりしろだぜ☆
べつに ぴったり 0 のど真ん中の中心を通ると言いたいわけではない☆
ちょっとずれてるぐらいの 中心のあたりを通るようになる、 と言っている☆ 説明しよう☆
ブゥーン☆
けっこう 端っこ に偏ってるんじゃないか☆?
ばっちり 端っこねぇ
でも まだ先には 山のすそ野が 広がっているんだぜ☆?
広がっているけど……
えーっと……、 ばっちり 端っこ にいるんだっけ☆?
端っこに いるわよ!
このまま降りていって 真ん中の方に 寄ってくんじゃないか☆?
真ん中に 寄ってこうなんて 思わないわよ!
思ってないけど、なんで 真下に降りてるのに 真ん中に寄るのよ!
なんで、真下に 降りていくだけなのに、 真ん中の方に 寄ってくんだろうな☆?
赤い車の運転手は 真ん中に 近づこう なんて、してないはずだぜ☆?
赤い車は 端っこに いたのに、
山がでかくなったせいで 真ん中にいるみたいに 見えてるだけなのよ!
大数
だいすう
の
弱法則
じゃくほうそく
☆
何それ! 腹立つ!
マイナス2千兆点よ!
山の高さを 十分大きくしたとき、
赤い車は 中心に近づく☆
自分は 現状維持をしているつもりでも、山は 大きくなるんだぜ☆
2つや 3つ 端に向かったつもりでも、山は 2倍 2倍 の速度で 広がっていくんだぜ☆
赤 1000011、緑 999980、青 1000234 の棒を持ってたら、 ほとんど真ん中の近くだぜ☆
100や200離れたって誤差だぜ☆
100や200近く 真ん中から ずれているのに 真ん中って言っていいの?
赤 1000000011、緑 999999980、青 1000000234 なら どうよ☆
こっから 10000や20000離れたって誤差だぜ☆
なんで バランスよく でかく なるの!
べつに……☆ 通りの数が多い方を 通ってしまうだけだぜ☆
100万回ぐらい 連続で 赤を通って見ろだぜ☆
赤 10000001000011、緑 9999999999980、青 10000000000234☆
100万も偏ったら だいぶ差が付いたんじゃないか☆?
そのあとも 人は通る☆
赤 10000000001000011、緑 9999999999999980、青 10000000000000234☆
なんで 数がそんなに大きくなるの?
トライ回数が積もってるだけだぜ☆
ほら、偏ってみろだぜ☆
夜も遅くなったので 続きはまだ今度な☆
戻る - back
2. 真ん中のグループから離れているやつは ひとあじ違うぜ☆
- He who is away from the middle group is different from others ☆.
せっかく描いた絵を 再利用しよ……☆
ブゥーン☆
経路を気にしなくていいなら、棒を数えるのは もっと簡単にできるのよ!
棒じゃなくて 道路な☆
(いらっ!)
ここで、横に1個ずれると 赤が1つ増えて 青が1つ減るが、
その差は 2 だぜ☆
将棋の歩を1枚取られると 相手の方が歩は2枚多くなるのと同じだな☆
あとは 繰り返しだぜ☆
まとめなくて いいのに……☆
差 は どうやって 視覚的に見るかと言うと……☆
差 が無いときを こう、足と足が同じ高さにあるような絵として……☆
はみ出た ところを 差 として数えることが できるな☆
引き算ですからね
だが わたしがオススメするのは 正方形 を描くことだぜ☆
この、 差を数える というのは あとで よく出てくるぜ☆
数えなくていいのに……☆
ちなみに分散はこうな☆
分散って何なのかしら?
Windows Paint ではタテ幅の限界なんで、手抜きで 正方形にしてみたぜ☆
分散は 0 だな☆
ワラちゃん、どこを数えてるの?
差を1辺にして 正方形を塗ってみよう……☆
分散は 2 だな☆
ワラちゃん、どこを数えてるの?
差を1辺にして 正方形を塗ってみよう……☆
分散は 8 だな☆
ワラちゃん、どこを数えてるの?
差を1辺にして 正方形を塗ってみよう……☆
分散は 18 だな☆
ワラちゃん、どこを数えてるの?
差を1辺にして 正方形を塗ってみよう……☆
分散は 200 だな☆
ワラちゃん、マス目の数ばっかり 数えていて合ってるの?
3叉路も やってみよ……☆
お父ん、赤が出っぱっているぜ☆
立方体にしてくれだぜ☆
注文が多いな……☆
赤から 余分なところを だいたい 取ってきて……☆
短い軸に 継ぎ足すと……☆
均
なら
したぜ☆
なんで 立方体を作ったの?
平均を取るという操作は、
原点という名のカーソルを 対角線のレールの上で ずらした、ぐらいに考えてくれだぜ☆
立方体とか、体積とかに用事はない☆
元の棒の長さは こうだから……☆
0×0×0 の下駄は もう要らないぜ☆
2×2×2 の高い下駄に 履きなおして……☆
下駄の上から 数えなおすと……☆
立方体との差は 4 かだぜ……☆
はみ出ている辺を使って 面積にしてみようぜ☆
分散は 6 かだぜ☆
なんで 立方体との差を 面積にして 数えてるの?
正方形や、立方体というのは すべての辺の長さが等しい 均等な形だぜ☆
すべての軸の長さが等しいことを 分散 0 として、
分散というのは はみ出ている軸の長さが でかいほど大きくなるぜ☆
出る杭を叩くのに向いた 昭和の人間が大好きな 計算だな☆
だから なんで面積を数えてんの?
じゃあ、立体空間があるとしよう☆
掛け算は プラスに マイナス を掛けると マイナスに☆、
マイナスに マイナス を掛けると プラスになることを 思い出せだぜ☆
虚数は今は考えるなだぜ☆
1 × 1 × 1 のこの水色の箱はプラスだぜ☆
-1 × 1 × 1 のこの桃色の箱はマイナスだぜ☆
この考えを推し進めていくと プラスの箱と マイナスの箱があることが分かるな☆
じゃあ 1 × 1 と、 -1 × -1 だけ使うようにすれば、
プラスの紙だけ 作ることができるぜ☆ これがメリット☆
だからなんで 面積 数えてんの?
相殺すると 0 になってしまうものも
面積を足すことにすれば 相殺せずに 違いを表現できるぜ☆
これが分散☆
小さくはみ出ている軸が たくさんあるより、
長~くはみ出ている軸を 見つけたいんだぜ、分散は☆
それが見つかるんなら どんな計算方法でもいい☆
分散は 差のあるものを 相殺しないようにしながら
突飛なやつを 探してんの?
まったく その通りだぜ☆
続きはまた今度な☆
続きだぜ☆
分散6 を正方形にしてみようぜ☆?
なんで 正方形 とか 立方体 にしたがんの?
ヨコ 2、 タテ 3 みたいに 2つの数で 1つの形になっているものを ベクトル と言う☆
ベクトルの別名で、1階のテンソル と言うこともある☆
2辺が 約2.4 みたいに 1つの数で 1つの形になっているものは スカラー と言う☆
スカラーの別名で、0階のテンソル と言うこともある☆
ヨコ とか タテ とかに興味なくて 量だけ知りたいときは
スカラー にしておくと、計算が楽にできるようになる☆
ちなみに この 約2.4 は
標準 偏差
ひょうじゅん へんさ
☆
標準偏差って 何なの?
分散は 突飛さ だろ☆ でも 2乗 したんで数がでかいだろ☆
2乗 したから、平方根 で サイズを戻したんだぜ☆
だから 標準偏差 は、突飛さの スカラー だぜ☆
似非科学よ、似非科学!
何にしろ 似非科学なら、 計算は早い方がいいだろ☆
あらゆる数は 判断材料に過ぎない☆ 科学とは ルールのある妄信だぜ☆
さっさと計算して、さっさと失敗するのが 科学だよな☆
濫用よ!
ほんとうの突飛さ ではなく、数学の言う 突飛さ の計算式は定義された☆
この 数学の言う 突飛さ をどう使うかは お好きなようにだぜ☆
まだまだ続くぜ☆
まとめると、標準偏差は このようになるぜ☆
まとめなくていいのに……☆
偏差5 とか、 標準偏差1σ って 何なのよ!
ちょっと待てだぜ☆ こういうのは一発で絵が見える……☆
描けたら そのうち見せる☆
つまり こういうことだろ☆
分かんないわよ!
3叉路 でもできるな☆ 偏差 と 標準偏差 は別ものだと分かるな☆
まとめなくていいのに……☆
標準偏差は 真ん中 だろ☆
3叉路にすると 真ん中がでかく見えるな……☆
数と 感覚を すり合わせて 比べてみろだぜ☆
長さが バラバラ なグループほど 1標準偏差 から大きい方へ離れるの?
突飛に長いやつがいるグループは 分散 が大きくなる☆
長さが バラバラ なら 細かく得点して 積もり積もっていく感じ☆
逆にフラットだと 何人集まっても 0点☆
真ん中のグループから 飛びぬけた個体があると 分散 が 大きくなるのね~
それと確率と 何の関係があるのよ!
続きはまた今度だぜ☆
戻る - back
3. 長いとか短いって何基準だぜ☆?
- What criteria is long or short ☆?
書いても、書いても終わらん……☆
書かなくていいのに……☆
家の中に 短い棒2本と 長い棒1本 があったとしよう☆
家の中の人からは、 2本のただの棒と、 1本の長い棒 と呼ばれている☆
とても長い棒よね~
すべての軸の平均を取った立方体……、絵を描くの めんどくさいんで描かないが、
母平均 μ は この線ぐらいだからな☆
乗り換えた下駄だな☆
短い棒が短いことより、長い棒が長いことの方が 目立つぜ☆
長い、短いの感覚は 棒の長さではなく
母平均との差を見ればいいんだな☆
じゃあ もし
母平均が 上の方にあったら
短い棒の方が 目立つの?
数学は 計算しやすいから そういう式にしているだけで 工学とも真実とも違う☆
数学の感覚と 人間の感覚は 別物だぜ☆
図を描いてみるといいだろう☆
短い棒が 気になるわよ!
これが印象操作だぜ☆
頭を破壊して 偏見を無くそうぜ☆?
確率にも、本当の確率とは別に、確率の印象が 大きく判断に影響する☆
例えば今 17 の節があるので、差を無くそうと思ったら
5, 10, 15, 20 ……、次は20だな☆
長さ 3 の節を 短い棒に継ぎ足せば 近づく☆
ちょっと足りないが……☆
母平均は 差を同じにする方に改善される☆
この残った差を 自然数で 完全に同じにしたかったら、
短い方に あと5本 継ぎ足せだぜ☆
何その同化教育
もっと簡単に 差を同じにする方法があるだろ☆
差を同じにしたぜ☆
同志きふわらべほふ!
あんたが最初に消えるのよ!
このように 昭和の偉人も 差を無くそうと 理性的に やっていたのかもしれないぜ、
自然数で☆
実数を使いなさいよ!
棒を継ぎ足したり、軸を消し飛ばす以外の方法で 母平均を動かすことはできるぜ☆
軸を1つ足して見ろだぜ☆ 節の長さは 1 だぜ☆
これで差は同じになった☆ 分散は 20 あるが……☆
差が無いって 言っていいの?
差は有るんだが、同じになった☆
差が同じになったら かえって 短い方も 長い方も
目立つようになったんじゃない!?
そんな主観は 判定できない……☆
まだまだ続くぜ☆
戻る - back
4. 確率を数えようぜ☆
- Let's count the probabilities ☆.
記事を整理中だぜ☆ このリンクに飛んできたやつは 上の記事でも読んでろだぜ☆
ひどい……☆
標準 偏差 σ
ひょうじゅん へんさ セグマー
は もう覚えたな☆
「シグマ」で漢字変換すれば σ は出てくるぜ☆
パスカルの三角形 に戻ろうぜ☆
右に行く道が 1つ、 左に行く道が 1つね
計算の仕方としては、 左の上の数と 右上の数を 足して間の下に入れろだぜ☆
20段目まで並べると こうなるが、 ところで さっき 標準偏差σ を計算したが……☆
20段目は 真ん中が無いんで もう1段☆
21段目に 数が こう対応づくぜ☆
対応づけて なんか意味あんの?
1
σ
セグマー
、 2
σ
セグマー
……☆
このときの 1、2、 という 数えやすい数は k と呼ぶことにしよう☆
プラス方向、マイナス方向は鏡面なんで、
プラス、マイナスを無視して まんなかで折り曲げてしまおうぜ☆
標準偏差 σ
ひょうじゅん へんさ セグマー
には 経路は関係ないんで、
数学100点、国語0点のやつと、 数学50点、国語50点のやつは
同じ
0 σ
ゼロ セグマー
グループな☆
数学100点、 国語100点 のやつと、
数学0点、 国語0点 のやつは
2 σ
に セグマー
グループな☆
きついグループだぜ☆
平均になってしまうやつ、平均から離れているやつ をグループ分けして おまとめ したぜ☆
2 σ
に セグマー
に全部入ってるの?
例は 自然数でやってるんで 端っこは 2σ でぴったりしているが、
端っこが 極限になってるやつとかは 無限に
σ
セグマー
は進んでいくな☆
だが ギャンブル マンが知りたいのは レア ケース の確率の方だろ☆
この表を 逆の見方をしろだぜ☆
2 σ
じゅう セグマー
の 当たりくじ なんて、
当たらないんじゃないの?
ピラミッドが 何段 高くなっても
2 σ
じゅう セグマー
なんか
やってられないよな☆
もし 底辺の横幅が 41 列のピラミッドで、 全ての 1208925819614629174706176 通り を通るのだったら、
2 σ
に セグマー
は、その中の 2通りだぜ☆
1秭2089垓2581京9614兆6291億7470万6176 人で 宝くじ を買いましょう
1等が
2 σ
に セグマー
以上に入っていて
その2枚の内 片方を引いたら 外れる 宝くじをか☆
コインが 40回連続で 表が出ればいいんだろ☆?
できそうな気がするよな☆?
できなさそうな 気がしなさいよ!
ここで 重要な計算式 を1つ 紹介しておこう☆
2σ 以上は 全体の 1/4 を超えることはないし、
3σ 以上は 全体の 1/9 を超えることはないし、
4σ 以上は 全体の 1/16 を超えることはないんだぜ☆
何それ?
この絵では 端っこが 2σ なんで おもしろくないんだが、
kσ の k が大きくなるほど 1/25、 1/36 と 通りの数 が減っていくんで、
大数の弱法則は 外側は必ず小さくなることが 約束されているんだぜ☆
なんでだぜ☆?
チェビシェフの言いたいことは また今度な☆
まだ続くぜ☆