ロト6などの数字選択式宝くじを統計的に予測することの是非について、いろいろ考えさせられます。
まず、出現回を予測する手法。
線形分析や回帰分析、そして当サイトの灰色分析など、手法はさまざまにありますが、パラメータの数を増やすと、概ね確率の理論値に近づくため、各回毎の変化に乏しいという傾向にあります。
これは、抽選各回でロト6の場合で43個の数字のうち6個しか選出されない為、次回予測に影響を与える要素が全体の約7分の1程度にしかならない為です。その他の7分の6については、前回からの引き続きの予想、ということになります。
これでは、いつまでも上位候補のまま当たらずに取り残される数字が出てきて、来る来るといわれつつ、なかなか来ない地震予測のような感じになる可能性があります。本来、予測とはそういうものなのでしょうが。実際、いつかは来るんですしw
予測に変化を与え、より当選確率を高める方法をいろいろ検討しています。
予測に影響を与える要素として考えられるものに、次のようなものがあるでしょうか。
1.抽選会の司会者・立会人
2.会場
3.季節・温度・湿度
4.球のセット
反対に、統計的予測になんの影響もないものに、次のようなものがあります。
5.出目数字の関連と傾向(1と2は一緒に選ばれやすい、など)
6.総売上金額
7.キャリーの有無
微妙なものには
8.過去の合計選出回数
9.抽選会の回数と出目数字の関連
10.各数字の当選間隔
まずは1番から検証してみます。
「1.抽選会の司会者(立会人)」ですが、夢ロト君へのボールのセットなど、意図的に抽選結果に影響を与えるとしたら、この人達を置いて他にはいないでしょう。
「2.会場」により電源周波数や電圧などが変わる可能性があり、また、「3.季節・温度・湿度」などにより、球の攪拌条件などが影響を受ける可能性はありそうです。
「4.球のセット」も、出目傾向への影響は考えられそうな気がします。(微妙に重量が違うとか、傷、ヘコミ、磨耗の具合が異なる、など)。場合によっては、直前のリハーサルによって夢ロト君内部の静電気の帯電状況とかの影響もあるかもしれません。妄想かもしれませんが。
但しこれらは、ロト6発売時間中には分からないことだらけで、事前に分かるのは会場だけです。(司会や立会いぐらいは分かるかもしれませんが、どんな立ち居振る舞いをするかまでは分かりません)。
「5.出目数字の関連と傾向」、これは球に磁石でも入ってない限り、統計的に意味の無い要素でしょう。仮に「1が出た後は、次回に2が出やすい」などの仮説があったとしても、統計的に有意な要素として考えにくいものです。
「6.総売上金額」「7.キャリーの有無」は論外。
「8.過去の合計選出回数」については、次回の確率への影響は皆無なのですが、数万回、数億回の試行で確率の理論値に近づくことを考えると、一時的には偏りのある時期があっても不思議ではありません。
「9.抽選会の回数と出目数字の関連」は、例えばですが「10の倍数回には数字の1が出やすい」という仮説があったとしますが、回数と数字の関連性を見つける、ということは、統計的な関数の解に近いものを見つけ出す、つまり「規則」を見つけることだと思います。ある意味、統計的な分析そのものかも知れません。
「10.各数字の当選回数と当選間隔」これが現時点で傾向分析で有意に活用出来そうな、ほぼ唯一の要素です。
ここで、予測にダイナミックな変化を与える方法についてもう少し考えて見ます。
先ほど、当選回ごとに変化する数字は約7分の1だという話を書きました。それは、当選した数字について、再計算がなされるからなのです。と、いうことは、逆に考えれば、選ばれなかった数字について予測することが出来れば、毎回37個、約7分の6の数字について次回予測に変化を与えられそうです。
ということで、次回は出来るだけ多くの要素を組み込み、且つ「選ばれない数字」を予測することで、当選確率を上げるシステムについて検討していきたい、と思います。