ナンバーズ3を統計的に本気で攻略してみた結果

ナンバーズで大儲けするぞ!

ナンバーズという宝くじがあります。僕はこれで大儲けするぞと決意しました。不労所得でウハウハするために、統計的な分析をしてみました。

分析したのは「ナンバーズ3」です。購入者は000から999までの内で好きな番号を1つ決め、200円でその番号のくじを買い、当選番号と一致したくじには一定の方法で当選金の総額が決められ、同じ番号を買った人で分配されます。

賭け方もいろいろあります。今回は一番シンプルな「ストレート」という賭け方を分析しました。購入者が選んだ3桁の番号と当選番号の3桁の数字が、並び順まで含めて一致したら当たりです。

ナンバーズは分析しやすい

ナンバーズは分析しやすい宝くじだと思います。その理由は2つです。

1つは当選金額の配分方法でです。当選金額は、くじの販売総額の約45%が当選者に配分されると法律で決まっているのだそうです(参考 総務省資料)。当選番号の出現率は一定とすると、購入者があまり選択しないような番号に賭けることで、当選した場合に高めの当選金を得ることができます。ここに、分析の努力が実を結ぶ余地があります。

2つめは、データの入手の容易さです。当選番号の発表は月曜から金曜まで毎日行われていて、当選番号や当選金や当選した口数などのデータが公開されています。つまり、統計的な分析に耐えうる多くの実績データを、容易に入手できます。

今回扱ったデータは2007/1/4抽選の第1988回から2010/10/8抽選の第2960回までの973回分です。

当選しやすい数字は?

手始めに、当選番号に出現する数字にどれ位の偏りがあるかを調べました。

当選番号の数字0~9の出現頻度を集計すると以下の様になりました。

数字 0 1 2 3 4 5 6 7 8 9 合計
出現数 277 319 303 273 287 285 291 300 299 285 2919
出現率 9.5% 10.9% 10.4% 9.4% 9.8% 9.8% 10.0% 10.3% 10.2% 9.8% 100%

理論的な出現率は各数字10%です。「1」は出現率が10.9%で理論値よりも高め、「3」は出現率が9.4%で理論値より低めです。

当選番号は偶然で決まる

さて、出現率のこの偏りは偶然でしょうか、それとも偶然以外の原因があるのでしょうか。

この疑問を解く手段として統計的検定の「カイ2乗検定」があります。理論的には出現率がそれぞれ10%であるのに、表で示した程度の偏りが偶然に起こる確率を教えてくれる手法です。EXCELでは「CHITEST」という関数で標準装備されています。

計算の結果、表の程度の偏りが偶然で起こる確率は76.7%だとわかりました。統計的検定では多くの場合、偶然で起きる確率が5%以下なら「偶然じゃない理由があるかもしれないね」と考えるので、今回は「偶然の偏り具合だな」と判断できます。

念のために百の位だけ、十の位だけ、一の位だけ、という3種の集計方法で同様の検定を行いましたが、全て5%を上回り、偶然の域を出ませんでした(偶然で起こる確率は70.2%、12.1%、57.8%でした)。

出る数字が偶然で決まることがわかった、ということは、過去の当選番号の傾向から、次の当選番号は予想できない、ということです。

予想屋さんの番号は当たらない

巷には「次の当選番号はこれだ!」といった当選番号予想が溢れています。曰く、当選番号を決める「風車板」という道具にはゆがみがあって、出る番号に偏りがある、などの理屈を謳っています。

でも、各桁の数字の偏りは偶然と考えるべき、ということは前述の結果が示した通りです。

「次に当たるのはこの番号」などという情報を信じても、良いことは一つもないでしょう。

高額番号には特徴があるらしい

ここまでで、当選番号の出現頻度に偶然以外の理由を考える必要はないことがわかりました。どんな番号が当選するかは運次第なのだから、もし当たった場合に当選金が高額になりやすい番号(つまり、あまり人気がない番号)に賭けた方が有利です。

高額になるかならないかは偶然ではありません。そこで、高額になりやすい番号はどんな番号かを検討してみました。

ナンバーズ関連のサイトを見ると、いくつかの着眼点がわかりました。

・日付に読める番号

たとえば「312」は「3月12日」を縮めた番号ですし、「102」は「10月2日」と読めます。日付に読める番号は、何かの記念日に絡めて買う人が多い事から人気があり、当選金は安くなるらしいです。

・ぞろ目

たとえば「111」や「888」のような三連続のぞろ目(トリプルぞろ目)や、「922」や「373」のような同じ数が2回出てくるぞろ目(ダブルぞろ目)は当選金の傾向が少し異なるらしいです。

ダブルぞろ目については、今回の分析ではぞろ目の位置にも注目して、たとえば「922」は「×○○型ぞろ目」、「373」は「○×○型ぞろ目」、「440」は「○○×型ぞろ目」と3パターンに分けて分析しました。

・ゼロのぞろ目

データを眺めていると、たとえば「300」や「050」や「007」の様に、0がダブルのぞろ目になっている番号は当選金が高めになるようです。これらは前述のぞろ目の特別パターンとして分析しました。たとえば「300」は「百番番号」、「050」は「十番番号」、「007」は「一番番号」と名付けています。

高額番号の特徴の本当のところ

これらの特徴を念頭に、分析を進めます。

当選金額とその件数をグラフにしました。釣り鐘の裾を右に伸ばしたような形をしています。

当選金額の平均値は94,633円でした。販売金額の45%が当選金にまわるとした場合の理論的な当選額平均は90000円になるはずなので(200円÷1/1000×45%)、ほんの少しだけ高めです。

さて、当選番号を、当選金額が平均値以下だった番号と、平均値以上だった番号に分け、前述の着眼点別に2群の割合を集計してみたところ、使えそうな傾向が見つかりました。

・日付に読める番号

日付に読める番号について、当選金額が低くなる傾向がありました。並び替えると日付に読める番号でも当選金は低めでした。

・ぞろ目

トリプルぞろ目については目立った傾向が見られませんでしたが、ダブルのぞろ目は当選金が高めでした。

・ゼロのぞろ目

0がダブルの番号については、データ件数が少ないものの明らかに高額になりやすいようでした。

・数字の傾向

位別の数字については、「1」「2」「3」は総じて金額が低です。日付に読める番号に使われやすいからかも知れません。

「0」は総じて高いです。

以上の分析から、当選金が高額になりそうなのは「0を2個含み、1・2・3は含まない」番号のようです。

この番号が当たったらいくら?

ここまで来ると、「絞り込んだ内でどの番号が最も高くなりそうか」や、「当選したらいくらくらいになりそうか」も知りたくなってきます。

ヒントをくれる統計的分析として「カテゴリー変数を使った回帰分析」という手法があります(「数量化I類」とも言われます)。この手法を使うと、何かの特徴の有無や特徴の種類から目的の数値を予測することができます。EXCELでも分析ツールとして標準で搭載されています。ナンバーズ3に適用すると、適当な3桁の数値の当選金を予測できるかもしれません。

実際に分析を行った結果、実際の当選金額と予測金額との関係を図にすると以下のようになりました。

実績値では14万円以上の当選金がそこそこに発生しているのに対して、予測値は高くても13万円止まりになっているので、ちょうど楕円を潰したような形になっています。

予測の精度を示す数字に相関係数というものがあって、今回の分析ではr=0.52でした。予測としては良くありません。ここに書いていない方法を使って精度を上げようとしたのですが、僕の力では無理でした。

ともかく、仮に当たった場合の当選金が高くなる番号は絞り込むことができました。どの番号なのかは秘密にさせていただきますが(ごめんなさい)、0のぞろ目を含む番号で1・2・3は含んでいませんでした。この番号の当選金の予測値は122,541円です。

儲けられないことがわかりました

では、この番号に掛け続けたら儲かるのでしょうか。こういう場合、当たる確率と当たったときの金額を掛け合わせて、「この番号のくじを1回買うと理屈上ではいくら稼げるか」という当選金の「期待値」というものを計算します。

どの番号かに関わらず、当選確率は等しく千分の一です。見つけた番号の当選金は122,541円なので、1回当たりの当選金の期待値は約123円になります。これを200円出して買うのですから、買い続けるほど、1回当たり約77円の損をすることになります。買えば買うほど損です。

仮に、当たったときの予測当選金が200,000円以上の番号が見つけられたなら、その番号を買い続ければ少しずつ儲かるはずです。でも、実績として200,000円を超える当選金が出ていない中で、どんなことをしても、そんな都合の良い番号は見つからないでしょう。

一生懸命考えてわかったことは、ナンバーズ3でウハウハはできない、ということでした。数字で裏付けた結論なので、きっぱり諦めます。