Yamamotoの日記

Yale SOM MBA、金融工学、技術関係の記事を書きたいです

サッカーくじでお金儲け①

ギャンブル≒株式投資金融工学的な

古くはサンクトペテルブルクの賭けからBeat the Dealer、最近では競馬結果の予測ソフトウェアを使って丸儲けした人がいたりと、ギャンブルと統計学金融工学との結びつきはとても強いです。人の欲望が科学技術を発展させるいい例ですね。

Amazon CAPTCHA

www.nikkei.com

サッカーくじ

さて、日本には、Jリーグの結果を予測して賭ける「TOTO」なるものがあります。 こういうくじといい、パチンコといい、日本には賭博の機会が溢れているのになんでカジノはあかんねんと思うけど、なんか僕にはよくわからない大きな力が働いているんでしょうかね。 www.toto-dream.com

閑話休題

さて、このTOTO、当選結果やQiitaを見てると、パソコンを使って統計的に予測して賭けをしている人がいない雰囲気。つまり、裁定機会(=儲ける機会)がある匂いがするわけです。 僕の仮説では、以下2つが理由かと思っています。

  1. 試行回数が少なすぎて、最適な賭けをしても儲かるかわからない 13年以上やってるくじで、まだ1000回ちょっとではねえ。。。 toto公式サイト-ロト6、宝くじと並ぶ高額当せんくじBIG。目指せ最高6億円!

  2. サッカーの勝敗予測方法が確立されていない  セイバーメトリクスの書籍等には、サッカーのゲームをマルコフ連鎖でモデル化して勝率を出す論文が出てたりしますが、そのモデルは現実的に取れるデータに即してなさすぎてカリブレーションどうすんのよ、とか、そんなに同じ環境でデータなんか取れねーよ、とか、メタ的な、マクロ的な分析(攻撃の進化と防御の進歩が収束しているとか)はできても、個別の各試合の勝率を出す方法はあまり確立されていないように見受けられます。 【ご参考】サッカー データ革命 ロングボールは時代遅れか

Amazon CAPTCHA

てか、そんなこと研究するくらいなら試合に勝つ方法を研究した方が儲かるのでは。一流スポーツクラブにData Scientistとして就職したときの給料>スポーツくじでの儲けじゃないですかね。知らんけど。

(やっと)本題。データ集めて、勝率弾いて儲けようぜ。Pythonを使って。

上記の通り儲ける機会がありそうなので、データ集めて分析してみましょう。実は筆者、大学まで体育会サッカー部でバリバリサッカーやってまして、最後の1年はもはや監督的な立場にいたのでサッカーのデータ分析は好きなんです。そして最近Pythonを覚えまして。趣味でデータ分析やってみよかなと思ってます。10年くらいの間に1等の1億円弱(キャリーオーバーがあればさらに。。。!)が当たればいいなあー。。。

やること

  1. データ集め
  2. 予測モデル作成
  3. 自動売買ソフト作成

とりあえずデータ集めてみて、どんなデータが取れるのか探ってみます。次に、理想的な予測モデル、手に入るデータを元にした予測モデルをそれぞれ作って実装してみます。(1と2を行き来する感じですね) 最後に、それらの判断を元に自動売買するコードを書こうと想います。

最初の一歩

最初の一歩までが長い。。。複数のサイトを参考に、TOTOくじサイトから過去の結果を拾ってきてCSVに保存するコードを書きました。もう疲れて解説まで書く気になれないのでQiitaには投稿しません。 よかったら参考にしてください。

参考資料群

note.nkmk.me

qiita.com

python-remrin.hatenadiary.jp

環境

あんま関係ない気がしてますが、一応記載しておきます。