競馬の勝ち馬をAIが予測できるとしたら、みなさんはどう思うだろう。夢物語のように聞こえるかもしれない。だが、これはすでに現実にある研究テーマだ。全国の大学や研究機関が挑戦を続けるなか、津山高専=岡山県津山市沼=では回収率の向上をねらった取り組みが進んでいる。
モニターに並んでいたのは、全体成績や的中率・回収率のグラフ、月ごとの推移、さらに競馬場ごとの特徴を整理したレポート。津山高専総合理工学科情報システム系5年、大澤凜太朗さん(20)は、成績を確かめながら、どこが改善できるのか、さらなるシステムの向上を思案していた。テーマは競馬予測。重視しているのは「当てること」ではなく「増やすこと」――回収率だ。
指導する房冠深副教授の研究室で、大澤さんが掲げたテーマは「ディープラーニングに基づいたリターン最大化競馬予測モデルの提案」。過去の血統とレース結果を学習したAIが、各馬の「勝ちスコア」を0~1の数値で出し、そのスコアが最も高い馬に単勝100円ずつ賭けたと想定してシミュレーションする。
「競馬はブラッドスポーツと呼ばれるくらい血統がものをいう世界なのに、既存のAI予想は父馬・母馬の名前程度しか使っていない。血のつながりそのものを情報として扱えないか、と考えました」と大澤さんは話す。
用いたのは「グラフ畳み込みネットワーク(GCN)」だ。血統をネットワークとして表し、祖父母の代までさかのぼった関係を学習させる。ここで得た特徴と、距離、馬場状態、前走成績、馬体重の増減などの情報を多層パーセプトロン(MLP)【※複数の層を通して特徴を統合するAI】に入力し、最終的な勝利スコアを出す。
房副教授はこう説明する。「まずは 『どの馬が勝ちそうか』という確率を算出するのが第1段階です。大量のデータを蓄積し、そこにあるパターンを学習させて確率を出す。そこから、限られた予算の中でどう買えば回収率が高まるかを考えるのが次の課題です」。
勝つ確率を求めるモデルができれば、新しいデータが入っても同じ処理で確率を出せる。それがAIモデルだ。
データはJRAーVANから収集。一定期間のデータで学習させ、直近のレースをテストに使って性能を確かめる。評価指標は「的中率」と「回収率」。AIが「一番勝ちそうだ」と判断した馬だけを買い続けた場合、オッズ情報を使わない本命モデルは、的中率は2割前後ながら回収率は最大で150%を超えた。
印象的な一戦もある。あるレースで、16番人気の馬が1着になった。人間の感覚では買いづらい人気薄だったが、モデルは高いスコアを与えていた。「父方にサンデーサイレンスの3×4インブリード【※祖先が3代と4代で重なる血統配置】があり、母の父は同距離のG1勝ち馬。そうした血の塊をAIが拾ったのでは」と大澤さんは振り返る。
最近の改良モデルでは、的中率は約26%まで高めつつ、回収率は約150%。一度のドローダウンも全体資金の1~2%に抑えられるようになってきた。成績の推移を見ながら「どこを直せば伸びるのか」を考察する時間が、研究への大きなモチベーションになっているという。
大澤さんの競馬への興味の原点は意外なところにあった。中学時代、スマートフォン向けゲーム「ウマ娘」が大流行した。「そこから本物の競馬にのめり込みました」。好きな馬は平成のアイドルホース、 オグリキャップだ。
「高専に来たら、工学やサブカルが好きな同級生ばかりで居心地が良かった。授業で分からないところがあれば、先生が分かるまで教えてくれる。津山高専は、好きなことにとことん打ち込める場所です」と笑顔で話す。
今後は専攻科に進学し、研究を続ける予定。将来の夢はゲーム・IT業界で働くこと。
「競馬」 という一見ニッチな研究も、社会課題への応用が可能だ。膨大な情報から最適な組み合わせを見いだす技術は、医療資源の最適配分や金融ポートフォリオの構築などにもつながるとされている。
津山高専では、このほかにも、避難行動をシミュレーションして非常階段の混雑を解析する研究、水田を走る除草ロボット、脳科学とデータ分析を組み合わせた研究など、ユニークなテーマが並ぶ。
