LightGBM

長編連載

[儲からない競馬予想AI] Section 05-01 : LightGBMによる3位以内予測

「Section 02-01: rankが3位以内か当てるBinary Classification」の事前オッズを使う場合です。 特徴量として、前回(Chapter05: 事前オッズを使った予測)求めた事前オッズを追加するだけで、あとは同...
長編連載

[儲からない競馬予想AI] 閑話1 : 血統情報に意味があるのか

Chapter2では特徴量に血統情報として、馬のラベルを入れました。これについて、少し話をしたいと思います。 まず話したいことは「競馬において血統情報は重要である」ということです。これは、事実です。 現に、競馬はサラブレット競技であり、良い...
長編連載

[儲からない競馬予想AI] Section 02-05 : oddsを予想するRegression

オッズ(返還率)を予想してみて、利益を算出してみます。機械学習は、あるデータ集合に対して、平均的な予測線を出すという特徴があります。ということは、オッズを予想すれば、周囲のデータの平均値でもあるということです。 つまり、「予測オッズ > 実...
長編連載

[儲からない競馬予想AI] Section 02-04 : タイムを予測するRegression

タイム(走破時間)を予想してみて、利益を算出してみます。タイムは順位と違って、その馬の実力をより顕著に表す指標になります。タイムをRegressionで予想し、レース内のタイムが一番早い馬にベットする戦略を考えてみます。 学習過程はipyn...
長編連載

[儲からない競馬予想AI] Section 02-03 : rankを予想するRegression

rank(順位)を予想してみて、利益を算出してみます。順位データのほうが、0-1のクラス分類よりも教師データに情報量は多いので、もしかしたら改善するかもしれません。 学習過程はipynbファイルで行いました。以下はその記録です。 前処理 基...
長編連載

[儲からない競馬予想AI] Section 02-02 : rankが1位か否かを当てるBinary Classification

1位になるかどうかを学習してみて、利益を算出してみます。3位以内を当てる場合よりも、難易度は高くなりますが、必然的にオッズも高くなるため、どちらが良いかはわかりません。 学習過程はipynbファイルで行いました。以下はその記録です。 前処理...