長編連載[儲からない競馬予想AI] Chapter 02 : LightGBMによる競馬予測 Chapter2ではChapter1で作成したテーブルデータを基に、lightGBMによる学習を行い、実際に利益が出るのかを検証します。このときの目的変数は色々考えられますが、この章では次のものを検証します。rankが3位以内か否かを当てる... 2024.05.26長編連載
長編連載[儲からない競馬予想AI] Section 01-04 : データ整形④ 学習データの作成 では、Section01-01で作ったテーブルデータへ、馬の戦績、騎手の戦績、血統のデータを追加していきます。また、同じレースの強い馬の戦績も追加することにします。ベースとなるプログラムはSection01-01で書いたコードです。馬の戦績... 2024.05.26長編連載
長編連載[儲からない競馬予想AI] Section 01-03 : データ整形③ 戦績データの作成 Section 01-02で作成したanalysis_data01_with_strength.pklをそれぞれの馬、騎手ごとに分割して保存します。それぞれ分けて保存する理由は、あとの並列処理でファイルが分かれていたほうが読み込み速度が早い... 2024.05.26長編連載
長編連載[儲からない競馬予想AI] Section 01-02 : データ整形② 速度データの加工 速度データの加工の必要性前回、戦績データを作るために、レースので全データをテーブルデータへと変換しました。ある日の任意の馬のレースに対しては、日付と馬で条件付をして、過去のレースデータを生成し、統計処理することで馬の戦績を割り出せます。ここ... 2024.05.26長編連載
長編連載[儲からない競馬予想AI] Section 01-01 : データ整形① 収集したデータですが、各レースのデータは次のような形式を持っています{ 'race_place_data':dict, #レース固有のデータ。日時、場所、グレード、 距離、馬場、天気など 'race_horses_data':list,#出... 2024.05.25長編連載
長編連載[儲からない競馬予想AI] Chapter 01 : データ収集とデータ整形 最初に競馬予測をするためには、データ収集が必要です。このデータ収集で、ミスしてたりすると、最初からやり直しなので、気分が折れます(3敗)。基本的は、 さんからデータをスクレイピングで抜いています。あんまり負荷をかけるのは、よくないので各自モ... 2024.05.25長編連載