強化学習

長編連載

[儲からない競馬予想AI] Section 04-01 : 単純なGPによるベット予想

GPでベットをするかしないかを予測する関数を作ります。前処理はほとんど前章や前前章と変わりありません。 学習過程はipynbファイルで行いました。以下はその記録です。 前処理 まず、使いそうなライブラリをインポートします。 import p...
長編連載

[儲からない競馬予想AI] 閑話2 : 強化学習は競馬予測で使えない

閑話として強化学習が競馬予想に使えない話をしておきます 強化学習については知っている前提で話します。知らなければこの話は読まなくて構いません。一応参考として、 を上げておきます。 なぜ使えないのか 競馬で儲けるというのもマネーゲームとして捉...
長編連載

[機械学習・進化計算による株式取引最適化] No.07-02 モデルと配列変換

このプログラムの目的 このプログラムの目的は,PytorchのネットワークとGAの配列の相互変換を実装することです. 進化計算とニューラルネットワークを組みわせた手法は様々なものが存在します.これらの総称をNeuro-Evolutionと呼...
長編連載

[機械学習・進化計算による株式取引最適化] No.07-01 cythonでのトレードシミュレーション

このプログラムの目的 進化計算は機械学習と違って多点探索手法なため,計算効率が悪いです.そこで,シミュレーション関数をcythonで書くことで,計算速度を向上させます. cythonは.pyxというファイルを作成し,型定義等をpythonの...
長編連載

[機械学習・進化計算による株式取引最適化] No.06-02 DQNによる学習

このプログラムの目的 このプログラムはDQN(Deep Q-Learning)と呼ばれる強化学習によって,前項で作成したシミュレーション環境を学習することにあります. work_share ├06_sampling_dqn_learning...
長編連載

[機械学習・進化計算による株式取引最適化] No.06-01 市場シミュレーター環境の作成

このプログラムの目的 stock_env.pyの目的は,作成したデータセットとネットワークのやり取りを,強化学習がやり取りしやすい形の「環境」で表現することです. このプログラムはNo.02章といくつかの相違点があります. 関数を減らし,環...