強化学習

[儲からない競馬予想AI] Section 04-01 : 単純なGPによるベット予想

GPでベットをするかしないかを予測する関数を作ります。前処理はほとんど前章や前前章と変わりありません。学習過程はipynbファイルで行いました。以下はその記録です。前処理まず、使いそうなライブラリをインポートします。import panda...

[儲からない競馬予想AI] 閑話2 : 強化学習は競馬予測で使えない

閑話として強化学習が競馬予想に使えない話をしておきます強化学習については知っている前提で話します。知らなければこの話は読まなくて構いません。一応参考として、を上げておきます。なぜ使えないのか競馬で儲けるというのもマネーゲームとして捉えれば、...

[機械学習・進化計算による株式取引最適化] No.07-02 モデルと配列変換

このプログラムの目的このプログラムの目的は，PytorchのネットワークとGAの配列の相互変換を実装することです．進化計算とニューラルネットワークを組みわせた手法は様々なものが存在します．これらの総称をNeuro-Evolutionと呼びま...

[機械学習・進化計算による株式取引最適化] No.07-01 cythonでのトレードシミュレーション

このプログラムの目的進化計算は機械学習と違って多点探索手法なため，計算効率が悪いです．そこで，シミュレーション関数をcythonで書くことで，計算速度を向上させます．cythonは.pyxというファイルを作成し，型定義等をpythonの記法...

[機械学習・進化計算による株式取引最適化] No.06-02 DQNによる学習

このプログラムの目的このプログラムはDQN(Deep Q-Learning)と呼ばれる強化学習によって，前項で作成したシミュレーション環境を学習することにあります．work_share├06_sampling_dqn_learning ├D...

[機械学習・進化計算による株式取引最適化] No.06-01 市場シミュレーター環境の作成

このプログラムの目的stock_env.pyの目的は，作成したデータセットとネットワークのやり取りを，強化学習がやり取りしやすい形の「環境」で表現することです．このプログラムはNo.02章といくつかの相違点があります．関数を減らし，環境の呼...

次のページ

1 2