長編連載[機械学習・進化計算による株式取引最適化] No.07-01 cythonでのトレードシミュレーション このプログラムの目的進化計算は機械学習と違って多点探索手法なため,計算効率が悪いです.そこで,シミュレーション関数をcythonで書くことで,計算速度を向上させます.cythonは.pyxというファイルを作成し,型定義等をpythonの記法... 2024.05.25長編連載
長編連載[機械学習・進化計算による株式取引最適化] No.07 進化計算による株取引最適化 本章の目的No.06では強化学習による株取引最適化を行いました.強化学習のQ関数であるQネットワークは複数の行動についての行動価値を出力します.そのあと,最も行動価値の高い行動を選択するという操作を行います.強化学習における行動選択そのため... 2024.05.25長編連載
長編連載[機械学習・進化計算による株式取引最適化] No.06-04 実行と結果 このプログラムの目的このプログラムはdqn.pyを呼び出し,強化学習を開始させることを目的とします.また,手法・環境のパラメータやデータセットのパスなどをここで指定します.work_share├06_sampling_dqn_learnin... 2024.05.25長編連載
長編連載[機械学習・進化計算による株式取引最適化] No.06-03 収益グラフの表示 このプログラムの目的このプログラムはdqn.pyなどの学習によって得られたエージェントの収益グラフ,もしくはその学習過程をグラフとして出力するものです.work_share├06_sampling_dqn_learning ├Dockerf... 2024.05.25長編連載
長編連載[機械学習・進化計算による株式取引最適化] No.06-02 DQNによる学習 このプログラムの目的このプログラムはDQN(Deep Q-Learning)と呼ばれる強化学習によって,前項で作成したシミュレーション環境を学習することにあります.work_share├06_sampling_dqn_learning ├D... 2024.05.25長編連載
長編連載[機械学習・進化計算による株式取引最適化] No.06-01 市場シミュレーター環境の作成 このプログラムの目的stock_env.pyの目的は,作成したデータセットとネットワークのやり取りを,強化学習がやり取りしやすい形の「環境」で表現することです.このプログラムはNo.02章といくつかの相違点があります.関数を減らし,環境の呼... 2024.05.25長編連載