原文:強化學習在量化投資中應用(理論簡介)

什么是強化學習 強化學習任務通常用馬爾科夫決策過程 MarkovDecision Process,MDP 來描述:機器處於環境E中,狀態空間為S,其中每個狀態s S是機器給你知道的環境的描述 機器能采取的動作構成了動作空間A,若某個動作a A作用在當前狀態s上,則潛在的轉移函數P將使得環境從當前狀態按某種概率轉移到另一個狀態,在轉移到另一個狀態的同時,環境會根據潛在的 獎賞 Reward 函數R ...

2018-11-13 13:53 0 907 推薦指數:

查看詳情

強化學習簡介

強化學習簡介   本來筆者只是想簡單做個元強化學習的材料整理,但是做着做着,感覺還是可以講點什么東西的。雖然筆者能力有限,但是還是希望能夠分享一點拙見,以供后來者上手參考。也歡迎大家批評指正。   要講元強化學習,首先肯定是要先了解一下元學習的相關概念。   學會如何學習的方法被稱為元學習 ...

Mon Sep 14 19:00:00 CST 2020 0 5486
強化學習之Q-learning簡介

https://blog.csdn.net/Young_Gy/article/details/73485518 強化學習在alphago中大放異彩,本文將簡要介紹強化學習的一種q-learning。先從最簡單的q-table下手,然后針對state過多的問題引入q-network,最后通過兩個 ...

Wed Aug 01 06:30:00 CST 2018 0 1329
使用PyTorch Lightning構建輕量化強化學習DQN

本文旨在探究將PyTorch Lightning應用於激動人心的強化學習(RL)領域。在這里,我們將使用經典的倒立擺gym環境來構建一個標准的深度Q網絡(DQN)模型,以說明如何開始使用Lightning來構建RL模型。 在本文中,我們將討論: 什么是lighting以及為什么要將 ...

Tue Apr 07 21:39:00 CST 2020 0 901
如何學習量化投資

昨天有位大三學金融的同學留言詢問如何學習、看哪些書,以便日后進入量化投資行業。我寫了些建議,結果太長無法直接回復給他。熊大建議,干脆整成一篇推文,於是就有了這個番外篇。 如何學習量化投資,如何進入這個行業,每個人的方法和路徑都會有不同,我謹以我的些許經驗和理解做一些建議,希望有用。 首先,也是 ...

Thu Feb 08 03:46:00 CST 2018 2 3041
溢價率計算方法,以及在投資中應用

https://zhuanlan.zhihu.com/p/79636101 本文盡量用簡潔的語言,介紹可轉債轉股溢價率的計算方法,以及在投資中應用。 本文花費了作者孫建華幾乎一整天的時間,希望能對投資者有用,完全憑印象寫作,未參考任何資料。如有錯誤或者描述不准確的地方,也請讀者指出來。如有 ...

Thu Jul 15 19:35:00 CST 2021 0 185
強化學習總結

強化學習總結 強化學習的故事 強化學習學習一個最優策略(policy),可以讓本體(agent)在特定環境(environment)中,根據當前的狀態(state),做出行動(action),從而獲得最大回報(G or return)。 有限馬爾卡夫決策過程 馬爾卡夫決策過程理論 ...

Fri Mar 31 07:34:00 CST 2017 6 17833
強化學習——入門

強化學習強化學習作為一門靈感來源於心理學中的行為主義理論的學科,其內容涉及 概率論、統計學、逼近論、凸分析、計算復雜性理論、運籌學 等多學科知識,難度之大,門檻之高,導致其發展速度特別緩慢。 一種解釋: 人的一生其實都是不斷在強化學習,當你有個動作(action)在某個狀態 ...

Thu Sep 12 19:37:00 CST 2019 1 467
強化學習(MATLAB)

1. 定義 機器學習算法可以分為3種:有監督學習(Supervised Learning)、無監督學習(Unsupervised Learning)和強化學習(Reinforcement Learning)。強化學習(Reinforcement Learning, RL),又稱再勵學習、評價學習 ...

Wed Mar 25 00:51:00 CST 2020 1 9767
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM