原文:强化学习在量化投资中应用(理论简介)

什么是强化学习 强化学习任务通常用马尔科夫决策过程 MarkovDecision Process,MDP 来描述:机器处于环境E中,状态空间为S,其中每个状态s S是机器给你知道的环境的描述 机器能采取的动作构成了动作空间A,若某个动作a A作用在当前状态s上,则潜在的转移函数P将使得环境从当前状态按某种概率转移到另一个状态,在转移到另一个状态的同时,环境会根据潜在的 奖赏 Reward 函数R ...

2018-11-13 13:53 0 907 推荐指数:

查看详情

强化学习简介

强化学习简介   本来笔者只是想简单做个元强化学习的材料整理,但是做着做着,感觉还是可以讲点什么东西的。虽然笔者能力有限,但是还是希望能够分享一点拙见,以供后来者上手参考。也欢迎大家批评指正。   要讲元强化学习,首先肯定是要先了解一下元学习的相关概念。   学会如何学习的方法被称为元学习 ...

Mon Sep 14 19:00:00 CST 2020 0 5486
强化学习之Q-learning简介

https://blog.csdn.net/Young_Gy/article/details/73485518 强化学习在alphago中大放异彩,本文将简要介绍强化学习的一种q-learning。先从最简单的q-table下手,然后针对state过多的问题引入q-network,最后通过两个 ...

Wed Aug 01 06:30:00 CST 2018 0 1329
使用PyTorch Lightning构建轻量化强化学习DQN

本文旨在探究将PyTorch Lightning应用于激动人心的强化学习(RL)领域。在这里,我们将使用经典的倒立摆gym环境来构建一个标准的深度Q网络(DQN)模型,以说明如何开始使用Lightning来构建RL模型。 在本文中,我们将讨论: 什么是lighting以及为什么要将 ...

Tue Apr 07 21:39:00 CST 2020 0 901
如何学习量化投资

昨天有位大三学金融的同学留言询问如何学习、看哪些书,以便日后进入量化投资行业。我写了些建议,结果太长无法直接回复给他。熊大建议,干脆整成一篇推文,于是就有了这个番外篇。 如何学习量化投资,如何进入这个行业,每个人的方法和路径都会有不同,我谨以我的些许经验和理解做一些建议,希望有用。 首先,也是 ...

Thu Feb 08 03:46:00 CST 2018 2 3041
溢价率计算方法,以及在投资中应用

https://zhuanlan.zhihu.com/p/79636101 本文尽量用简洁的语言,介绍可转债转股溢价率的计算方法,以及在投资中应用。 本文花费了作者孙建华几乎一整天的时间,希望能对投资者有用,完全凭印象写作,未参考任何资料。如有错误或者描述不准确的地方,也请读者指出来。如有 ...

Thu Jul 15 19:35:00 CST 2021 0 185
强化学习总结

强化学习总结 强化学习的故事 强化学习学习一个最优策略(policy),可以让本体(agent)在特定环境(environment)中,根据当前的状态(state),做出行动(action),从而获得最大回报(G or return)。 有限马尔卡夫决策过程 马尔卡夫决策过程理论 ...

Fri Mar 31 07:34:00 CST 2017 6 17833
强化学习——入门

强化学习强化学习作为一门灵感来源于心理学中的行为主义理论的学科,其内容涉及 概率论、统计学、逼近论、凸分析、计算复杂性理论、运筹学 等多学科知识,难度之大,门槛之高,导致其发展速度特别缓慢。 一种解释: 人的一生其实都是不断在强化学习,当你有个动作(action)在某个状态 ...

Thu Sep 12 19:37:00 CST 2019 1 467
强化学习(MATLAB)

1. 定义 机器学习算法可以分为3种:有监督学习(Supervised Learning)、无监督学习(Unsupervised Learning)和强化学习(Reinforcement Learning)。强化学习(Reinforcement Learning, RL),又称再励学习、评价学习 ...

Wed Mar 25 00:51:00 CST 2020 1 9767
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM