由于随机变量Z是离散的,所以是状态转移矩阵,如果变量是连续的,则是状态转移函数,比如马尔科夫决策过程中的状态转移函数P{s',r|s,a},也叫动态特性。
状态转移矩阵示例
表示zt变量有三个状态c1,c2,c3,分别转移到zt+1时刻的c1,c2,c3的概率。(数值待定)
由于随机变量Z是离散的,所以是状态转移矩阵,如果变量是连续的,则是状态转移函数,比如马尔科夫决策过程中的状态转移函数P{s',r|s,a},也叫动态特性。
状态转移矩阵示例
表示zt变量有三个状态c1,c2,c3,分别转移到zt+1时刻的c1,c2,c3的概率。(数值待定)
本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。