由於隨機變量Z是離散的,所以是狀態轉移矩陣,如果變量是連續的,則是狀態轉移函數,比如馬爾科夫決策過程中的狀態轉移函數P{s',r|s,a},也叫動態特性。
狀態轉移矩陣示例
表示zt變量有三個狀態c1,c2,c3,分別轉移到zt+1時刻的c1,c2,c3的概率。(數值待定)
由於隨機變量Z是離散的,所以是狀態轉移矩陣,如果變量是連續的,則是狀態轉移函數,比如馬爾科夫決策過程中的狀態轉移函數P{s',r|s,a},也叫動態特性。
狀態轉移矩陣示例
表示zt變量有三個狀態c1,c2,c3,分別轉移到zt+1時刻的c1,c2,c3的概率。(數值待定)
本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。