官方定義:令 表示一個可測的參數空間,
描述某一個類別的參數。令H是空間
上的一個概率測度,
表示一個正實數。對於空間
上的任意一個有限分割
:
如果空間
上的一個隨機概率分布G在這個分割中各部分上的測度服從一個狄利克雷分布:
,
那么我們就稱隨機概率分布G 服從狄利克雷過程,記為 .
我們把 叫做集中度參數,把H叫做基分布。
解讀:
測度的通俗理解就是給一個空間中的每個子集一個度量,即一個實數來衡量各個子集。最直觀的例子是用長度來衡量一個一維實數集合,這里的長度就是一種測度。
概率測度是指在空間中定義的測度滿足概率的性質,即每個子集的測度大於零,所有子集加和為1。
對於式子 :表示了這個分割是不重疊地充滿整個空間。
對比狄利克雷分布分布的定義 ,狄利克雷過程就是把
每一個
都看成一個概率分布G,而G 的參數
是屬於參數空間
的。
當我們取空間的一個子集,即T取 時,狄利克雷過程
就會退化成一個狄利克雷分布分布
。也就是說分布描述了一種划分下G的分布情況,而過程描述了空間中所有划分的情況。
性質:
如果,當觀察到N個獨立的來自G的樣本
,G的后驗分布仍然是一個狄利克雷過程:
。
以上是狄利克雷過程的定義,構造狄利克雷過程的常見方法有三種:
斷棍構造過程(Stick-Breaking Construction);
波利亞翁方案(Polya Urn Scheme)也叫(Blackwell-MacQueen 方案);
中餐館過程(Chinese Restaurant Process),CRP ;