上學的時候每次遇到“粒子濾波”那一堆符號,我就暈菜。今天閑來無事,搜了一些文章看,終於算是理解了。下面用白話記一下我的理解。
問題表述:
某年月,警方(跟蹤程序)要在某個城市的茫茫人海(采樣空間)中跟蹤尋找一個罪犯(目標),警方采用了粒子濾波的方法。
1. 初始化:
警方找來了一批警犬(粒子),並且讓每個警犬預先都聞了罪犯留下來的衣服的味道(為每個粒子初始化狀態向量S0),然后將警犬均勻布置到城市的各個區(均勻分布是初始化粒子的一種方法,另外還有諸如高斯分布,即:將警犬以罪犯留衣服的那個區為中心來擴展分布開來)。
2. 搜索:
每個警犬都聞一聞自己位置的人的味道(粒子狀態向量Si),並且確定這個味道跟預先聞過的味道的相似度(計算特征向量的相似性),這個相似度的計算最簡單的方法就是計算一個歐式距離(每個粒子i對應一個相似度Di),然后做歸一化(即:保證所有粒子的相似度之和為1)。
3. 決策:
總部根據警犬們發來的味道相似度確定罪犯出現的位置(概率上最大的目標):最簡單的決策方法為哪個味道的相似度最高,那個警犬處的人就是目標。
4. 重采樣:
總部根據上一次的決策結果,重新布置下一輪警犬分布(重采樣過程)。最簡單的方法為:把相似度比較小的地區的警犬抽調到相似度高的地區。
上述,2,3,4過程重復進行,就完成了粒子濾波跟蹤算法的全過程。
