讀心術的方法--多體素模式分析(MVPA)


原文地址:https://zhuanlan.zhihu.com/p/21554826

認知神經科學一個非常核心的問題就是解碼與編碼的問題:信息是怎么在不同的大腦結構被表示的?在不同階段的處理中,信息是怎么轉換的?為了研究這個解碼與編碼的問題,科學家們發展出了多體素模式分析(MVPA)的技術。

什么是多體素模式分析?

fMRI(功能核磁共振)為我們提供了一個非常好的工具,它可以讓被試執行一定的認知任務時測量局部的血流信號(血氧依賴水平,BOLD信號)

 

fMRI的成像單位是體素,也就是說我們測量的事每個體素的BOLD信號。簡而言之,體素就是三維的像素。

 

那么多體素模式分析(MVPA)就是用一些分類的機器學習算法,應用在很多很多體素的分析上,從而從大量體素的BOLD信號中解碼出來他們表示的信息。

通過對大量體素的分析,我們可以比使用單個體素,或者體素信號平均值等方式更容易的建立分類,而且不會損失太多信息。從下面這圖可以比較直觀的看出來他的優點:

在上面這個圖里,有時候只看一個體素的活動模式(比如x,y軸上的曲線代表他們的分布密度)是比較難把他們完全區別開來的,但是如果升高一個維度,畫到平面上,就可以很容易的把它們分開了。

多體素模式分析能干啥呢?

1. 解碼大腦活動的信息

解碼大腦活動也就是 MVPA作為“讀心術”最典型的體現了,最為典型的案例就是視覺解碼的研究了。

舉個例子

 

Haxby和他的同事通過對被試顳葉腹側(VT)的fmri掃描,建立對應的MVPA模型,從而在新的樣本中可以推斷出來他看到的是鞋子還是瓶子(Haxby et al.,2001)。

Miyawaki通過使用MVPA對初級視覺皮層的解碼,我們可以還原出來被試看到的圖案(Miyawaki et al., 2008)

值得注意的是,多體素模式分析由於我們使用的是“多體素”,在一定程度上甚至可以解碼一些比體素還小的功能單位(比如初級視覺皮層的功能柱)所包含的信息。

 

2. 探索大腦的編碼機制

在建立多體素模式分析的模型后,我們可以進一步的考量這個MVPA模型中所給予我們的信息。在線性的分類模型中(比如稀疏的對數幾率回歸)我們可以查看這些體素對這個分類模型的貢獻(權值的大小),從而了解這些體素是如何編碼這個認知狀態的。

舉個例子:上面提到過的(Miyawaki et al., 2008),他們建立分類器了以后也分析了權制的分布,也看到了初級視覺皮層(v1)比較明顯的視網膜拓撲的性質。

在使用非線性模型(比如非線性的SVM)的時候,我們很難衡量某個體素具體的貢獻,我們可以考慮某個腦區的表征精度,從而可以看到這個腦區對於這個具體認知狀態的貢獻。

舉個例子:方方教授的研究組通過MVPA來衡量知覺學習(Perceptual Learning)中大腦的V3A與MT區域對他的實驗任務表征精度的變化,從而驗證了他的假說。Perceptual learning modifies the functional specializations of visual cortical areas

如何進行多體素模式分析?

1.選擇特征(feature selection)

選擇特征在多體素分析中,對應的就是選擇那些體素進入我們分類器的構建過程。fmri掃描出來的體素可能會數量非常巨大(上萬個),如果不加以特征選擇,我們分類器的可能會維度遠遠高於訓練集的樣本數,很容易造成過擬合,影響我們的結果。

進行特征選擇的方式主要有下面幾種。

第一種是根據腦區加工、編碼信息的既定的理論,去選擇一些腦區中的體素進行后續的分析。類似Region of Interest(ROI)的方式

第二種是利用相關性分析的方法,選出對這個任務相關性比較高的體素進入我們的分類器模型。這個方式雖然是比較簡單方便的,但是表現上不相關的體素也可能會對分類器有積極的貢獻。

第三種是用一些向前或者向后搜索的方式,從一個起點開始(比如從相關系數最高的體素開始),逐個加入體素,觀察分類器精度的變化,如果精度提高就保留這個體素,否則就刪去這個體素。

但是,無論怎樣在進行MVPA的過程中,我們總是很容易遇到維度(特征的數量)高於樣本數的情況,因此選擇一個稀疏性比較好的分類算法是很有必要的。

2.pattern assembly(這個翻譯出來有點奇怪,就不強行翻譯了)

這個過程實際上就是統一一下訓練集數據的格式,以便於下一步的機器學習算法處理。主要是吧體素的活動按照順序排成我們需要的矩陣,同時再構建一個標記的矩陣。(這個對機器學習比較熟悉的同學會很容易理解)

3.訓練分類器(classifier training)

也就是吧我們訓練集的體素活動數據和標記的數據送入機器學習模型進行分類器的訓練

 

比如像我這樣的實際操作,其實有時候也把MVPA的第二步和第三部翻到了一個函數里。

 

4.泛化測試(generalization testing)

在訓練集以外的測試集上運行我們得到的分類模型,並與原來的標記數據進行對比,驗證我們這個分類模型的泛化能力。一般常用的就是計算這個模型在測試集上做分類的准確率。

其實在MVPA進行的這四個步驟,是一個比較典型的機器學習模型構建的過程。因此玩轉MVPA也是需要一點點機器學習基礎的哦。

總而言之

MVPA是一個目前認知神經科學非常流行的分析手段,越來越多的論文在分析過程中用到了MVPA。現在在分析fMRI數據的時候,我們從簡單的看這個腦區有沒有“亮”,變成了現在定量的來計算這個腦區對特定信息的表征精度。MVPA這也是機器學習促進腦科學研究的經典案例,利用了這些機器學習的算法,我們就可以從fMRI的實驗數據中發掘出更多信息,從而幫助我們了解大腦對信息的編碼原理。

ps:我成功構建了一個MVPA的模型,復現過Miyawaki et al., 2008的研究成果,感興趣的同學可以一起交流MVPA的實際應用,編程思路等問題。

 

Reference

Chen, N et al., (2016). Perceptual learning modifies the functional specializations of visual cortical areas. Proc Natl Acad Sci U S A. doi:10.1073/pnas.1524160113

Haxby, J.V. et al. (2001) Distributed and overlapping representations of faces and objects in ventral temporal cortex. Science 293, 2425–2429

Haynes, J. D., & Rees, G. (2006). Decoding mental states from brain activity in humans. Nat Rev Neurosci, 7(7), 523-534. doi:10.1038/nrn1931

Kay, K. N., & Gallant, J. L. (2009). I can see what you see. Nat Neurosci, 12(3), 245. doi:10.1038/nn0309-245

Miyawaki, Y et al., (2008). Visual image reconstruction from human brain activity using a combination of multiscale local image decoders. Neuron, 60(5), 915-929. doi:10.1016/j.neuron.2008.11.004

Norman, K. A et al.,(2006). Beyond mind-reading: multi-voxel pattern analysis of fMRI data. Trends Cogn Sci, 10(9), 424-430. doi:10.1016/j.tics.2006.07.005


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM