關注“心儀腦”查看更多腦科學知識的分享。
許多研究者使用EEG這項技術開展科研工作時,經常會遇到這樣一個問題:有很好的idea但苦於缺乏足夠的數據支持和驗證。尤其是在2019 - 2020年COVID-19期間,許多高校實驗室處於封閉狀態,不能進入實驗室采集腦電
數據。在缺乏足夠數據支持的情況下,如何開展與EEG有關的課題研究,又一次成為一個焦點。其實網絡上有許多機構或組織以及研究者或研究團隊會公開自己已開展研究的數據庫,供大家開放使用。
本期編者搜集整理了目前互聯網中的 EEG公開數據集,主要分為五大模塊,各位研究者可根據自己的需要獲取數據集。匯總信息同步托管到GitHub,各位有其他EEG公開數據集,也可以加入協作補充(https://github.com/hubandad/eegdataset)。
[Ⅰ] 事件相關電位數據集(Event Related Potential Dataset)
1、ERP Core 數據集
ERP Core是一個開源的人類ERP研究項目,該項目涵蓋了ERP研究常用的范式和數據集(共計6個ERP范式,7個ERP成分)。該項目發起人之一是我們熟知的Steve Luck 教授,該項目創立的主要目的是為了更好地推進ERP技術進入社會實踐,傳播ERP技術
,造福人類。
- 項目官網:https://erpinfo.org/erp-core
- 項目介紹:
https://www.sciencedirect.
com/science/article/pii/S1053811920309502 - 數據集獲取地址:https://osf.io/thsqg/
2. OpenNeuro 數據庫
OpenNeuro 是一個由Poldrack及其團隊創建的免費且開源的神經影像學
數據庫共享平台,提供了大量可用於共享的MRI,MEG,EEG,iEEG,ECoG,ASL和PET數據集,截至目前(2021年5月),OpenNeuro上已經有540個公開可供使用的數據集,共計18108名科研工作者加入到此平台的數據庫貢獻工作中。只需打開OpenNeuro,根據需要通過檢索關鍵詞(如:EEG),即可搜索相關類型的數據集,整個過程無需注冊。今天我向大家分享的是OpenNeuro中的一個使用go / nogo 探測和分類任務的ERP數據集,在該數據集中,作者采集了男女受試者各7名的ERP數據,同時也提供了數據分析腳本和參考文獻。
- OpenNeuro項目官網:
https://openneuro.org/ - OpenNeuro檢索地址:
https://openneuro.org/public/datasets - go / nogo數據集獲取地址:
https://openneuro.org/datasets/ds002680/versions/1.0.0
[Ⅱ] 功能性腦疾病數據集(Functional Brain Disease Dataset)
1、癲癇數據集
目前網絡上可以搜集到的免費且公開的癲癇數據集不多,因為許多數據庫都加入了收費的歐洲癲癇數據庫(European Epilepsy Database)項目,需要單獨購買。
筆者盡可能仔細查找並整理了以下小樣本的癲癇數據集,供大家學習使用。
1.1新德里Hauz Khas的神經和睡眠中心收集的10名癲癇患者的EEG樣例數據。數據是根據10-20分布,采樣頻率為200 Hz的MAT文件。在采集期間,數據帶通濾波范圍:0.5到70 Hz,並細分為癲癇發作前,發作間和發作階段。可通過壓縮包中的txt文本獲取詳細信息。
1.2 CHB-MIT Scalp EEG Database
CHB-MIT Scalp EEG Database
該數據庫收集自波士頓兒童醫院,其中包括患有難治性癲癇發作的兒科患者的腦電圖
記錄。詳細信息可參考數據庫網頁信息。
1.3 Kaggle competition on seizure prediction 數據集
該數據集為Kaggle 癲癇預測項目競賽中的數據,數據采集的狗和人的ECoG數據,詳細信息可參考項目網站介紹。
- 項目介紹:
https://www.kaggle.com/c/seizure-detection/overview - 數據庫獲取地址:
https://www.kaggle.com/c/seizure-detection/data
1.4 CHB-MIT Scalp EEG Database
該數據庫包含23名兒童癲癇患者的腦電數據。
- 數據庫介紹文獻: https://dspace.mit.edu/handle/1721.1/54669
- 項目及數據庫地址:
https://archive.physionet.org/pn6/chbmit/
2、帕金森EEG數據集
在該模塊,筆者向各位介紹幾個已發表文獻的帕金森EEG數據集,方便各位參照文獻學習。
2.1 該數據集為41名帕金森
患者靜息態EEG數據集,在該數據集下開展的研究中,研究者試圖通過EEG 算法區分帕金森病人和正常人。相關研究成果於2020年10月發表在Parkinsonism & Related Disorders 雜志。
- 發表成果: https://www.sciencedirect.com/science/article/pii/S1353802020306672?via%3Dihub
- 數據集獲取地址:
https://bit.ly/3pP1pts (OneDrive鏈接)
2.2 該數據集為26名帕金森患者任務態EEG數據集,在該數據集下開展的研究中,研究者探究了帕金森患者在下肢運動過程中(Lower Limb Pedaling Task)額葉theta和beta振盪是否存在異常。
- 發表成果: https://www.sciencedirect.com/science/article/abs/pii/S1388245720300092
- 數據集獲取地址:
https://bit.ly/32dsmMS (OneDrive鏈接)
2.3 該數據集為28名帕金森患者任務態EEG數據(Reinforcement Learning Task),在該數據集下開展的研究中,研究者旨在研究帕金森氏病臨床診斷的EEG標記物。相關研究成果於2020年1月發表在 brain research
雜志。
- 發表成果: https://www.sciencedirect.com/science/article/abs/pii/S0006899319305955?via%3Dihub
- 數據集獲取地址:
https://bit.ly/2AIPl9b (OneDrive鏈接)
2.4 該數據集為28名帕金森患者的任務態EEG數據(Cost Conflict Simon Task),在該數據集下開展的研究中,研究者發現帕金森氏病患者在執行與認知控制有關任務過程中,額中葉theta活動減弱。相關研究成果於2018年發表在 Neuropsychologia 雜志。
- 發表成果: https://www.sciencedirect.com/science/article/abs/pii/S0028393218302185?via%3Dihub
- 數據集獲取地址:
http://bit.ly/2FauZTt
2.5 該數據集為27名帕金森患者的靜息態EEG數據,在該數據集下開展的研究中,研究者開發了一種分類算法用來分類健康人和帕金森氏
病人,特異性高達82%。相關研究成果於2018年發表在 Clinical Neurophysiology雜志。
- 發表成果: https://www.sciencedirect.com/science/article/abs/pii/S1388245717311719
- 數據集獲取地址:
http://bit.ly/2rfCkNP
3、強迫症EEG 數據集
該數據集為23名強迫症
患者的任務態EEG數據(Flanker Task),在該數據集下開展的研究中,研究者探究了側抑制任務下OCD患者的錯誤關聯負波
與健康對照的差異。相關研究成果於2009年發表在 Neuropsychologia雜志。
- 發表成果: https://www.sciencedirect.com/science/article/abs/pii/S0028393209001298?via%3Dihub
- 數據集獲取地址: https://bit.ly/2MG4ZHz
4、抑郁症 EEG 數據集
4.1 任務態抑郁症EEG數據集
該數據集為46名抑郁症患者的任務態EEG數據(Reinforcement Learning Task),在該數據集下開展的研究中,研究者探究了側抑制任務下OCD患者的錯誤關聯負波與健康對照的差異。相關研究成果於2019年發表。
- 發表成果:https://direct.mit.edu/cpsy/article/doi/10.1162/cpsy_a_00024/5365/Multiple-Dissociations-Between-Comorbid-Depression
- 數據集獲取地址: https://bit.ly/2F11Zwv
4.2 MODMA 數據集
MODMA dataset 是一個專業開放的腦疾病多模態數據庫,網站目前提供EEG和音頻數據庫。經筆者確認,該數據庫目前提供MDD腦電數據。但數據集不能直接下載獲取,需要使用機構郵箱注冊賬號並獲得批准后方可下載使用。
- 數據庫介紹:
http://modma.lzu.edu.cn/data/index/ - 數據庫介紹文獻:
https://arxiv.org/pdf/2002.09283.pdf - 數據集獲取地址: http://modma.lzu.edu.cn/data/application/#data_1
注意:請務必認真閱讀網站頂部賬號注冊要求,否則會注冊失敗哦。
5、精神分裂症 EEG 數據集
5.1 該數據集為46名精神分裂症患者的任務態EEG數據(Cost Conflict Simon Task),在該數據集下開展的研究中,研究者探究了精神分裂症患者在空間響應上存在反應沖突效應增強的現象。相關研究成果於2019年發表在 Neuropsychologia 雜志。
- 發表成果: https://www.sciencedirect.com/science/article/pii/S0028393218301726
- 數據集獲取地址:
https://bit.ly/2J7BeJc
5.2 該數據集為健康青少年和被診斷為精神分裂症青少年的EEG數據。
- 數據詳細介紹及獲取方式: http://brain.bio.msu.ru/eeg_schizophrenia.htm
5.3 該數據集為精神分裂症患者執行基本感覺任務的EEG 數據。
- 數據詳細介紹及獲取方式: https://www.kaggle.com/broach/button-tone-sz
[Ⅲ] 腦機接口腦電數據集(Brain Computer Interface EEG Dataset)
1、BCI競賽數據庫
BCI競賽旨在為廣大BCI研究者提供高質量的神經科學數據而創立。目前網絡上公開的數據集有三個,分別為第二、三和四屆BCI數據集,具體獲取方式如下:
- 第二屆BCI大賽數據集:
https://www.bbci.de/competition/ii/ - 第三屆BCI大賽數據集:
https://www.bbci.de/competition/iii/ - 第四屆BCI大賽數據集:
https://www.bbci.de/competition/iv/
2、2020年國際BCI競賽數據庫
受COVID-19疫情影響,2020年國際BCI競賽頒獎活動未能如期舉行。大賽組委會決定將測試的數據不開放標簽向大眾共享,用戶可以免費使用大賽測試數據。
- 2020年BCI大賽介紹wiki:
https://osf.io/pq7vb/wiki/home/ - 2020年BCI大賽數據集獲取:
https://osf.io/pq7vb/
3、BNCI HORIZON 2020 數據庫
BNCI Horizon 2020是一項由歐盟委員會框架計划7資助的項目。該項目旨在大眾提供公開的BCI數據集,以助力BCI研究和發展。目前該項目已經匯總了28個與BCI相關的數據集。用戶在遵循授權許可的情況下,可以免費下載使用。
- 項目官網:http://bnci-horizon-2020.eu/
- 項目介紹:
http://bnci-horizon-2020.eu/project - 數據庫獲取地址:
http://bnci-horizon-2020.eu/database/data-sets
4、MEDICON 2019 Scientific Challenge 數據集
MEDICON 2019 Scientific Challenge 是一項BCI項目挑戰賽,參與者可以從15個臨床EEG數據集中測試基於BCI的p300成分,訓練患有ASD青少年遵循社交線索的實驗。每位受試者在4個月的時間內接受了7次訓練。
- 項目介紹及數據集獲取地址: https://www.medicon2019.org/scientific-challenge/
5、其他:
5.1 Havard dataverse BCI運動想象數據集,由天津大學
某研究者貢獻。
https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/27306
5.2 EEG Motor Movement/Imagery Dataset
https://www.physionet.org/content/eegmmidb/1.0.0/
5.3 ERP-based Brain-Computer Interface recordings
https://www.physionet.org/content/erpbci/1.0.0/
[Ⅳ] 睡眠腦電數據集(Sleep EEG Dataset)
1、NCH Sleep DataBank
為了加快對小兒睡眠及其與健康的聯系的研究,全國兒童醫院(NCH)和卡內基梅隆大學
(CMU)推出了NCH睡眠數據庫。該數據集於2017年至2019年期間在美國俄亥俄州哥倫布的NCH對3673名獨特患者進行了3984例兒科睡眠研究,以及患者的縱向臨床數據。出版的多導睡眠監測儀(PSG)包含患者的生理信號
以及技術人員對睡眠階段的評估以及其他異常情況的描述。
2、Sleep-EDF Database Expanded
該數據集包含197例睡眠腦電圖的數據,數據為EDF格式。
- 數據庫獲取地址:
https://www.physionet.org/content/sleep-edfx/1.0.0/ - EDFbrowser:https://www.teuniz.net/edfbrowser/
3、ISRUC-SLEEP Dataset
該數據集包含100例病人的PSG數據。
- 項目介紹:
https://sleeptight.isr.uc.pt/ - 數據庫獲取地址:
https://sleeptight.isr.uc.pt/?page_id=48 - 數據庫介紹: http://dataset.isr.uc.pt/ISRUC_Sleep/Content.pdf
- 數據庫文獻介紹: https://www.researchgate.net/publication/283734463_ISRUC-Sleep_A_comprehensive_public_dataset_for_sleep_researchers
4、Dreem Sleep Stage Classification Challenge Dataset
使用簡單的頭帶式EEG設備采集的30s 簡短的EEG數據,對睡眠階段進行區分。
- 項目介紹:
https://www.kaggle.com/c/dreem-sleep-stages/overview - 數據庫獲取地址:
https://www.kaggle.com/c/dreem-sleep-stages/data
5、Newborn sleep EEG data
該數據集包含MATLAB中的1,110個睡眠EEG,這些睡眠EEG在臨床狀況
下記錄了來自36至45周的10個年齡組的新生兒的臨床狀況。
- 項目介紹文獻: https://www.ncbi.nlm.nih.gov/pubmed/15055799 / https://www.ncbi.nlm.nih.gov/pubmed/10406020
- 數據庫獲取地址: https://figshare.com/articles/dataset/Newborn_sleep_EEG_data/4729840
[Ⅴ] 創傷性腦疾病數據集(Traumatic Brain Disease Dataset)
1、輕度創傷性腦損傷
1.1 使用 Dot Probe Expectancy Task 測試腦損傷病人的認知功能
。
1.2 使用3階 Auditory Oddball Task 探測腦損傷病人的腦功能變化情況。
- 發表成果: https://www.sciencedirect.com/science/article/abs/pii/S0028393219301630?via%3Dihub
- 數據集獲取地址:
https://bit.ly/2QkPB4d
[Ⅵ] 其他EEG 數據庫
1、Healthy Brain Network Dataset
HBND是一個公益性的提供兒童青少年精神病學研究數據庫的組織,該組織提供超過1萬多名兒童和青少年大腦影像數據,包括EEG,MRI等數據。
該項目目前共計發行了9個EEG數據庫版本,約合3000例數據。
- 項目介紹文獻: https://www.nature.com/articles/sdata2017181
- 數據庫獲取地址:
http://fcon_1000.projects.
http://nitrc.org/indi/cmi_healthy_brain_network/sharing_neuro.html
2、Temple University EEG Corpus
天普大學EEG 數據庫,包含12000名病人,16通道,EDF格式的EEG數據。
注意:該數據庫需要注冊賬號才可訪問。
3、DEAP dataset
一個包含視頻數據和EEG數據的情緒數據庫,采用注冊邀請制訪問,需獲取授權后方可訪問資源。
申請授權時,務必仔細閱讀授權說明,按照要求和格式填寫授權信息表格。
不過根據編者的個人經驗,該數據庫獲取授權方式較困難(編者提交申請1.5個月后未得到任何答復。)
4、其他未整理的公開數據集地址匯總
eegdataset/
歡迎大家協作更新。
參考連接:https://zhuanlan.zhihu.com/p/377480885