查找DICOM基礎知識時,看到這篇文章里面寫了一些關於使用深度學習進行醫療影像分析:文件格式篇。下文摘自:https://www.jiqizhixin.com/articles/2017-07-31
醫療數據組成:

醫療數據有四個關鍵的組成部分--像素深度、光度解釋、元數據以及像素數據。這幾部分決定了圖像的大小和分辨率。
像素深度(Pixel Depth)或者位深度(Bit Depth)或者色深度(Color Depth)就是用來編碼每一像素的信息所用的位數。例如,一個 8 位的柵格會擁有從 0 到 255 這 256 種各不相同的數值。
光度解釋具體化了像素數據被解釋成正確的圖片展示的方式,如單色圖像或者彩色圖像。為了確定像素值中是否存儲了彩色信息,我們引入了每個像素的樣本的概念,也就是大家都知道的通道數量。單色圖像每個像素只有一個樣本,圖片中並沒有存儲彩色信息。我們使用從黑色到白色的灰度級別來展示這種圖片。灰度的數量明顯取決於用來存儲這個樣本的位數,在這種情況下,與像素深度是一致的。像 X 光片、CT 和磁共振這樣的放射醫療影像都有一個灰度光度解釋。核醫學圖像都以彩色的形式展現,例如 PET 和 SPECT。
元數據就是圖片中所描述的信息。它看上去可能是很奇怪的,但是無論在什么格式的文件中,都存在一些超越像素數據並且和圖像相關的信息。這類被稱作元數據的信息通常都以頭部的形式儲在文件的起始部分,它至少會包含以下信息:圖像矩陣的維度、空間精度、像素深度以及光度解釋。
像素數據--這里存儲的是像素數值的大小。根據不同的數據類型,像素數據可能以整型或者浮點型的類型存儲,使用表達數據所需的最少的數據位。
所以,圖像的大小=頭部大小(包含元數據)+行×列×像素深度×幀的數量
醫療圖像的格式
放射生物圖像中主要有六種格式--DICOM(醫療中的數字圖像和通信),NIFTI(神經影像學信息技術計划),PAR/REC(飛利浦 MRI 掃描格式),ANALYZE(Mayo 醫療成像)以及 NRRD(近乎原始光柵數據)和 MNIC 格式。
其中 DICOM 和 NIFTI 是最常用的格式。

DICOM 格式的基本知識
DICOM 代表的是醫療數字成像和通信。DICOM 是由美國國家電氣制造商協會(NEMA)制定的標准。它定義了醫療成像領域中關於信息處理、存儲、打印以及傳輸的標准。這些都是你在掃描儀或者某家醫院的圖片歸檔和通信系統(PACS)能夠立即得到的文件格式。
它包括了文件格式和能夠接收圖像和 DICOM 格式的病人數據的實體之間使用 TCP/IP 進行通信的協議。
一個 DICOM 文件包含文件頭部和同文件名的*.dcm 圖像數據。文件頭部的大小取決於它所提供的信息的多少。文件頭包含以下信息:病人的 ID,病人的姓名,圖像的模態以及其他信息。它定義了幀的數量以及圖像的精度。這些信息會被圖像瀏覽器在顯示圖像時用到。對於一個單詞采樣,會有很多個 DICOM 文件。
NIFTI 格式基本知識
Nifti 格式最初是為神經影像學發明的。神經影像信息學技術計划(NIFTI)將 NIfTI 格式預設為 ANALYZE7.5 格式的替代品。它最初的應用領域是神經影像,但是也被用在其他領域。這種格式的主要特點就是它包含兩個能夠將每個體素的索引(i,j,k)和它的空間位置(x,y,z)關聯起來的仿射坐標。
nibabel 是一個能夠讀取 nifti 文件的 Python 庫,oro.nifti 是一個能夠讀取 nifti 文件的 R 語言庫。
DICOM 和 NIFTI 的區別
DICOM 和 NIfTI 這兩種格式的主要區別是:NIfTI 中的圖像原始數據被存儲成了 3 維圖像,而 dicom 一些 2 維的圖層。這就使得 NIFTI 更加適合那些應用在 DICOM 上的機器學習的方法,因為它是以 3D 圖像建模的。處理一個單獨的 NIFTI 文件要比處理成百上千個 dicom 文件更加容易一些。與 DICOM 格式下的好多個文件相比,NIFTI 格式下,每個 3d 圖像只有兩個文件。
其他更多詳細信息,可以繼續參考https://www.jiqizhixin.com/articles/2017-07-31閱讀。

