多媒體技術原理及應用
第一章 概論
1.1多媒體技術的概念
- 媒體的定義
- 信息表達和傳輸的載體
- 人與人之間所賴以溝通以及交流觀念,思想或者意見的中介物
- 媒體的分類
- 感覺媒體:通過人的感官直接產生感覺的媒體
- 例如:語言,音樂,自然界的聲音,圖像
- 表示媒體:加工處理和傳輸感覺媒體而人為設計的媒體
- 例如:媒體的編碼方式——語言,文本,圖像編碼;
各種傳輸協議;無線電;紅外
- 例如:媒體的編碼方式——語言,文本,圖像編碼;
- 表現媒體:感覺媒體和電信號之間轉換的媒體
- 例如:輸入表現:鍵盤,攝像機;輸出表現:顯示器,喇叭,耳機
- 存儲媒體:存放表示媒體,以便於計算機處理加工調用信息編碼
- 硬盤,軟盤,磁帶,CD-ROM
- 傳輸媒體:物理上傳輸信息的載體
- 雙絞線,同軸電纜,光纖
- 雙絞線,同軸電纜,光纖
- 感覺媒體:通過人的感官直接產生感覺的媒體
- 多媒體技術
- 概念:計算機交互式綜合處理多種多媒體信息——文本,圖形,圖像和聲音,使多種信息建立邏輯連接,即成為一個系統並且具有交互性。
- 特點:多媒體技術是計算機綜合處理聲、文、圖信息的技術,具有集成性,實時性和交互性。
1.2多媒體技術的發展歷程
- JPEG
- 全稱:聯合圖像專家組
- MPEG
- 平均壓縮比:50:1
- VCD,DVD的存儲格式
- 分類:1,2,4也是音頻標准
- MP3是MPEG的子集的音頻標准
1.3多媒體技術的研究內容
- 多媒體數據編碼、壓縮算法與標准
- 多媒體數據存儲技術
- 多媒體計算機系統硬件與軟件平台
- 多媒體軟件開發環境
- 多媒體內容管理
- 超文本與Web技術
- 多媒體系統數據模型
- 多媒體通信與分布式多媒體系統
- 基於Internet的多媒體技術
第二章 多媒體數據編碼基礎
2.4數據壓縮技術
-
數據壓縮的基本原理
- 數據冗余:信號數據需要壓縮
- 空間冗余:圖像數據,顏色分布有序,表面規律的特點反應在數據上是空間冗余
- 時間冗余:前后的視頻音頻數據前后存在很大的相關性,反應為時間冗余。
- 信息熵冗余/編碼冗余:一組數據接待的信息量
- 結構冗余:圖像存在很強的紋理結構
- 知識冗余:一部分數據與已有數據表達相同,例如:我在他左邊,他在我右邊
- 視覺冗余:圖像分辨率人眼無法識別出來
- 其他冗余:例如,空間非定常特性所帶來的冗余
- 數據冗余:信號數據需要壓縮
-
數據壓縮方法分類
- 原始數據和解碼后的數據是否一致
- 可逆編碼:壓縮比2:1~5:1之間(Huffman編碼,算術編碼,行程長度編碼)
- 不可逆編碼:變換編碼,預測編碼
- 壓縮原理進行划分
- 預測編碼:利用過去和現在和過去出現過點的數據情況來預測未來點的數據
- DPCM(差分脈沖編碼調制)
- ADPCM(自適應差分脈沖編碼調制)
- 變換編碼:時域變換到頻域空間上進行處理(量化過程發生失真現象)
- 量化與向量化編碼:使得整體量化失真最小
- 信息熵編碼:Huffman編碼,算術編碼,Shannon編碼
- 子帶編碼:圖像數據變換到不同的頻帶,用不同的量化器進行量化,達到最優的組合;或進行分布漸近編碼,對某一頻帶信號進行解碼,逐漸擴展到所有的頻帶。
- 模型編碼
- 預測編碼:利用過去和現在和過去出現過點的數據情況來預測未來點的數據
- 原始數據和解碼后的數據是否一致
-
預測編碼:
- 編碼和傳輸的內容:采樣的預測值與其實際值之間的差值
- 編碼和傳輸的內容:采樣的預測值與其實際值之間的差值
-
變換編碼:
- 存在量化器,所以是不可逆編碼
- 存在量化器,所以是不可逆編碼
-
信息熵編碼:
- Huffman編碼
- 算術編碼
算術編碼的特點:- 不必預先定義概率模型,自適應模式具有獨特優點
- 信源符號概率接近時,建議使用算術編碼,效率高於Huffman編碼
- Huffman編碼
-
RLE行程編碼
- 定義:僅僅存儲一個像素值以及具有相同色塊的像素數目
- 行程長度:具有同一顏色的連續像素的數目
- 行程編碼的特點:
- 編碼技術直觀、經濟
- 所獲得的壓縮比取決於數據本身
- 無損壓縮
-
多媒體數據轉換關系
2.2數字圖像編碼
- 彩色空間及其變換
- RGB彩色空間:紅綠藍三原色
- YUV彩色空間
- Y——亮度信號
- U,V——色差信號
- PAL-D制式:我國和德國帶你是系統采用的制式是PAL-D,色彩空間即為YUV
- 25幀
- 優點:亮度信號和色差信號分離,容易使得彩色電視系統與支隊亮度敏感的黑白電視機的亮度信號兼容
- 轉碼標准:CCIR601標准,用於YUV轉RGB
- YIQ彩色空間
- NTSC制式:美國日本帶你是采用的是NTSC制式
- 30幀
- Y——亮度信號
- I,Q是共同描述顏色的色調和飽和度
- 也存在向RGB轉碼的標准,二者的第一行關於R的相同
- NTSC制式:美國日本帶你是采用的是NTSC制式
- 數字圖像文件格式
- 文件頭
- 主要內容包括產生或編輯該圖像文件的軟件的信息以及圖像本身的參數。這些參數必須完整地描述圖像數據的所有特征,因此是圖像文件中的關鍵數據。
- 數據表
- 主要包括圖像數據以及色彩變換查找表或調色板數據。這部分是文件的主體,對文件容量的大小起決定作用。
- 文件體
- 是可選項,可包含一些用戶信息。有的文件格式不包括這部分內容。
- 文件頭