多媒体技术原理及应用
第一章 概论
1.1多媒体技术的概念
- 媒体的定义
- 信息表达和传输的载体
- 人与人之间所赖以沟通以及交流观念,思想或者意见的中介物
- 媒体的分类
- 感觉媒体:通过人的感官直接产生感觉的媒体
- 例如:语言,音乐,自然界的声音,图像
- 表示媒体:加工处理和传输感觉媒体而人为设计的媒体
- 例如:媒体的编码方式——语言,文本,图像编码;
各种传输协议;无线电;红外
- 例如:媒体的编码方式——语言,文本,图像编码;
- 表现媒体:感觉媒体和电信号之间转换的媒体
- 例如:输入表现:键盘,摄像机;输出表现:显示器,喇叭,耳机
- 存储媒体:存放表示媒体,以便于计算机处理加工调用信息编码
- 硬盘,软盘,磁带,CD-ROM
- 传输媒体:物理上传输信息的载体
- 双绞线,同轴电缆,光纤
- 双绞线,同轴电缆,光纤
- 感觉媒体:通过人的感官直接产生感觉的媒体
- 多媒体技术
- 概念:计算机交互式综合处理多种多媒体信息——文本,图形,图像和声音,使多种信息建立逻辑连接,即成为一个系统并且具有交互性。
- 特点:多媒体技术是计算机综合处理声、文、图信息的技术,具有集成性,实时性和交互性。
1.2多媒体技术的发展历程
- JPEG
- 全称:联合图像专家组
- MPEG
- 平均压缩比:50:1
- VCD,DVD的存储格式
- 分类:1,2,4也是音频标准
- MP3是MPEG的子集的音频标准
1.3多媒体技术的研究内容
- 多媒体数据编码、压缩算法与标准
- 多媒体数据存储技术
- 多媒体计算机系统硬件与软件平台
- 多媒体软件开发环境
- 多媒体内容管理
- 超文本与Web技术
- 多媒体系统数据模型
- 多媒体通信与分布式多媒体系统
- 基于Internet的多媒体技术
第二章 多媒体数据编码基础
2.4数据压缩技术
-
数据压缩的基本原理
- 数据冗余:信号数据需要压缩
- 空间冗余:图像数据,颜色分布有序,表面规律的特点反应在数据上是空间冗余
- 时间冗余:前后的视频音频数据前后存在很大的相关性,反应为时间冗余。
- 信息熵冗余/编码冗余:一组数据接待的信息量
- 结构冗余:图像存在很强的纹理结构
- 知识冗余:一部分数据与已有数据表达相同,例如:我在他左边,他在我右边
- 视觉冗余:图像分辨率人眼无法识别出来
- 其他冗余:例如,空间非定常特性所带来的冗余
- 数据冗余:信号数据需要压缩
-
数据压缩方法分类
- 原始数据和解码后的数据是否一致
- 可逆编码:压缩比2:1~5:1之间(Huffman编码,算术编码,行程长度编码)
- 不可逆编码:变换编码,预测编码
- 压缩原理进行划分
- 预测编码:利用过去和现在和过去出现过点的数据情况来预测未来点的数据
- DPCM(差分脉冲编码调制)
- ADPCM(自适应差分脉冲编码调制)
- 变换编码:时域变换到频域空间上进行处理(量化过程发生失真现象)
- 量化与向量化编码:使得整体量化失真最小
- 信息熵编码:Huffman编码,算术编码,Shannon编码
- 子带编码:图像数据变换到不同的频带,用不同的量化器进行量化,达到最优的组合;或进行分布渐近编码,对某一频带信号进行解码,逐渐扩展到所有的频带。
- 模型编码
- 预测编码:利用过去和现在和过去出现过点的数据情况来预测未来点的数据
- 原始数据和解码后的数据是否一致
-
预测编码:
- 编码和传输的内容:采样的预测值与其实际值之间的差值
- 编码和传输的内容:采样的预测值与其实际值之间的差值
-
变换编码:
- 存在量化器,所以是不可逆编码
- 存在量化器,所以是不可逆编码
-
信息熵编码:
- Huffman编码
- 算术编码
算术编码的特点:- 不必预先定义概率模型,自适应模式具有独特优点
- 信源符号概率接近时,建议使用算术编码,效率高于Huffman编码
- Huffman编码
-
RLE行程编码
- 定义:仅仅存储一个像素值以及具有相同色块的像素数目
- 行程长度:具有同一颜色的连续像素的数目
- 行程编码的特点:
- 编码技术直观、经济
- 所获得的压缩比取决于数据本身
- 无损压缩
-
多媒体数据转换关系
2.2数字图像编码
- 彩色空间及其变换
- RGB彩色空间:红绿蓝三原色
- YUV彩色空间
- Y——亮度信号
- U,V——色差信号
- PAL-D制式:我国和德国带你是系统采用的制式是PAL-D,色彩空间即为YUV
- 25帧
- 优点:亮度信号和色差信号分离,容易使得彩色电视系统与支队亮度敏感的黑白电视机的亮度信号兼容
- 转码标准:CCIR601标准,用于YUV转RGB
- YIQ彩色空间
- NTSC制式:美国日本带你是采用的是NTSC制式
- 30帧
- Y——亮度信号
- I,Q是共同描述颜色的色调和饱和度
- 也存在向RGB转码的标准,二者的第一行关于R的相同
- NTSC制式:美国日本带你是采用的是NTSC制式
- 数字图像文件格式
- 文件头
- 主要内容包括产生或编辑该图像文件的软件的信息以及图像本身的参数。这些参数必须完整地描述图像数据的所有特征,因此是图像文件中的关键数据。
- 数据表
- 主要包括图像数据以及色彩变换查找表或调色板数据。这部分是文件的主体,对文件容量的大小起决定作用。
- 文件体
- 是可选项,可包含一些用户信息。有的文件格式不包括这部分内容。
- 文件头