搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
新一代高效视频编码技术
0.00    
图书来源: 浙江图书馆(由图书馆配书)
  • 配送范围:
    全国(除港澳台地区)
  • ISBN:
    9787115325396
  • 作      者:
    卓力,张菁,李晓光著
  • 出 版 社 :
    人民邮电出版社
  • 出版日期:
    2013
收藏
作者简介
    卓力 博士,北京工业大学教授、博士生导师1992年毕业于电子科技大学无线电技术系,1998年和2004年分别获得东南大学信号与信息处理专业硕士学位和北京工业大学模式识别与智能系统专业博士学位。2006年一2007年在悉尼大学从事博士后研究工作。作为项目负责人主持了国家自然科学基金、“863”计划等20多个项目的研究工作。发表学术论文180余篇,出版3部专著,译著5部。先后入选“教育部新世纪优秀人才支持计划”、“人力资源与社会保障部留学归国人员科技活动优秀类资助计划”、“北京市科技新星计划”、“北京市优秀人才培养计划”、“北京市中青年骨干教师培养计划”和“北京工业大学京华计划”等。主要研究方向为图像,视频编码与传输、多媒体信息安全和多媒体内容分析等。张菁 博士,北京工业大学副教授、硕士生导师2008年获北京工业大学电路与系统专业博士学位。作为项目负责人主持国家自然科学基金2项,作为主要研究人员先后参加了国家自然科学基金、北京市自然科学基金等项目的研究工作。入选“北京市属高校青年拔尖人才培养计划”和“北京市优秀人才培养计划”。发表学术论文50余篇。出版专著1部,译著2部。主要研究方向为图像,视频信号与信息处理、图像检索等。李晓光 博士,北京工业大学副教授、硕士生导师2003年获得北京工业大学工学学士学位,推免研究生;2005年提前攻博,2008年获得北京工业大学工学博士学位。曾多次赴香港理工大学从事合作研究,2012年在悉尼大学做访问学者。



    作为项目负责人主持了国家自然科学基金青年基金、北京市自然科学基金以及企事业单位委托项目,作为主要研究人员参加了“863”计划、国家自然科学基金等项目的研究工作。发表学术论文40余篇,2008年获得ICNNSP08最佳论文奖。出版专著2部,译著2部。主要研究方向为超分辨率复原、图像/视频信号与信息处理等
展开
内容介绍
  《图形图像新技术系列:新一代高效视频编码技术》是一本关于视频编码技术的学术专著,反映了相关技术领域最新的研究进展。全书共分为12章,首先讨论了视频基础知识、视频质量评价、视频编码技术、人眼视觉特性、码率控制等基础知识,接下来介绍了H.264/AVC、H.264 SVC和HEVC 3个视频编码国际标准,最后介绍了视频编码领域出现的一些新技术,如小波视频编码、基于压缩感知的视频编码、基于人眼视觉特性的编码、基于语义的视频编码、基于超分辨率复原的视频编码以及立体视频编码等。
  《图形图像新技术系列:新一代高效视频编码技术》可供通信与电子系统、信号与信息处理、计算机应用等相关专业的研究人员、工程技术人员、高校教师、研究生和高年级本科生学习参考。
展开
精彩书摘
  3.3  熵编码
  熵编码是纯粹基于信号统计特性的编码技术,是一种无损编码方法,解码后能无失真地恢复原始图像。图像/视频编码方法的效率取决于如何充分利用信源的统计特性。熵编码的基本原理是给出现概率较大的符号一个短码字,而给出现概率较小的符号一个长码字,这样使得最终的平均码长很小。一个精心设计的熵编码器,其输出的平均码长接近信源的信息熵,即码长的下限。熵编码把待压缩的数据流看做简单的数字序列,而并不关心这些数据的具体语义。
  常用的熵编码方法有游程编码、Huffman编码和算术编码3种。
  游程编码主要用于量化后出现大量零系数的情形,利用游程表示连零码,以降低为表示零码所用的数据量。
  Huffman编码是一种不等长的最佳编码方法,这里的“最佳”是指它的平均码长对相同概率分布的信源是所有有效编码方法中最短的。Huffman编码必须预先知道信源的概率分布,这一般是难以做到的,通常采用对大量数据进行统计后得到的近似分布代替。但不同的图像类型的系数分布总有差异,这导致实际应用时无法达到最佳性能。通过利用输入数据序列自适应地匹配信源概率分布的方法,可以较好地改进Huffman编码的性能,但这又带来运算复杂,且不适合硬件实现的缺点。
  算术编码是20世纪80年代发展起来的一种熵编码方法。它的基本原理是任何一个数据序列均可表示成0和1之间的一个问隔,该间隔的位置与输入数据的概率分布有关。可以根据信源的统计特性设计具体的编码器,也可以针对未知概型的信源设计白适应地适配其分布的算术编码器,并且这两种形式的编码器均可以用硬件实现。有关的实现数据表明,在未知信源概率分布的大部分情形下,算术编码要优于Huffman编码。
  Huffman编码与游程编码的效率取决于编码数据的统计特性。前者希望集中出现的符号次数更为频繁;后者则希望游程能经常出现,而且相当长。上述3种熵编码方法均已被现有的各种图像/视频编码标准采纳,以游程编码结合Huffman编码或游程编码结合算术编码的组合形式,用于对变换、预测编码之后图像系数的进一步编码方式。
  应该强调指出的是,熵编码方法是通过无损压缩消除信源的冗余信息,以实现对数据的压缩。如果需要进一步压缩图像/视频数据,就必须考虑人眼的视觉缺陷。通常信源编码方法把初始数据分成相关信息和不相关信息两种,然后再执行消除不相关数据的处理步骤。与熵编码相反,一般的信源编码方法是允许失真的。
  如何划分相关信息与不相关信息,与具体的信源编码方法有关。更重要的是,不同的信源编码技术利用了人眼的视觉缺陷中的不同特点。分离相关数据和不相关数据的一种常用方法是编码转换,把数据转换成更适用于分离目的的数学模型——这就是下一节将要详细讨论的变换编码。
  ……
展开
目录

第1章 视频格式和质量评价
1.1 图像与视频
1.2 彩色空间
1.2.1 RGB彩色空间
1.2.2 YCbCr彩色空间
1.2.3 HSV彩色空间
1.3 抽样格式
1.4 视频格式
参考文献

第2章 视频质量评价
2.1 引言
2.2 视频失真
2.2.1 块效应
2.2.2 模糊效应
2.2.3 振铃效应
2.2.4 噪声
2.3 主观质量评价
2.3.1 测试条件
2.3.2 测试方法
2.3.3 评分类型
2.3.4 主观质量评价方法
2.4 客观质量评价
2.4.1 FR评价标准
2.4.2 NR评价方法
参考文献

第3章 视频编码技术基础
3.1 预测编码
3.2 变换编码
3.2.1 正交变换
3.2.2 K-L变换
3.2.3 离散余弦变换
3.2.4 小波变换
3.3 熵编码
3.4 矢量量化
3.5 混合编码
参考文献

第4章 人眼视觉系统特性
4.1 视觉信息处理的基本机理
4.1.1 视觉感官
4.1.2 视觉通路
4.1.3 视觉中枢
4.1.4 视觉感知
4.2 感兴趣区的人眼视觉系统特性
4.2.1 视觉感兴趣区
4.2.2 视觉掩盖效应
4.3 人眼的视觉注意特性
4.3.1 视觉注意机制
4.3.2 视觉注意模型
4.4 基于视觉注意模型的压缩域感兴趣区检测方法
4.4.1 压缩域视觉显著图提取
4.4.2 视觉注意焦点的选择与转移
4.4.3 压缩域感兴趣区域检测
4.4.4 实验结果及分析
4.5 本章小结
参考文献

第5章 码率控制
5.1 码率控制基本原理
5.2 码率控制模式
5.2.1 恒定码率模式
5.2.2 可变码率模式
5.3 码率控制理论
5.3.1 率失真函数
5.3.2 几种经典的率失真模型
5.4 视频标准中的码率控制算法
5.4.1 VM5码率控制算法
5.4.2 RM8码率控制算法
5.4.3 TMN8码率控制算法
5.4.4 TM5码率控制算法
5.4.5 H.264码率控制算法
5.5 基于H.264的帧层码率控制算法
5.5.1 H.264率失真曲线
5.5.2 H.264率失真模型
5.5.3 基于率失真模型的码率控制
5.5.4 实验结果及分析
参考文献

第6章 H.264/AVC视频编码新技术
6.1 H.264/AVC视频编码基本框架
6.2 基于行的H.264/AVC帧内预测编码
6.2.1 隐式的基于行的帧内预测
6.2.2 实验结果
6.3 H.264/AVC中可变位深的8×;8整型变换和量化编码
6.3.1 H.264/AVC中的8×;8整型变换
6.3.2 H.264/AVC的量化和缩放
6.4 基于无损视频信号统计特性的H.264/AVC自适应熵编码器设计
6.4.1 无损编码中残差数据的统计特性
6.4.2 改进的CAVLC方法
6.4.3 改进的CABAC方法
6.4.4 实验结果及分析
6.5 H.264视频编码的并行可扩展性
6.5.1 H.264中的并行计算
6.5.2 GOP级并行计算
6.5.3 帧级并行计算
6.5.4 片级并行计算
6.5.5 宏块级并行计算
6.5.6 空间域宏块级并行计算
6.5.7 时间域宏块级并行计算
参考文献

第7章 H.264/SVC可扩展视频编码
7.1 引言
7.2 H.264/SVC编码框架
7.2.1 时间可扩展性
7.2.2 空间可扩展性
7.2.3 SNR可扩展性
7.3 H.264 SVC编码性能评估
7.3.1 时间可扩展性
7.3.2 空间可扩展性
7.3.3 SNR可扩展性
7.3.4 其他特点
7.3.5 预处理滤波
参考文献

第8章 HEVC视频编码标准
8.1 HEVC标准的结构
8.1.1 档次、级别和层
8.1.2 视频格式
8.1.3 条带和分片
8.2 HEVC的基本编码框架
8.2.1 HEVC基本编码框架
8.2.2 HEVC的编码单元和编码结构
8.3 HEVC关键技术
8.3.1 帧内预测
8.3.2 帧间预测
8.3.3 变换、缩放和量化
8.3.4 熵编码
8.3.5 环内滤波器
8.3.6 特殊编码模式
8.4 HEVC编码器控制
8.5 HEVC的语法结构
8.5.1 并行解码语法和改进的条带结构
8.5.2 HEVC高级语法
8.6 HEVC编码工具配置
参考文献

第9章 小波视频编码新技术
9.1 引言
9.2 传统离散小波变换的缺点
9.3 双树小波变换
9.3.1 DTDWT
9.3.2 DTDWT滤波器组
9.3.3 三维DTDWT
9.4 粒子集群优化和多目标PSO
9.4.1 粒子集群优化
9.4.2 多目标PSO
9.5 基于多目标PSO的视频编码
9.5.1 编码器模块的修改
9.5.2 实验结果与分析
参考文献

第10章 基于压缩感知的视频编码技术
10.1 引言
10.2 压缩感知理论
10.2.1 稀疏性
10.2.2 不相干性
10.2.3 测量矩阵
10.2.4 CS重建
10.2.5 压缩感知特性
10.3 压缩视频感知
10.4 分布式压缩视频感知
10.5 基于字典的压缩视频感知
10.6 本章小结
参考文献

第11章 基于人眼视觉系统特性的视频编码
11.1 基于视觉敏感度的低比特图像压缩
11.1.1 人眼的视觉敏感度特征
11.1.2 基于视觉敏感度的低比特率图像压缩算法
11.2 基于视觉注意的视频编码方法
11.2.1 所提方法框图
11.2.2 目标检测算法
11.2.3 背景和目标区域的JPEG-2000编码
11.2.4 视频解码重建
11.2.5 实验结果与分析
11.3 基于人眼感兴趣区的视频编码
11.3.1 感兴趣区检测和跟踪
11.3.2 H.264/SVC标准的感兴趣区编码
11.3.3 感兴趣区编码的码率控制
11.4 本章小结
参考文献

第12章 视频编码技术的最新研究进展
12.1 基于语义的视频编码
12.1.1 语义视频编码
12.1.2 用户感知的语义视频编码
12.2 基于超分辨率复原的视频编码
12.2.1 超分辨率复原技术概述
12.2.2 基于超分辨率复原的视频编码技术
12.3 基于HEVC的立体视频编码技术
12.3.1 立体视频编码标准
12.3.2 几种立体视频编码方案
12.3.3 基于HEVC的立体视频编码方案
参考文献

展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证