图像/视频数据在带给人们更加真实和震撼的享受的同时,正在朝着超分辨率、多视角以及可编辑等方向发展,由此带来的数据量也呈现海量剧增的趋势,占据了整个internet通信中90%的流量。此外,近年来WIFI、3G乃至4G网络的发展,综合手机、Pad和超级本等无线终端设备的加入,造就了目前Internet架构的异构性,日益严重的网络拥塞问题及网络异构性等问题给传统的视频图像通信带来了巨大挑战。围绕以上问题,本研究组主要进行了以下几个方面的研究:
1.图像视频高效压缩的关键算法研究
主要展开了分形图像编解码、可伸缩编解码SVC、下一代视频编解码HEVC、基于压缩感知的压缩编码、基于云计算的编解码等研究 。
2.自适应网络传输的图像视频编码的研究
多描述图像/视频编解码、分布式视频编解码、基于FEC的可靠编码,基于LVQ多描述格型矢量量化。
3. 3D图像视频处理
3D图像/视频编解码、多视点视频编解码、基于深度图特性的编解码、2D转3D、深度图估计、视点合成及渲染。
随着计算机科学和网络技术的飞速发展,人们了解、获取、传递、利用信息的方式正在发生着变化。在信息飞速发展的时代,数字产品已从简单的文字发展为一个图文并茂的种类丰富的数字世界,比如图像、视频、流媒体等等。随着图像、视频等感知技术的进步和获取手段的普及,这些数字媒体的数量和种类激增,成为现代和未来各类网络(互联网以及各种传感网)上的重要角色。数字媒体给世界各地的个人、团体乃至国家带来了众多信息,提供了更多服务,成为社会生活的一部分。然而,数字化产品具有的显著特点,比如拷贝无失真、便于修改编辑等,在提供更好的服务的同时也引发了版权纠纷、内容真伪、信息安全等诸多问题。这些问题损害了所有者的利益、促发了信任危机、威胁着个人及国家的安全,已经成为现今社会资源共享和信息互通的发展瓶颈,是亟待解决的重要问题。我们课题组围绕数字媒体内容安全的关键问题主要研究数字水印技术、信息隐写技术以及数字取证技术。
1.数字水印
数字水印技术将数字化信息(也被称为水印)以可见或不可见的方式嵌入到数字媒体(如文本、音频、图像、视频、网格图形及流媒体等)中,水印嵌入后并不影响数字媒体的自身价值和正常使用,而且嵌入的水印信息可以被检测或提取出来。其中的热点问题包括鲁棒水印:能够抵抗各类攻击,比如常用的压缩、滤波操作,以及破坏同步关系的几何形变;可逆水印:在嵌入的信息被提取之后,嵌入水印的媒体能够无失真地恢复为原始媒体;认证水印:将反映内容的关键特征作为水印嵌入到数字媒体中,通过检测和对比水印信息实现内容认证。
2.信息隐写及分析
隐写术和隐写分析是信息隐藏的一个分支更是攻防的两个方面,二者相互独立、相互依存、相互促进。隐写的目的是不仅隐藏信息本身,而且隐藏信息的存在。它具有很高的隐蔽性和安全性,不仅在视觉听觉等感官体验上是安全的,而且在统计意义上也是安全的。
从另一方面,图像等能够作为秘密信息的载体成为消息传递的通道。一些违法分子在图像中藏入敏感信息或者有害国家安全的秘密信息,借助网络的快速传播特点进行危害社会和国家的活动。由于隐含秘密的图像表面上是一幅正常的普通图像,很难引起人们的注意,从而逃避国家安全部门的监管,非法传递危险信息。由于信息隐藏到图像后不可避免地改变了图像的部分特性,因此,通过大量数据的分析,尤其是隐写前后的各种统计特征的变化分析,可以确定数字媒体的安全状态。
3.数字取证
随着社交网络的兴起和发展,图像视频等媒体信息的发布和传播成为互联网的主流和动力。这些多媒体信息是海量数据,很多网络用户没有意识嵌入水印保护自己的作品,或者不想嵌入内容的相关信息。此外,目前互联网已经存在和流传着海量的多媒体内容,不可能将这些内容重新加入水印标记。因此,被动的盲取证技术成为解决这些内容安全性的技术保障。
被动取证(也称为盲取证)不对数字媒体进行预先的水印嵌入,在不依赖任何预签名提取或预嵌入信息的前提下,通过直接分析其内容达到真实性的取证目的。其基本原理是原始多媒体数据本身的固有特征具有一致性和独特性,可作为自身的“固有指纹”,任何篡改操作都会在一定程度上破坏它们的完整性。被动取证通过直接分析数字媒体特征,实现内容真实性的取证鉴别。
数字时代的标志是以图像、视频、声音、文本、图形等为载体的数字媒体已成为人们获取信息的重要方式。由此应运而生的媒体计算技术已成为推动数字媒体产业发展的不可或缺的驱动力。媒体计算是是指借助机器学习、模式识别、现代信号与信息处理以及应用数学等基础理论,实现对图像、视频以及文本等数字媒体信息的深度分析与理解,从而满足国家、社会对数字媒体信息智能化处理的需求。围绕媒体计算理论与方法涉及的一些共性问题,本研究组的主要研究方向包括:计算机视觉、图像/视频分析理解、机器学习理论等。
1.计算机视觉
主要开展目标检测与识别、背景建模、运动目标跟踪以及显著目标提取等方面的研究。
2.图像/视频分析与理解
主要开展视频内容监播、图像拷贝检测、图像/视频检索、图像分类与标注以及基于协同滤波的个性化推荐等方面的研究。
3.机器学习理论
主要开展跨媒体协同计算、共享子空间学习、半监督学习、词典学习以及进化计算等方面的研究。