学术讲座-基于深度学习的图像压缩综述

19.09.2018  12:42
基于深度学习的图像压缩综述
信息科学与工程学院
梁杰境内潘正祥院长
自然科学全校师生2018-10-17 10:00
信息学院C1-206
梁杰1992年和1995年获西安交通大学本科和硕士学位,   1998年获新加坡国立大学硕士学位,2003年获美国约翰霍普金斯大学博士学位。2003-2004年任职于微软总部视频压缩部门。2004年起就职于加拿大西蒙弗雷泽(Simon   Fraser)大学,目前是工程科学系教授,并曾任系副主任。研究领域包括图像视频编码、多媒体通信、计算机视觉以及深度学习。先后担任过 IEEE TIP、IEEE   TCSVT、IEEE SPL等期刊的副主编。曾获2014年IEEE   TCSVT最佳副主编奖和2015年加拿大自然科学和工程基金委员会的DAS奖。
近年来,深度学习在许多领域取得了革命性的进展,不仅在众多传统方法性能不尽人意的课题取得了突破,例如图像识别和围棋,也给某些已经被认为研究得很透彻的方向带来了新的希望。图像和视频压缩就属于后者。香农1948年就奠定了这一领域的理论基石。从1988年的H.261标准,   1992年的JPEG,   到最新的HEVC/H.265,图像和视频压缩取得了巨大进步,也催生了YouTube、Netflix、优酷、爱奇艺等流媒体巨头,使视频占据了互联网70%以上的流量。但是目前的图像和视频压缩算法的基本框架却和30年前基本相同。2015年以来,深度学习开始被引入这一领域,短短3年就已经取得可喜的进展,展现了巨大的潜力。本讲座将总结这一领域3年来的进展,并介绍我们提出的一种基于语义分割和图像合成的新型图像压缩框架。该方法将计算机视觉的最新技术引入到图像压缩中,不仅能显著提高压缩性能(某些情况PSNR可提高4-5dB),码流中的语义分割信息还可以有助于别的应用,例如针对感兴趣区域的编码和解码,以及快速精准的图像搜索。