We use cookies to improve your experience with our site.

快速多算子图像缩放与评价

Fast Multi-Operator Image Resizing and Evaluation

  • 摘要: 1.本文的创新点
    本文提出将三种不同的图像缩放算子(接缝焊接、均匀插值、剪切)联合使用,将能量和主导颜色相结合对不同算子的缩放效果进行评价,以达到快速核心内容相关的数字图像缩放的方法。在缩放结果中保护图像的重要区域和整体视觉效果。算法针对的是同一图像在不同分辨率和纵横比的设备上进行显示时的内容变形问题。技术基础是缩放过程中图像信息缺失的计算。
    2.实现方法
    对于给定的图像,首先计算源图像的主导颜色信息,将源图像作为当前图像;量化计算,使用每种算子计算对当前图像进行缩放操作的代价函数值;根据各算子的代价函数值优化选取本次操作所需要使用的算子;使用所选定的算子将当前图像的宽度缩小一个像素,将新图像作为当前图像,记录本次操作所使用的算子并存入操作序列,若图像尺寸已达到目标尺寸,则操作结束。本文算法对于大多数实例可使用固定的参数进行计算,并实现任意尺寸的全自动快速图像缩放。
    3.结论及未来待解决的问题
    在单一缩放技术无法对图像取得满意缩放效果的时候,将多种技术相结合对图像进行缩放便成了比较有效的方法。同时,如何评价缩放结果的好坏以及量化计算结果图与原图的相似度也是图像缩放中的一个重要问题。在本文中,我们构建了快速多算子的图像缩放技术,将接缝焊接、均匀差值和剪切三种算子联合使用,有效利用其各自的优势。我们定义了一个图像能量和主导颜色相结合的算子代价函数,用以评价图像在缩放过程的信息损失,并提出了一个随机优化方法来根据代价函数值选择所需使用的算子。与以往的多算子图像缩放技术相比,本文的技术可以实现的30-200倍的加速,同时保持同等的缩放质量。在未来的工作中,我们将研究新的多算子图像缩放框架,加入更多的算子以提高处理质量,并研究将快速缩放算法扩展至视频缩放的方法。
    4.实用价值或应用前景
    内容相关的图像缩放技术(Content-Aware Image Retargeting/Resizing)是近两年研究的热点问题,在图像处理中加入了更多的视觉感知和目标识别等信息。与传统的不考虑图像/视频内容的缩放方法不同,内容相关的图像缩放技术可以在尽可能保留图像主体不变的情况下压缩或放大其余次要的区域。这一技术可以有效解决同一图像在不同分辨率或纵横比的显示设备上进行播放时的内容形状变形问题。例如,为了让浏览者看到与其屏幕分辨率相匹配的画面,网站设计人员要准备不同尺寸的图像。进一步,也希望将一幅画面在具有不同尺寸屏幕的显示设备上进行满屏显示。普通的图像编辑软件都无法满足这些需求。通常在这些图像编辑软件中,我们只能够使用剪切或者拉伸的功能来调整图像的大小,但通过这类功能很难取得满意的效果。本文中所提出的技术就可以快速有效地解决这类问题。
    本技术可以应用于多个领域,例如网页图像多分辨率设计、广告设计、电影后期制作等。除了任意大小的图像,本技术在视频缩放方面具有应用的潜力。在安全监控录像的处理方面,利用内容相关的缩放技术可快速有效的对重要区域和目标进行定位,同时,利用内容相关技术对监控录像在时域上进行压缩,可大量节约存储空间。另外,此技术在数字娱乐中的视频播放方面也有着重要应用,例如在不同显示设备上进行体育比赛直播时的图像画面自适应缩放,环幕电影制作中的画面拉伸等,具有了很好的转化前景。

     

    Abstract: Current multi-operator image resizing methods succeed in generating impressive results by using image simi-larity measure to guide the resizing process. An optimal operation path is found in the resizing space. However, their slow resizing speed caused by inefficient computation strategy of the bidirectional patch matching becomes a drawback in practical use. In this paper, we present a novel method to address this problem. By combining seam carving with scaling and cropping, our method can realize content-aware image resizing very fast. We define cost functions combing image energy and dominant color descriptor for all the operators to evaluate the damage to both local image content and global visual effect. Therefore our algorithm can automatically find an optimal sequence of operations to resize the image by using dynamic programming or greedy algorithm. We also extend our algorithm to indirect image resizing which can protect the aspect ratio of the dominant object in an image.

     

/

返回文章
返回