在阅读有关高端的最新
文章 (“
高端 -将图像缩放到更高的分辨率”)时,这次是关于商业产品Topaz AI Gigapixel,我发表了以下内容:
遗憾的是,这篇文章是一个简单的翻译,我想将其与免费的东西(如waifu2x)进行比较。 我认为,即使waifu2x是为动画设计的,区别也将很难找到。
好吧,由于本文是译文,所以我决定将事情交到我手中。 因此,让我们不要浪费时间,结识一下:
在剪切下,Longrid以及使用Instant 4K,Waifu2x,Lanczos和Topaz Gigapixel AI的高档视频指南。
我们将用自己的眼睛比较它们,因为我们可以通过赢得“额外”百分比来优化图像以用于各种解决方案来分析图像...但是,我们也不会拒绝后者,因此,
MITSU和
VMAF分析的结果将添加到屏幕截图的结果中,因为这两个程序都可以在没有样本的情况下使用视频。 在这种情况下,SSIM,PSNR等不适合我们,因为我们没有可以比较高端结果的真实4K。
内容:
本文中的所有文件,包括未压缩的PNG帧,动画比较,4K H.265样本,表格和FFV1文件,都位于
Google上 。 在
Yandex上镜像。 有3个简单的视频指南,供您使用Adobe Premiere Instant 4K,Waifu2x和Topaz。
1.准备测试材料
测试平台配置:
处理器:Intel Core i7-4980HQ 4.2 GHz
主板:MSI Z97 GAMING 5
(不要问)
内存:32GB DDR3 2400
GPU:NVIDIA GTX 1080ti FE 11GB,核心频率手动设置为1923,内存频率为5602。
SHD:SSD M.2 SATA 850 EVO 250GB上的系统和程序,HDD 2 TB WDC WD40EZRZ上的文件。
根据以下情况进行了升频:
- 如果所选方法直接支持Adobe Premiere视频编辑器的工作,则所有工作都在此编辑器中进行,然后将结果导出到具有GOP 1参数的FFV1编解码器中,以避免任何损失,并仅使用可逆图像压缩。
- 如果选择的方法不支持视频编辑器的工作,则使用简单的bat文件将视频分解为PNG格式的单独帧:
BAT文件,用于将单个框架保存到框架文件夹wmic process where name="cmd.exe" CALL setpriority 16384 @echo off :hugly if "%~1" EQU "" goto mugly ffmpeg -probesize 1000M -i "%~1" -vsync vfr frames\image-%%03d.png shift goto hugly :mugly pause
要将视频分解为帧,只需将此文件放在ffmpeg.exe文件夹中并创建frames文件夹,然后将视频文件直接拖到bat文件中是很平常的事。
之后,将处理后的帧发送到FFMPEG进行混合,并以与第一种情况完全相同的设置导出。
BAT文件,用于将单个帧转换为一个文件,没有声音 ffmpeg -framerate 24 -i image-%%03d.png -vcodec ffv1 -pix_fmt yuv420p -level 3 -g 1 -r 24 photoshop.mkv
-framerate和-r参数负责设置视频帧速率,必须同时指定两者。
在这两种情况下,输出都是带有FFV1编解码器的MKV文件,每10秒钟的视频大约有700兆字节的大小。
使用MediaInfo对文件之一进行分析的结果General
Unique ID : 116184020412676472870756705294056286853 (0x57683A783D4732308C09451184B9EA85)
Complete name : D:\HABR\4K SOURCE\topaz.mkv
Format : Matroska
Format version : Version 4
File size : 1.21 GiB
Duration : 16 s 475 ms
Overall bit rate mode : Variable
Overall bit rate : 630 Mb/s
Writing application : Voukoder 1.2.1 (Premiere) - www.voukoder.org
Writing library : Lavf58.12.100
ErrorDetectionType : Per level 1
Video
ID : 1
Format : FFV1
Format version : Version 3.4
Format settings, GOP : N=1
Codec ID : V_MS/VFW/FOURCC / FFV1
Duration : 16 s 475 ms
Bit rate mode : Variable
Bit rate : 618 Mb/s
Width : 3 840 pixels
Height : 2 160 pixels
Display aspect ratio : 16:9
Frame rate mode : Constant
Frame rate : 23.976 (24000/1001) FPS
Color space : YUV
Chroma subsampling : 4:2:0
Bit depth : 8 bits
Scan type : Progressive
Compression mode : Lossless
Bits/(Pixel*Frame) : 3.107
Stream size : 1.19 GiB (98%)
Default : Yes
Forced : No
Color range : Limited
Color primaries : BT.709
Transfer characteristics : BT.709
Matrix coefficients : BT.709
coder_type : Golomb Rice
MaxSlicesCount : 12
ErrorDetectionType : Per slice
之后,每个文件都在MPC-HC中打开,目的是截取屏幕截图,然后再次使用bat文件将其发送到ffmpeg进行分析:
为了使该脚本起作用,必须在libvmaf支持下构建ffmpeg! ffmpeg.exe -i instant_4k.mkv -i A016_C001_02073O_001.mkv -lavfi libvmaf=model_path=vmaf_4k_v0.6.1.pkl:log_path=vmaf.log:log_fmt=json:psnr=1:ssim=1:ms_ssim=1 -f null -
可以从我到以上Google和Yandex的链接中下载支持VMAF的FFMPEG。
反过来,不需要配置MITSU,完成的bat文件需要对文件进行一些修改(我指出了ffprobe和ffmpeg的完整路径,并且还将cygwin1.dll放入了带有可执行文件的文件夹中)。
接收到的数据导入到Excel中,并转换为精美的图形。
FFV1文件也已通过h265编解码器转换为mp4(以便在保持最大细节的同时最大程度地减小文件大小),并禁用了VBR 25000 kbps和SAO,以期获得足够的质量。
↑返回目录2.测试材料的选择
在本文中,我们考虑各种示例:1080P系列中的片段,手绘动画,甚至是用专业相机拍摄的4K视频,以获取有关使用相关程序的各种情况的客观结果。
处理了以下类型的视频:
- S02E20系列“ 感兴趣的人 ”中的场景,简介:很多计算机图形学,很多移动和计划变更。
- 该系列的同一系列中的场景:从树枝到脸部细节,几乎没有动静,计划有几处更改以及背景和前景中的许多细节。
这两个场景均取自一个分辨率为1920×1080(全高清),H.264编解码器,比特率-12,664 kbps的文件。 这是该系列的相当不错的初始质量。 使用简单的双线性插值(在列表中作为参考表示)将文件放大后,对高档结果进行了比较。 - RED.com的示例视频:以120FPS拍摄的真实4K HD(3840x2160)。 使用Lanczos将视频缩小到1920x1080,然后使用上面列出的程序将视频提高到4K。 帧速率已降低到每秒约24帧。 将结果与从RED文件转换为熟悉的FFV1的源文件进行了比较(ffmpeg拒绝使用RED文件)。
- 从YouTube下载的手绘动画《 狼人的圣书 》,人为地晃动了“相机”,计划有很多变化。 分辨率为1280x720的源文件,WEBM容器,VP9编解码器,比特率1556 kbps。 这是非常低的质量,但是在YouTube上很常见。
↑返回目录3.选定的测试程序
我们将更详细地探讨每种高级方法:
- 红色巨人射手即时4K 13.1.5
付费:是的($ 99)。
与Adobe Premiere集成(不需要将视频分解为帧):是。
质量设置:过滤器类型-最佳,清晰度2,质量25(最大),抗锯齿6。这些是标准设置,但质量除外-手动将其设置为最大。
914个INTRO帧的处理时间:532秒(比常规输出长11倍)。
高档方法:未知(“智能算法”)

Instant Premier 4K插件的界面位于Adobe Premiere 2019程序窗口的左上角。
我们选择目标分辨率(您可以指定自己的分辨率),选择滤镜的类型(我看不出没有选择“最佳”的其他选项),更改或保留默认的“清晰度”(清晰度),“质量”(质量)和“抗锯齿”(平滑),然后导出视频文件并享受结果。
它的运行速度足够快,实际上对GPU和CPU的加载没有比通常的导出更多。 一周前是我的标准高档视频插件。 它对图片的细节进行了一些简单的数学过滤器不常见的更改,因此很可能是AI。 在速度上排名第二。
允许您在渲染视频之前查看结果,调整设置。 为了流畅播放需要渲染,在更改设置几秒钟后,更改会在查看器中可见。 - Lanczos过滤器 (许多人称为Lanczos)。
付费:不。
与Adobe Premiere集成(不需要将视频分解为帧):是的,作为Voukoder插件的一部分。
质量设置:无。
914个INTRO帧的处理时间:54秒(比常规导出长1.13倍),其中不包括将视频转换为单独的帧然后将帧还原为视频所需的时间。
升级方法:非AI。
在Windows下升级视频文件的示例行: ffmpeg -framerate 23.976 -i input.mp4 -vcodec ffv1 -pix_fmt yuv420p -level 3 -g 1 -vf scale=3840:2160 -sws_flags lanczos+full_chroma_inp -r 23.976 lanczos.mkv
没有预览和设置。 可以直接处理视频,而无需将其分解为帧。 ffmpeg的作品很棒。 仅在CPU上,它的工作速度比其他任何人都要快。 - Adobe Photoshop保存详细信息2.0
付费:是的。
与Adobe Premiere集成(不需要将视频分解为帧):否。
质量设置:像文章作者一样,有一个“降噪”参数,设置为100% 。
914个INTRO帧的处理时间:3840秒(比常规导出长80倍),其中不包括将视频转换为单个帧然后再将其重新带回视频所需的时间。
高档方法:未知。

它需要以创建模板“打开文件-调整大小-保存文件”的形式进行初始配置,它直接花费大量时间打开文件并保存它们:所选的帧格式会影响PNG,并且可以在CPU上运行。 速度倒数第二。
使您可以在放大图像并保存之前查看结果。
经验不足的用户可能会在更改颜色空间方面遇到问题:在保存图像后仔细检查颜色配置文件,比较原始图像和高档图像的颜色。 sRGB IEC61966-2.1颜色配置文件最有可能适合您。
- 黄玉Gigapixel AI
付费:是的($ 99)。
与Adobe Premiere集成(不需要将视频分解为帧):否。
质量设置:抑制噪音并消除模糊。 此外,可以启用和禁用“最高质量的AI模型”。 在我们的比较中,包括了这些模型。
914个INTRO帧的处理时间:7680秒(比常规导出长160倍),其中不包括将视频转换为单独的帧然后再将帧恢复为视频所需的时间。
高档方法:AI。

一个相当不错的界面,可以预览结果,它具有30天的全功能试用期,可以非常有效地加载视频卡,并且只能在其上工作。 如果需要,可以在CPU上运行。 与其他相比-最慢。 - 带有UpResNet10配置文件的Waifu2x
付费:不。
与Adobe Premiere集成(不需要将视频分解为帧):否。
质量设置:在Windows下有waifu2x-caffe ,它允许您选择配置文件并调整“降噪”的功能(关闭/ 1/2/3)。 在实验上,我选择了UpResNet10配置文件以显示最佳结果。 噪音消除器设置为AUTO 1。
914个INTRO帧的处理时间:879秒(比常规导出长18倍),其中不包括将视频转换为单独的帧然后再将帧恢复为视频所需的时间。
高档方法:AI。

在GPU上运行的简单界面可能会在初始设置期间引起其他困难(我必须安装cuDNN,这花费了10-15分钟)。 如果需要,可以在CPU上运行。 平均速度,仅领先Photoshop和Topaz。
这不是适合高档视频的程序的完整列表,在下一篇文章中,我将尝试添加更多方法。 在评论中建议您的选择!
↑返回目录4.最后,我们继续观看视频:
4.1文件1:“ INTRO”:
第一章:计算机图形学。
系列中的一帧使用双线性插值进行了放大,并缩小为720P进行预览。主要区别在于:处理地图上文本和标记
的质量,包括整个框架中的网格,以及在框架中央保持“视线”的形状。
JPEG
Instant 4K ,
Lanczos ,
Photoshop ,
Topaz ,
Waifu2x结果带有UpResNet10配置文件和
原始 文件 。动画比较:
MP4 H.264 ,
WEBP 。 也可以
在此处使用 PNG文件和原始帧。 建议不要在Google云端硬盘页面上本地查看视频和帧。
H.265编解码器中的全尺寸4K样本在
这里 (每个〜100MB)。
动画帧中心比较:
MP4 H.264 ,
WEBP 。
让我们从中心的景象开始。 红场:注意两条相交线的行为。 由于我们(在某些地方)正在处理AI,因此我们正在寻找不必要的失真。 Instant 4K对该方格进行了相当有力的更改,为此它从我这里获得了一个减数。 所有其他方法的行为大致相同,最清晰的结果-使用Photoshop。 黄玉-位居第二。 不幸的是,UpResNet10注意到压缩伪像,并决定增加它们。 Lanczos实际上与通常的增长没有区别。
蓝色正方形:跟随圆圈的形状,希望有尽可能平滑的圆圈。 Instant 4K再次添加了间隙并平滑了圆,从而消除了其底部的间隙。 但是,这次他从我这里得到加分。 但是,Photoshop的效果最好。 UpResNet10圈出了太多的细节(网格),可以将其视为工件。
动画文本比较:
MP4 H.264 ,
WEBP 。
我们来看看下面的文字:Lanczos使它变粗了,因此得到了减号。 UpResNet10再次喜欢网格,并再次显示自己比竞争对手更差。 最重要的是,我喜欢黄玉制作的文字。 但是,它大约等于其他方法的结果-已经是一个问题。 那些愿意原谅Instant 4K进行“思考”的人可以对他们发布的文字感到最满意,其余的,我相信将在Topaz和Photoshop之间分配。 就我的喜好而言,后者仍然“扎实”。
地图上的动画网格比较:
MP4 H.264和
WEBP 。
最后一点是地图上的网格。 在这里,除了两个杰出的人-UpResNet10和Topaz,其他人或多或少都表现出了相同。 黄玉杀死了一大堆点和几乎所有的细节。 相反,UpResNet10指出了以前几乎不可见的点。 就个人而言,这两个选项都不适合我,因此我在Instant 4K和Photoshop之间分享了“积分”的胜利。
通常,Photoshop在计算机图形学的静态地图上是赢家,Instant 4K位居第二,UpResNet10位居第三(尽管我们仍然希望从4K中获得更多细节,尽管质量令人怀疑,他还是给了我们)。 黄玉杀死了太多细节,而Lanczos与双线性插值的陈词滥调相去甚远。
我们看下一帧:动画的运动中间。
系列中的一帧使用双线性插值进行了放大,并缩小为720P进行预览。JPEG
Instant 4K ,
Lanczos ,
Photoshop ,
Topaz ,
Waifu2x结果带有UpResNet10配置文件和
原始 文件 。动画比较:
MP4 H.264 ,
WEBP 。 也可以
在此处使用 PNG文件和原始帧。
乍一看,图片是可以预期的:除Lanczos之外的所有选项都提供了更清晰的图像。 我们将特别注意Topaz的细节,因为它已改变了所有情况。 我们将研究真正的,未绘制的演员,以及他的衣服细节以及文字。
动画演员比较:
MP4 H.264 ,
WEBP 。
对于演员,这里的差异确实很小:尽管UpResNet10上次显示(有时是多余的)以前难以看到的细节,但这次仅从下面增加了对角网格的清晰度。 实际上,需要在放大镜下查看Photoshop,Lanczos和Instant 4K之间的差异,即使增加400%也不足以注意到这些差异。 通常,Photoshop和Instant 4K产生的图像稍微清晰一些。 Instant 4K再次进行业余工作-演员的红场上的衬衫领子已更改。 但是,除了Topaz以外,其他方面的明显区别是显而易见的:色带周围的色噪已减少,并且这是唯一在蓝色方块中具有锐度增加的程序。
动画文本比较:
MP4 H.264 ,
WEBP 。
我们移到下面的文本:在这里Photoshop屈服于所有其他放大方法,并产生了与Lanczos相同的图片。 UpResNet10和Instant 4K增加了清晰度,但也以字母形式引入了一些“ gag”。 黄玉再次给出了最清晰的图像,突出了锯齿状的字母(好还是坏,由您决定)和较小的压缩伪影。 再次降低了色彩噪声,并且顶部的大写字母与其他增加方法没有比较。
段中的最后一帧:系列中的
一帧,上面叠加有计算机图形。
系列中的一帧使用双线性插值进行了放大,并缩小为720P进行预览。JPEG
Instant 4K ,
Lanczos ,
Photoshop ,
Topaz ,
Waifu2x结果带有UpResNet10配置文件和
原始 文件 。动画比较:
MP4 H.264 ,
WEBP 。 也可以
在此处使用 PNG文件和原始帧。
动画演员脸部比较:
MP4 H.264 ,
WEBP 。
我们将放大时只考虑右边的演员的脸:黄玉色增加了清晰度,并很好地突出显示了网格,结果,演员的脸变得非常清晰。 Instant 4K和UpResNet10所做的相同,但是消除了较少的模糊(模糊)。 Photoshop也向他们屈服,除非Lanczos超越。 通常,没有人会丢失任何细节,并且Instant 4K并没有进行不必要的更改。
在三个选定的帧中,对我来说赢家是黄玉。 尽管在第一帧中丢失了很多细节,但在最后两个帧中他还是获得了回报。 Instant 4K排名第二,尽管有微小的变化,但在所有三个帧中都有或多或少的稳定锐化。 第三个是用于UpResNet10。 在第一帧中显示了我不喜欢的图片,但是在最后两帧中显示了清晰度的良好提高。 Photoshop在第一帧中开始时表现良好,但在最后两个帧中几乎与通常的增长没有区别。 在所有三个帧中,没有锐化的Lanczos与双线性插值几乎没有区别。
让我们看看MITSU和VMAF会说些什么:
MITSU(全尺寸) ,模糊和噪声的分析结果越小越好。
VMAF分析结果(完整大小) ,越大越好。MITSU报告说,至少所有蓝色都包含由Topaz处理的帧。 但是,包括Lanczos在内的所有其他高级方法在“模糊”方面都有所改善,并越过了5点线,下面的数字告诉我们视频没有太多的模糊。 也就是说,所有高级方法都提高了图像清晰度。
至于噪点,图片则相反-原始图片中的噪点最少,黄玉中的噪点最多。 原则上,这是合乎逻辑的,因为:
- 实际上,所有程序都可能将部分噪声错误地分类为细节并“改进”。
- MITSU可能会将图像的某些细节识别为噪点。
无论如何,我都没有注意到图像中的噪点有任何明显的增加,并且所有值都低于3.5点的边界,也就是说,
根据MITSU文档 ,它们没有可见的噪点。
由于所有帧中的噪声都远低于可察觉的噪声,因此我们将通过“模糊”指示器进行判断。
对于VMAF,此处所有图表基本上都位于最大值100。但是,在VMAF图表中,我们可以看到缩图-例如,在Instant 4K和Topaz中具有相同的外观-只有Topaz跌至下方。 在图表的中间,Instant 4K被UpResNet10取代,UpResNet10与Topaz相比略有下降。 此处,后者的VMAF下降到77,在Photoshop图表的末尾,该值下降到0。同时,在这些帧中没有可见的差异,伪像或“毛刺”。
因此,算法按如下方式分发程序:首先是UpResNet10,第二是Instant 4K,第三是Photoshop。
对于那些希望进行自己的实验或重复我的实验的人,“原始”文件FFV1 MKV 1080P可以在
这里下载。
↑返回目录4.2文件2:“场景1”
第二段:没有计算机图形
的场景,面部和背景的细节。
主要区别:背景细节,面部细节,上面的伪像。
系列中的一帧使用双线性插值进行了放大,并缩小为720P进行预览。JPEG
Instant 4K ,
Lanczos ,
Photoshop ,
Topaz ,
Waifu2x结果带有UpResNet10配置文件和
原始 文件 。动画比较:
MP4 H.264 ,
WEBP 。 也可以
在此处使用 PNG文件和原始帧。
H.265编解码器中的完整4K样本在
此处 (每个〜97MB)。
动画树比较:
MP4 H.264 ,
WEBP 。
首先,考虑背景,或更确切地说是树木:Instant 4K和UpResNet10被证明是大致相同的,增加了一点清晰度,而相比之下,Photoshop则通过平滑图像而丢失了一些细节。 此外,Instant 4K稍微扭曲了树木(请参见红色方块)。 但是黄玉增加了许多清晰度,并从肥皂背景中制作出非常清晰的树木。 Lanczos再次与双线性插值相同。
系列中的一帧使用双线性插值进行了放大,并缩小为720P进行预览。JPEG
Instant 4K ,
Lanczos ,
Photoshop ,
Topaz ,
Waifu2x结果带有UpResNet10配置文件和
原始 文件 。动画比较:
MP4 H.264 ,
WEBP 。 也可以
在此处使用 PNG文件和原始帧。
动画演员对树木背景的动画比较:
MP4 H.264 ,
WEBP 。
现在,另一个镜头是:演员在树木的背景下面对我们。
剧透:您不需要看树,它们没有区别。 因此,我们研究了演员手和脸上的酒杯。
动画演员脸部比较:
MP4 H.264 ,
WEBP 。
对于面部,Instant 4K和UpResNet10再次显示出大致相同的结果,而Photoshop再次丢失了一些细节。
黄玉增加了这些细节,尽管不如背景中的树木那么多。这次没有找到即时4K工件的特征。事实证明,Lanczos比双线性插值法更清晰。动画玻璃比较:MP4 H.264,WEBP。好吧,在最后的比较中,玻璃杯的主要区别在于不喝酒的透明部分。 Topaz再次增加了更多细节,Photoshop再次模糊了图像(蓝色正方形),UpResNet10和Instant 4K的行为大致相同。结果的完全可重复性。毫无疑问,本帧的赢家是Topaz,添加了没有假象的细节(!),第二名是UpResNet10,尽管它增加了一些清晰度,但绝对没有达到Topaz,但是没有像第三名Instant那样添加假象。 4K。 Photoshop采取了最后一项-并未增加,但减少了细节。
系列中的一帧使用双线性插值进行了放大,并缩小为720P进行预览。JPEG Instant 4K,Lanczos,Photoshop,Topaz,Waifu2x结果带有UpResNet10配置文件和原始 文件。动画比较:MP4 H.264,WEBP。也可以在此处使用 PNG文件和原始帧。第二位演员的动画面孔比较:MP4 H.264,WEBP。同一片段的最后一帧:第二个演员。树木,背景和眼镜对我们来说一切都是清晰的,因此在这里我们研究演员的面孔。在这里,结果大致与过去的镜头相对应,但有一个非常重要的警告:黄玉在演员的脸颊上画了些东西我开始注意到它以500%的速度增长,而我只能以1000%的速度看到它:一种非常不愉快的“纹理”,显然不应该存在。所有其他方法的效果大致相同,只有Photoshop再次丢失了细节(但摆脱了白衬衫上的噪音)。业余表演的最后一个地方是黄玉,倒数第二个是Photoshop,其余的则获得光荣的“第一名”。根据对所有三个框架的审查结果,他们都不愿意,但Topaz排名第一。从最后一帧开始,他的举止可能是固定的,但这将花费您更多的时间和很多时间。但是,这个细节在100%的比例上不是很明显,并且在与树木的第一次比较中完美地展示了自己,因此它将是一个赢家。第二个地方是UpResNet10,用于提高清晰度而没有伪像,第三个地方是Instant 4K,用于相同的东西,但具有伪像。 Photoshop在降低图片清晰度方面占据最后位置。MITSU和VMAF呢?
MITSU(全尺寸),模糊和噪声的分析结果越小越好。
VMAF分析结果(完整大小),越大越好。在这里,一切都与第一个视频相同:黄玉的模糊最少,噪点最多。尽管噪点甚至没有再达到1点(不是3.5),所以我们再次注意模糊,每个人都越过了允许的5点的边界。黄玉在这里表现出显着的进步,将模糊率几乎降低了两倍,达到6,而其余的则为10-12点。根据VMAF图,没有观察到下降,除了在VMAF图上,Topaz证明相邻帧中的值不均匀性明显大于其他程序。他将Instant 4K排名第一,将Topaz排名第二,将UpResNet10排名第三。因此,Topaz排名第一,Instant 4K排名第二,UpResNet10排名第三。对于那些希望进行自己的实验或重复我的实验的人,“原始”文件FFV1 MKV 1080P可以在这里下载。↑返回目录4.3文件3:“ 4K源”
RED文件中的一帧转换为FFV1,并缩小为720P进行预览。JPEG Instant 4K,Lanczos,Photoshop,Topaz,Waifu2x结果带有UpResNet10配置文件和原始 文件。动画比较:MP4 H.264,WEBP。也可以在此处使用 PNG文件和原始帧。H.265编解码器中的完整4K样本在这里(每个〜49MB)。第三个比较将如下进行:以相同的分辨率从Adobe Premiere导出分辨率为3840x2160的R3D格式的源文件,但是帧速率从120 FPS降低到23.98 FPS。之后,再次使用双线性插值将获得的FFV1文件缩小为1920x1080的分辨率,然后将生成的文件通过高档程序运行,并以4K分辨率与FFV1文件进行比较,也就是说,比较不是使用双线性插值,和以前一样,但带有原始图片。该文件很短,只有16秒,因此我们将比较一帧。引起您注意的第一个区别是图像的颜色和亮度。我仔细检查了将视频划分为帧的设置,然后使用ffmpeg将这些帧收集为视频:结果是一个-没有算法能够保持颜色和亮度不变,甚至Lanczos也没有。但是,在这种情况下,图像的亮度和颜色对我们不起作用,因此我们将查看图像的清晰度,即汽车的细节,图像和反射。动画汽车比较:MP4 H.264,WEBP。Instant 4K稍微锐化了整个图像,并在方向盘上方绘制了深色反射。此外,所有其他高级方法也都绘制了阴影,这很有趣:以前,只有Instant 4K才“仔细考虑”了细节。也许算法确定了我们看不见的东西-从车身反射的区域过渡。黄玉竭尽全力,消除了整个图像中的噪音(实际上并不总是很好,因为经常会添加/故意留出噪音),并突出显示汽车上的细节,包括图像。但是,无法消除太多的模糊,因此黄玉在许多地方绘制了双轮廓-特别是在文字(蓝色正方形)上。这次UpResNet10令人失望的是增加了帧某些部分的像素,可能是错误地将噪声识别为“特征”(红色正方形)。有什么特点在完全没有AI的Lanczos中观察到了类似的行为。 Photoshop具有中等强度,可以减少噪点并且不会增加太多像素。在这种比较中,对我来说赢家再次是Topaz,Photoshop排名第二,Instant 4K排名第三。让我们继续看图:在这里,我们将SSIM和PSNR添加到图中,因为我们拥有4K原始图像。
MITSU(全尺寸),模糊和噪声的分析结果越小越好。
VMAF分析结果(完整大小),越大越好。
SSIM分析结果(完整大小),越大越好。
PSNR分析结果(全尺寸),越大越好。PSNR将Photoshop,SSIM Lanczos和VMAF Topaz放在首位。第二位的PSNR和SSIM被授予UpResNet10,而VMAF则首选Instant 4K。第三名我们还有很多工作要做,虽然PSNR将Lanczos放在第三名,但SSIM为它提供Instant 4K。 VMAF-Photoshop。同时,VMAF在100个可能的满分中,以100个点对每个Topaz框架进行评估-我检查了两次。MITSU再次显示出熟悉的图片,并告诉我们几乎所有结果上都没有噪音。至于模糊,这里并不是一切都很好-大多数升级程序都保留了原始的模糊性,只有Topaz和UpResNet10脱离了该组,分别下降了4点和2点。两者都无法达到梦5,以求的5,但是结果是。在所有四个指标中,VMAF和MITSU读数与我的印象最为接近,而PSNR和SSIM则更喜欢AI“算术”。根据分析结果,很难清楚地指出获胜者。对于那些希望进行自己的实验或重复我的实验的人,“原始” FFV1 MKV 4K文件可以在这里下载。↑返回目录4.4档案4:“ Youtube”
来自YouTube视频的帧,使用双线性插值进行了放大,并缩小为720P进行预览。从头到尾来自YouTube的视频。初始质量为720P,手绘动画以及相机晃动。质量是可以接受的,但还有很多不足,尤其是在4K显示器上。JPEG Instant 4K,Lanczos,Photoshop,Topaz,Waifu2x结果带有UpResNet10配置文件和原始 文件。动画比较:MP4 H.264,WEBP。也可以在此处使用 PNG文件和原始帧。H.265编解码器中的全尺寸4K样本在这里(每个〜265MB)。第一次比较时,Instant 4K发出的帧的对比度很惊人:颜色和亮度都不同。我从多个Adobe Premiere版本导出了此视频几次,并检查了颜色-Instant 4K坚持在任何设置下更改颜色。最终结果来自启用显示色彩管理的2019版本。动画人脸比较:MP4 H.264,WEBP。如果不增加,除了Instant 4K和Topaz之外,差异是显而易见的,因此让我们仔细看一下脸部。Lanczos的UpResNet10没有任何改进,也很奇怪。 Photoshop减少了图片的遮挡效果,该效果由于压缩过多而出现在原始图片中,而不会丢失任何细节。对于动画来说,此方法是完全可以接受的,我们会在不增加清晰度的情况下删除伪影,通常情况下,图片会变得更好。 Instant 4K增加了伪像的数量并改变了颜色,清晰度也略有增加,这被更多伪像的出现所抵消。另一方面,黄玉展示了我希望从所有其他方法中看到的东西:伪像几乎完全消失了,像是遮挡效果一样,清晰度无法与原始方法或任何其他高档方法相比。冠军当然是黄玉,第二名是Phtoshop,第三个是UpResNet10和Lanczos共享的,因为它们至少没有添加新的工件,这与Instant 4K不同。
来自YouTube视频的帧,使用双线性插值进行了放大,并缩小为720P进行预览。JPEG Instant 4K,Lanczos,Photoshop,Topaz,Waifu2x结果带有UpResNet10配置文件和原始 文件。动画比较:MP4 H.264,WEBP。也可以在此处使用 PNG文件和原始帧。我们继续第二帧:在这里,我们有很多带有伪像的渐变以及面部细节。有趣的是,所有高级方法如何在渐变中计算出伪像,以及寻找不想要的变化。至于左侧渐变色(蓝色正方形)上的伪影,只有Topaz和Instant 4K吸引了他们的注意。尽管第一个几乎完全摆脱了这些障碍,但Instant 4K再次失败,改变了颜色,并使工件比黄玉更引人注目。当然,结果仍然无法与其他结果相提并论:在那里,这些方块绽放并散发出气味。动画人脸比较:MP4 H.264,WEBP。在原始图像中,我们再次出现了宏块涂片,并且我们期望得到与最后一帧相同的结果。 Instant 4K略微调整了块之间的过渡并使它们更平滑,而Photoshop则更糟,与第一次比较不同。但是,处理完Photoshop之后的图像仍然变得更好一些。不幸的是,UpResNet10再次碰到了脸上的污垢,并没有改善屏幕上正在发生的事情,这与Lanczos几乎没有什么不同。但是Topaz再次增加了清晰度,删除了工件,并且没有添加新工件。赢家再次是Topaz,第二名是Instant 4K(我已经适应了颜色变化),第三名是Photoshop。
来自YouTube视频的帧,使用双线性插值进行了放大,并缩小为720P进行预览。JPEG Instant 4K,Lanczos,Photoshop,Topaz,Waifu2x结果带有UpResNet10配置文件和原始 文件。动画比较:MP4 H.264,WEBP。也可以在此处使用 PNG文件和原始帧。第三帧也是最后一帧:在这里,我专门选择了一个较暗的帧,以查看所有程序如何处理暗区中的工件。首先,我想提请注意绿色方块:我们希望所有升级产品的制造商都可以减少该位置的阻塞。不幸的是,安静的Topaz满足了我们的期望,而其他人(包括Photoshop)并没有使工件变得不那么明显。 Instant 4K再次在脚上射击,增加了图像的亮度,甚至伸展了我们以前根本看不到的那些伪像。我想指出的是,我也不太喜欢Topaz在此框架上的效果,我认为它对渐变的影响太大。但是,为此,他消除了几乎所有可见的缺陷,因此根本没有人可以与他进行比较-正如我所说,所有其他缺陷实际上都没有影响到它们。动画服装比较:MP4 H.264,WEBP。由于我们已经看过足够多的面孔,因此我们将考虑衣服的更多细节:在这里,我们目睹了真实的宏块游行,特别是在渐变上。不幸的是,除了Topaz之外,再没有一个提升机使画面更好。Topaz消除了所有渐变并几乎完全消除了阻塞,因此在此帧分析中位居第一。可悲的是,没有人为此镜头分配第二名和第三名。令人惊讶的是,似乎由于动漫和绘画作品的增加而锐化的waifu2x完全无法实现其优势。这让我感到惊讶。从第一个开始,将我的印象与VMAF和MITSU分析的结果进行比较:
MITSU(完整尺寸),“模糊”和“噪声”的分析结果越小越好。
VMAF分析结果(完整大小),越大越好。VMAF几乎按照我的顺序安排了所有高档方法,首先是Lanczos,最后是Topaz。每个人的抽签质量都屡屡下降,黄玉在VMAF指标中跌至最低,在最长的抽签中,除Lanczos之外,其他所有人都落后于他。但是,我在这些框架中没有发现任何异常。好吧,根据模糊指标,MISTU再次证明了黄玉与其他产品之间的巨大差距,以及噪声的轻微增加。根据MITSU的说法,绝对所有高级方法都可以使画面更清晰,而Instant 4K甚至可以减少我们看不到的噪声量。因此,第一名被Instant 4K占据,第二名-UpResNet10,第三名-黄玉。这次我不同意VMAF。“原始”文件FFV1 MKV 720P,对于那些谁希望自己进行实验或重复的,可以下载在这里。↑返回目录5.结果分析
为了确定获胜者,我将使用VMAF指标的结果以及有关每个文件的主观结论。我只是使用每个文件的平均值将VMAF指标相加。关于主观评估,在这里,我将转向有关每个文件的结论,并为每个文件给出第一点为3分,第二位为2分,第三位为1分。之后,我将这些点相加并垂直放置在图形上。
添加VMAF和主观分析(完整大小)的结果越好。根据VMAF指标,Instant 4K最终成为赢家,与仅获得0.58分的第二名Topaz脱颖而出。另一方面,根据主观分析,第一名和第二名之间的距离要大得多-黄玉获得第一名,与第二名的Intsant 4K分开8分,获得了3倍的积分。我的比较赢家是Topaz,第二名是Instant 4K,第三名是UpResNet10。
但是,如果不比较程序的速度和我对程序的评论,就无法完成比较。让我们从第一个开始:
在处理和接收的文件量(全尺寸)上花费的时间。Topaz细节的增加甚至会影响文件的大小,而且影响很大。通常,通过双线性插值法将Topaz文件比其他升频器文件重2倍,比原始文件重4倍。唯一的例外是“ 4K源”文件,其差异小于30%。至于程序的速度,除Topaz和Photoshop之外,所有其他程序的工作速度都非常合理。但是,可以接受什么?如果我们想以每秒25帧的帧速通过Topaz持续2个小时来放大电影,该怎么办?我的电脑需要421小时或17天半的连续运行时间。 40分钟系列赛怎么样?6天是的,具有相同waifu2x的图片有些不同-电影2天,系列16小时。您认为waifu2x所显示的结果值得进行连续两天的渲染吗?我建议对每个人独立回答这个问题。一个月前,对于高档视频,我只使用了Instant 4K,专门用于图像(徽标,有时是照片)waifu2x。 Topaz演示的结果迫使我将其添加到高档程序的集合中,至少是为了放大图像。我经常以不到10秒的时间放大短片,此外,它还可以完美地放大图像-包括图纸和照片。回到电影的主题,以黄玉为例,我只看到一种解决问题的方法:在多台机器上分配用于处理的镜框。
Topaz AI可以运行得更快。有什么收获?禁用“高质量AI模型”可将理论胶卷的处理时间减少4天,但会降低色彩处理的准确性。您可能有兴趣知道在Topaz论坛上,许多人认为这种“精简”模型具有更高的质量。可以在此处查看PNG框架和动画比较。Instant 4K的工作速度非常快,并且显示出了出色的效果(比Topaz之外的其他方法更好,并且更快,更方便)。如所期望的那样,如果没有额外的锐化滤镜进行锐化,Lanczos就没有意义。Photoshop绝对不值得花时间,至少在我使用的设置上。也许如果使用JPEG并用SSD替换所有磁盘,则可以显着提高处理速度。UpResNet10通常,它会播放Instant 4K。但是,如果您不同意他的倡议,则可以尝试用UpResNet10替换Instant 4K。就个人而言,我发现Instant 4K工件没有那么明显。另一方面,使用Instant 4K放大图像至少很奇怪,而且通常根本不方便。因此,可以用视频编辑器替换waifu2x,但不是必须的。可以将任何高档方法称为通用方法吗?也许是的。我认为正确配置的Topaz可以产生比其他高档方法更好的图像。但是,在药膏中没有一桶没有苍蝇的蜂蜜,我们决不能忘记黄玉的性能。↑返回目录6.想要在实践中尝试高级程序的初学者
...首先,我建议您将Instant 4K作为最简单的使用方法。您只需运行该程序,将文件导入其中,从中创建一个“来自剪辑的序列”序列,转到其设置(序列设置),然后将分辨率更改为所需的分辨率。然后,将Instant 4K效果拖到视频轨道上,调整分辨率和其他参数,然后就可以开始导出了。不幸的是,要使用此程序,您需要购买或找到Adobe Premiere,以及插件本身。购买所有这些都是一项非常严肃的投资,我不建议在互联网上搜索“固化”程序。
Adobe Premiere对我的品味不满意我想提请您注意,Premiere不适用于所有视频格式,并且互联网上的电影中有相当一部分会发人深省。对于这种情况,我只能建议使用ffmpeg将电影转换为ProRes之类的东西: ffmpeg -hide_banner -probesize 1000M -i file.mkv -pix_fmt yuv420p -c:v prores_ks -c:a aac -b:a 128k file.mov
下一个是waifu2x:使用“准备测试材料”部分中的BAT文件将视频布置到帧中,在waifu2x中打开文件夹,选择参数(提高分辨率,降低噪声)并开始导出。最后,您只需要将帧和声音带入完整的视频中即可。您可能在配置方面遇到了一些问题,正如我已经写过的,我个人不得不寻找cuDNN,此外,waifu2x需要功能强大的视频卡。如果由于某种原因您无法配置waifu2x,或者您没有足够的GPU功能,请参考Photoshop。在这篇文章中有供其使用足够好的指令。如果您对图像实验感到满意,或者您有很多额外的时间,请使用Topaz试用版:它将在30天内使用所有功能。在试用期结束之前,您只有时间来增加自己喜欢的电影(但这并不准确)。功能强大的waifu2x显卡的要求在此处适用。此外,在使用Topaz或waifu2x时,使用其他甚至最简单的程序可能会遇到问题,因为这两个程序都力争100%占用GPU,从而使其余接口的速度非常慢。操作原理与waifu2x相同。在最后三种情况下,建议您以任何方便的方式提前将音轨与原始视频文件分开。如果这是来自Youtube的简单视频或一部电影的电影-那么,最简单的单行BAT文件即可。如果您“幸运地”尝试有5.1轨道和几种翻译版本的电影,那么这种情况将远远超出本文的讨论范围。但是,寻求者将永远找到。样本声音提取脚本 ffmpeg -i input-video.avi -vn -acodec copy output-audio.aac
在将音频接收到一个文件中之后,并在使用升频器处理帧结束时,应将声音和视频合并到一个文件中。对于初学者,我建议使用有关Photoshop的文章中的脚本: ffmpeg -framerate 24 -i image-%%03d.png -i output-audio.aac -pix_fmt yuv420p -vcodec libx264 -preset veryslow -crf 15 -c:a aac -b:a 128k -r 24 test_4K.mp4
调整了我的脚本,将视频转换为单个帧。请记住将-r和-framerate交换为您的帧速率。另外,使用PNG时,指明所需的视频颜色空间也无妨:-pix_fmt yuv420p 其他人应该研究H.265(更小尺寸和更高质量)和H.264(更快)的参数和设置。可以在此高档文章中找到有关FFMPEG的更多脚本选项。↑返回目录7.计划下一篇文章和向读者提出的问题
在下一篇文章中,我计划为主观测试添加交互性,以便读者直接评估某些高级方法,为此,我将使用MSU视频质量测量工具。但是我需要了解是否可以自由使用H.265并更强地压缩文件,否则我将不得不使用H.264。请进行以下调查,并注意您的PC是否可以播放H.265而不会丢失帧(“滞后”)。另外,我计划考虑超分辨率卷积神经网络模型(SRCNN)和高效子像素卷积神经网络模型(ESPCN)。- Lanczos, sharpening. ? ? , Lanczos , , sinc?
- waifu2x ? CUnet? Y? , ?
- Photoshop?
- «, » Topaz, «, »?
- , ?
- MITSU? , , Noise Blockiness?
↑