为了全面评估LAN的性能,研究团队进行了大量实验,包括量化评估、质量评估和用户研究。这些实验在多个数据集上进行,包括新构建的DID数据集和现有的SDSD数据集。 在量化评估方面,研究团队使用了两个广泛认可的客观评估指标:峰值信噪比(PSNR)和结构相似性(SSIM)。PSNR是正常光照图像可能的最大功率与增强图像功率之间的比率,用于测量两者之间的保真度。SSIM则是一种基于结构信息变化的感知方法,用于预测数字图像和视频的质量。 实验结果显示,LAN在所有指标上都优于其他方法。在DID数据集上,LAN的PSNR值达到29.01,SSIM值达到0.94,明显高于其他方法(最接近的方法PSNR为25.71,SSIM为0.92)。在SDSD数据集上,LAN的PSNR值为27.25,SSIM值为0.85,同样超过了所有其他方法(最接近的方法PSNR为25.27,SSIM为0.82)。这种显著的性能优势(在DID上比所有其他方法高出至少3dB的PSNR,在SDSD上高出至少1.9dB的PSNR)凸显了LAN在低光视频增强方面的有效性。 值得注意的是,自适应光照调整策略在提高模型性能方面非常有效,特别是在场景更加丰富的数据集上。在DID数据集上,使用自适应策略的LAN比使用默认迭代次数的LAN在PSNR上提高了1.73dB,在SSIM上提高了0.02。这表明自适应策略能够更好地适应不同场景的光照需求,产生更自然、更令人满意的增强结果。 在质量评估方面,研究团队对DID和SDSD数据集进行了详细的视觉比较。在DID数据集上,其他方法展现出各种问题:SNR-aware、SMID和Chhirolya等人提出的方法产生色调较暗的图像,导致明显的色彩偏差;SMID还存在严重的噪点问题;LLFlow表现出明显的棋盘状伪影;DRBN和MBLLEN无法有效描绘图像细节;SDSDNet产生带有严重伪影的图像。相比之下,LAN生成的图像保持了良好的亮度、色彩还原和细节保留。 在SDSD数据集上,情况类似:DRBN产生亮度低、增强效果弱的图像;LLFlow表现出明显的棋盘状伪影;Chhirolya等人的方法和SDSDNet产生带有明显伪影或噪点的图像,无法显示特定的详细信息;SNR-aware、MBLLEN和SMID导致显著的色彩偏差,对图像的视觉质量产生不利影响。而LAN在所有这些方面都表现出优异的性能。 对极端样本的视觉比较结果更加凸显了LAN的优势。对于光照极低的视频,大多数方法产生曝光不足的输出;对于光照略低的视频,大多数方法产生过度曝光的输出。而LAN在默认迭代设置下成功获得了更好的结果,并通过自适应光照调整策略进一步改善了亮度。这表明LAN能够更好地适应不同程度的低光条件,产生更自然、更令人满意的增强结果。 每个参与者进行了五组测试,包括三组模型性能测试和两组模型泛化测试,每组测试随机选择三个视频进行比较。模型性能测试使用在DID数据集上训练的模型。参与者首先从LAN以外的四种视频增强方法中随机选择三种,并将它们的结果与LAN的结果进行比较。然后,从五种方法中随机选择两种进行数据集泛化测试,参与者比较在SDSD和DID上训练的每种方法的模型的结果。在每次比较中,参与者同时查看两个视频(称为视频A和视频B),并从照片真实性、亮度、对比度等方面进行比较,做出三种选择之一:"视频A更好"、"视频B更好"或"我无法确定哪个更好"。 用户研究的结果表明,LAN在与其他方法的所有比较中都更受用户欢迎,这表明LAN的结果更加自然和逼真。此外,在DID和SDSD数据集之间的泛化比较中,根据用户反馈,DID数据集在所有方法中都表现出更好的泛化能力。在SDSD上训练的模型对真实捕获的低光视频产生模糊的增强结果,这种模糊主要是由于配对训练数据中的空间对齐不精确造成的。相比之下,在DID上训练的模型产生的增强结果没有这种模糊现象。
为了全面评估LAN的性能,研究团队进行了大量实验,包括量化评估、质量评估和用户研
酸酸甜甜小苏
2025-06-08 03:58:56
0
阅读:0