20

NVIDIA

如果你对机器学习领域有一定了解的话,多半听说过生成式对抗网络(GAN,generative adversarial networks)这种东西。它是近年无监督机器学习最具前景的方法之一,简单来说,就是借由框架中生成器(generator)和判别器(discriminator)之间的相互博弈、学习来输出结果。生成式对抗网络的一大应用范例是生成图片,在训练过程中生成器会根据接收到的随机噪声来生成图片,而判别器则需要判断图片是否真实。前者的目标是尽量骗过后者,后者则需要尽可能区分真图和假图。

在理想状态下,随着学习的深入,生成器将可以做出以假乱真的图片。当判别器难以判定图片真假的时候,我们便能得到一个可用于生成足够真实图片的模型。不过需要注意的是,若想要达到比较理想的结果,一般的生成式对抗网络会需要 5 万到 10 万张训练样本。如果样本过少的话,则会出现所谓的过度拟合问题。结果就是训练出来的模型不具备泛化性,其效果往往只能体现在原有的训练样本上,面对新样本表现便会大打折扣。

b 站视频:https://www.bilibili.com/video/BV14A41147pe?from=search&seid=11585064046458930546

为了解决过度拟合,数据扩增是业界目前采用的主要方法之一。以图片为例,你可以通过翻转、平移、缩放、裁切、模糊、变色、调节灰度等多种方法来扩增图像样本。但是这种办法的潜在缺点,是对抗网络可能会变得更倾向于模仿你在图片上所做的修改,并非真正去生成新的图像,而 NVIDIA 新公布的自适应判别器扩增方案(ADA,adaptive discriminator augmentation)则能有效避免这种情况的发生。

NVIDIA 的这套办法仍会对数据进行扩增,但在执行过程中它有一定的选择性。根据之前发布的论文,NVIDIA 在分析后将图片数据扩增的变换方式分为像素层、几何、颜色、图像空间滤波、噪声和抠图这几个类别。他们在测试后,认为像素层、几何及颜色上的变换相对来说对增加训练数据更为有效,并最终决定将其采用到自适应判别器扩增方案的模型设计当中。在训练时这套方案可以动态抑制过度拟合,从而让整个模型变得更加稳定。

在训练样本数据不足的前提下,NVIDIA 称自己的这套设计能大大提升生成式对抗网络的学习结果质量。在它的帮助下,一些过去未必能真正利用好对抗网络技术的领域也有望寻求到一些新的突破。比如说疑难杂症对应的医学图像,这类资料时至今日都非常有限。原本生成式对抗网络是没有办法基于其进行有效训练的,但自适应判别器扩增方案的出现,就一下子增加了生成样本实际应用的可行性。在接下来的 NeurIPS 大会中,NVIDIA 还会分享更多相关细节,对这方面感兴趣的读者不妨多多关注一下。

相关文章
为您推荐
各种观点

报歉!评论已关闭.