生成对抗网络(GANs)与数据科学峰会

在计算机视觉领域,已经取得了长足的进步,拥有了先进的图像分类器、目标检测器、文本检测模型等。随着这些技术的成熟,研究者们开始探索该领域的其他方向,其中之一就是生成对抗网络(GANs)。

为了友好地介绍GANs,让谈谈GANs。准备在备受期待的DataHack Summit 2023上点燃热情!加入,从8月2日到5日,在充满活力的班加罗尔的享有盛誉的NIMHANS会议中心。准备好被令人难以置信的研讨会所震撼,这些研讨会将扩展知识,从行业专家那里获得宝贵的见解,并与分享热情的 fellow data enthusiasts 建立联系。保持领先一步,保持对最新趋势的了解,并在数据科学和AI的世界中解锁无限可能。标记日历,确保位置,并准备在DataHack Summit 2023上获得难忘的体验。

点击了解更多详情!

什么是GANs?

都听说过RNNs,它也被用作文本生成器,可以一次生成一个词或一个字母。这种事情可以为图像做吗?是的,有像全可见信念网络(后来更名为自回归模型)这样的技术,它们一次生成一个像素,这可以导致一个完全生成的图像(看起来真实但不是)。但是有没有一种方法可以一次性生成整个图像呢?答案再次是肯定的。GANs就是用于一次性生成整个图像的模型。

GANs如何工作?

GANs由两个不同的组件构成:生成器和判别器。在生成对抗网络中,“对抗”意味着相反或另一种方式,生成器和判别器为了产生逼真的图像而相互竞争。

生成器是一个神经网络,它使用可微分函数,它接受随机噪声作为输入,并将这些噪声通过可微分函数传递,以使它们变得可识别。它试图产生完全依赖于输入噪声的真实图像。但问题是这个生成器如何产生正确的图像呢?它应该首先被训练以产生逼真的图像,对吗?

GANs的训练过程与CNNs不同,训练模型时会使用多个图像及其输出类别,而在GANs中,每个输入图像没有与输出相关联。只是向模型展示一堆图像,并要求模型产生一些来自相同概率分布的新图像。

因此,通过生成器网络传递随机噪声,该网络通过从输入集选择特征来产生输出图像。GANs使用的另一个网络称为判别器,它指导生成器判断产生的图像是真是假。判别器是一个常规的神经网络,只执行分类任务。它用一半的真实图像和一半的假(生成)图像进行训练,其中真实图像被分配接近1的概率,而假图像被分配接近0的概率。

与此同时,生成器的训练正好相反,它试图生成判别器会将其分配到接近1的图像。随着时间的推移,生成器被迫产生更逼真的图像,这些图像可以轻易地欺骗判别器。

GANs训练与CNNs训练相似吗?

普通的CNNs有一些损失/成本函数,它希望最小化这些函数以提高准确性,为此改变参数,从而得到最优权重。训练GANs与CNNs有些相似,但有一些重大变化,这里有两个与生成器和判别器相关的损失/成本函数,这些损失函数是相互对立的。整个GANs的训练过程可以通过值函数来解释,其中生成器希望最小化其值函数,而判别器希望最大化其值函数。

可以使用鞍点来轻松理解值函数。当看到生成器值函数时,通过到达鞍点的最小值来达到最优点,而对于判别器,通过到达反向鞍点的顶部(最大峰值)来实现相同的目标。这解释了为什么GANs训练需要为生成器和判别器都有两个优化技术,它们将同时工作。

在训练中没有使用卷积或循环层,只是矩阵乘法后跟激活函数(leaky relu、tanh和sigmoid是最首选的)。为了更好地训练,应该为生成器和判别器至少有一个隐藏层。GANs的首选优化器是Adam优化器。

GANs的应用

GANs在许多地方都有应用,目前它们只是被用作一种有趣的活动,但在未来可以看到更严肃的用途。目前,GANs在以下用例中被使用:

1. 生成卡通角色:使用GANs,可以通过传递随机噪声来生成卡通角色,这些角色看起来像是图形设计师制作的。 2. 图像到图像的翻译:使用一张普通图像生成卡通化/艺术画作或反之。 3. 面部老化:这可能是在社交媒体应用上经常看到的东西,可以将图像转换为更年轻或更年老的自己。 4. 图像着色:使用GANs,将黑白图像转换为彩色图像。 5. 图像到视频:它可以将静态图像转换为短视频,通过一些算法调整。 6. 3D对象生成:就像2D图像一样,GANs也能够生成3D视频。

想了解更多用例,可以查看这个令人兴奋的博客:

嘿,在离开之前,这里有一些特别的东西。准备好在DataHack Summit 2023上进行一次令人难以置信的数据冒险。已经策划了一个令人难以置信的研讨会阵容,这将彻底改变数据游戏!从“掌握LLMs:训练、微调和最佳实践”、“探索扩散模型的生成性AI”到“构建可扩展的机器学习模型”(等等),这些研讨会绝对是游戏规则改变者。想象自己沉浸在沉浸式、实践性的体验中,这些体验将为提供实用的技能和现实世界的知识,准备立即应用。这是与行业领导者建立联系、建立宝贵联系和解锁激动人心的职业机会的机会。现在就抓住位置,确保在备受期待的DataHack Summit 2023上的位置。

有一些研究论文,可以阅读以获得GANs的数学理解,其中之一是由GANs的创造者撰写的。

生成对抗网络论文:https://arxiv.org/pdf/1406.2661.pdf 改进训练GANs的技术:https://video.udacity-data.com/topher/2018/November/5bea0c6a_improved-training-techniques/improved-training-techniques.pdf
沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485