生成对抗网络(Generative Adversarial Network,简称GAN)是一种通过让两个神经网络——生成器与判别器——在对抗性博弈中相互竞争与学习,从而生成逼真新数据的深度学习框架。
可以将GAN的训练过程想象成一场“货币防伪专家与造假者”之间的持续较量。系统包含两个核心角色:

生成器:扮演“造假者”的角色。它的输入是一个随机噪声向量,目标是输出一张足以“以假乱真”的数据(如图片)。初始阶段,它生成的数据质量很差。

判别器:扮演“防伪专家”的角色。它的任务是判断输入的数据是来自真实数据集,还是来自生成器伪造的。它会输出一个概率值,表示数据为真的可能性。

训练开始时,生成器生成粗糙的假数据,很容易被判别器识破。但根据判别器提供的“哪里做得不好”的反馈(梯度),生成器会不断改进其造假技术。同时,判别器也在接触越来越多的真假样本中提升自己的鉴别能力。两者在动态博弈中共同进化,直到生成器能生产出判别器难以区分(即概率接近50%)的高质量数据,此时系统达到一种平衡。

理解GAN生成对抗网络,可关联以下概念:深度学习、卷积神经网络、变分自编码器、扩散模型、损失函数。

若想深入了解GAN生成对抗网络,建议从Ian Goodfellow等人于2014年发表的原始论文《Generative Adversarial Nets》开始。此外,可以关注其重要变体,如DCGAN(深度卷积GAN)、CycleGAN(用于无配对图像转换)以及StyleGAN(在生成人脸细节上表现卓越),这些模型针对原始GAN的训练稳定性、控制生成属性等方面做出了关键改进。