【AI词典】扩散模型 - 一种生成式人工智能算法

AI词典2026-04-21 17:24:00

定义

扩散模型（Diffusion Model）是一种基于概率论的生成式人工智能算法，其核心思想是通过一个渐进式的“加噪”与“去噪”过程来学习数据分布，从而生成全新的、高质量的数据样本。

原理

扩散模型的工作机制可以类比为“复原一幅被逐渐泼洒墨点的画作”。整个过程分为两个阶段：前向扩散与反向生成。

在前向扩散过程中，模型对一张清晰的原始图像（或任何数据）逐步添加微小的随机噪声。经过数百甚至数千步后，图像最终会变成一幅完全随机的、如同电视雪花屏的纯噪声图。这个过程是确定的，旨在破坏数据原有的结构。

关键的反向生成过程则是模型的“学习”与“创造”阶段。模型（通常是一个U-Net结构的神经网络）被训练来学习如何从纯噪声中，一步步地、有策略地“去除”噪声，最终还原出一张符合原始数据分布的新图像。它并非记忆并还原某张具体图片，而是学会了“一幅合理的图片应该是什么样子”的通用概念，因此能够从随机噪声中创造出前所未见的新内容。

应用场景

图像生成与编辑：这是扩散模型最引人注目的应用。用户通过输入文本描述（提示词），模型即可生成高度匹配且细节丰富的图像，如DALL-E 2、Stable Diffusion。此外，它还可用于图像超分辨率、修复、风格迁移和局部编辑（如替换图中物体）。
音频与视频合成：该原理可扩展至时序数据。在音频领域，用于生成音乐、语音或消除背景噪音；在视频领域，用于生成短视频、预测后续帧或提升视频画质，为电影和游戏产业提供强大工具。
科学与医疗成像：在药物发现中，扩散模型可生成具有特定性质的分子结构；在医疗领域，可用于从低质量扫描结果中生成高质量医学影像（如MRI、CT），或合成训练数据以保护患者隐私。

延伸阅读

若想深入了解，建议从2020年的奠基性论文《Denoising Diffusion Probabilistic Models》入手。同时，可以关注开源项目Stable Diffusion的官方文档与社区教程，通过实践理解其潜空间、采样器、引导尺度等关键参数如何影响生成结果。对于数学原理，需要具备概率论和随机过程的基础知识。

Post Views: 44

上一篇【AI词典】视觉语言模型VLM - 能同时理解图像与文本的AI模型

下一篇【AI词典】GAN生成对抗网络 - 通过对抗训练生成数据的深度学习模型

【AI词典】扩散模型 - 一种生成式人工智能算法

定义

原理

应用场景

相关术语

延伸阅读

相关推荐

热门文章

最新文章

热点标签更多

【AI词典】扩散模型 - 一种生成式人工智能算法

定义

原理

应用场景

相关术语

延伸阅读

相关推荐

热门文章

最新文章

热点标签 更多

热点标签更多