DDPM
更新日:2025年12月18日
1. 概要
DDPM(Denoising Diffusion Probabilistic Models)は、データに徐々にノイズを加える拡散過程と、ノイズを除去する逆過程を学習する生成モデルである。GANに匹敵する画像品質を安定した学習で達成し、Stable Diffusion、DALL-E 2、Midjourney等、現代の画像生成AIすべての基盤となった。
2. 研究の背景
GANは高品質な画像を生成できるが、学習が不安定で、モード崩壊(特定のパターンのみを生成する)の問題があった。拡散モデル自体は以前から提案されていたが、画像生成における有効性は限定的だった。安定した学習と高品質な生成を両立する手法が求められていた。
3. 提案手法
拡散過程(forward process)では、元データx₀に対してT回のステップでガウシアンノイズを徐々に加え、最終的に純粋なノイズxₜに変換する。逆過程(reverse process)では、ノイズxₜから段階的にノイズを除去し、元データを復元する。U-Netアーキテクチャでノイズ予測ネットワークを実装し、単純化された損失関数で学習を効率化した。
4. 実験結果
CIFAR-10でFIDスコア3.17を達成し、当時の最先端GANに匹敵する画像品質を実現した。学習の安定性と生成画像の多様性の両立に成功した。LSUN Bedroom、LSUN Churchデータセットでも高品質な画像を生成できることを示した。
5. 意義と影響
DDPMは拡散モデルの実用性を示した画期的論文である。Stable Diffusion、DALL-E 2、Imagen、Midjourney等、現代の画像生成AIすべての基盤となった。画像生成だけでなく、動画生成、音声生成、3D生成、分子設計など広範な応用に発展した。
6. 関連論文
| 論文 | 関係 |
|---|---|
| Latent Diffusion | 効率化された発展版 |
| GAN | 比較対象の生成モデル |
| VAE | 生成モデルの基盤 |
参考文献
[1] Ho, J., Jain, A., & Abbeel, P. (2020). Denoising Diffusion Probabilistic Models. NeurIPS 2020.
[2] arXiv:2006.11239
免責事項
本ページの情報は筆者の理解に基づくものである。正確な内容は原著論文を参照されたい。
[1] Ho, J., Jain, A., & Abbeel, P. (2020). Denoising Diffusion Probabilistic Models. NeurIPS 2020.
[2] arXiv:2006.11239
免責事項
本ページの情報は筆者の理解に基づくものである。正確な内容は原著論文を参照されたい。
関連書籍
リンク