习 思1,朱 敏2
(1.网易(杭州)网络有限公司,浙江 杭州 310052;2.浙江树人学院 信息科技学院,浙江 杭州310015)
摘要:生成式视觉模型的发展呈现从生成对抗网络(GAN)、变分自编码器(VAE)到扩散模型的技术演进路径.GAN通过生成器与判别器的对抗学习捕获数据分布特征;VAE基于变分推断建立编码与解码的概率框架;扩散模型则依托逐步去噪过程从随机噪声恢复高质量图像.这些模型在图像生成、修复和增强等应用中取得显著成果.然而,训练稳定性、计算效率和生成质量仍是亟待解决的关键问题.同时,随着应用范围扩大,数据偏见、隐私保护和知识产权等伦理问题也须引起足够重视.文章系统分析生成式视觉模型的技术原理、性能评估和伦理挑战,探讨提升模型效率、增强多模态融合及推进负责任开发等未来的研究方向.
关键词:生成式视觉模型;生成对抗网络;变分自编码器;扩散模型
中图分类号:TP18;TP391.41;G206 文献标志码:A 文章编号:2097-6070(2025)02-0025-06