简介:

基于级联扩散的文本到图像生成系统

功能:

支持512x512文本到图像生成

支持2x超分辨率生成

使用Zero-SNR扩散噪声调度

采用联合文本-图像注意力机制

使用VAE,潜在维度为16

支持从512到2048的图像生成

推理精度支持FP16、BF16、FP32

需求人群:

"目标受众为研究人员、开发者和企业,他们需要生成高质量的图像,CogView3提供了一种高效且高质量的文本到图像的转换方法,适合进行内容创作、设计原型制作和研究实验。"

浏览量:69

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图