GAN卷土重来:10亿参数的GigaGAN效果堪比扩散模型

来源:程序员客栈

2023-04-22 12:15:00


【资料图】

点蓝色字关注“机器学习算法工程师”

设为星标,干货直达!

自从 DALL·E 2 之后,在图像生成方面扩散模型替代GAN成了主流方向,比如开源的文生图模型stable diffusion也是基于diffusion架构的。近日, Adobe研究者在论文Scaling up GANs for Text-to-Image Synthesis提出了参数量为10亿(1B)的GAN模型:GigaGAN,其在文生图效果上接近扩散模型效果,而且推理速度更快,生成512x512大小图像只需要0.13s,生成16M像素图像只需要 3.66s。同时GigaGAN也支持latent空间的编辑功能,比如latent插值,风格混合,以及向量运算等。

GigaGAN改进了StyleGAN架构,采用两阶段训练策略:一个是64x64的图像生成器和一个512x512的图像超分2器,其图像生成器架构如下所示(这里也是采用CLIP text encoder来引入text condition):GigaGAN在 LAION2B-en和 COYO-700M数据集上训练,其在COCO数据集上的FID达到9.09,超过stable diffusion 1.5,推理速度比stable diffusion快20倍多(2.9s vs 0.13s):GigaGAN除了文生图能力,还可以实现可控的合成,比如风格混合,如下图所示:更多效果图和技术细节见论文https://arxiv.org/abs/2303.05511和网站https://mingukkang.github.io/GigaGAN/

关键词:

GAN卷土重来:10亿参数的GigaGAN效果堪比扩散模型

点蓝色字关注“机器学习算法工程师”设为星标,干货直达!自从DALL·E2之后,在图像生成方面扩散模型替代GAN成了主流方向,比如开源的文生图模[详细]
2023-04-22

月之诗(《樱之诗》魔改同人广播稿)

(中国农业大学书香方塘节目组广播剧稿,《樱之诗》魔改同人,重度OOC)人物:直(男,天才艺术家,因某些原因不再画画。)圭(男,艺术生,梦[详细]
2023-04-22

焦点!奔向各地春色、点燃消费热情——旅游专列人气旺

奔向各地春色点燃消费热情折射经济活力旅游专列人气旺五一假期火车票开售,又到了拼手速的时候,而今年火车站和旅游景点的人山人海来得比以往[详细]
2023-04-22

焦点快看:让安心水流进千万家

4月,夏天的脚步越来越近,云南省丽江市古城区金安镇金足水库的引水渠哗哗作响,日夜供应着金安镇光乐、增明、义新、三古及七河镇羊见村村委会[详细]
2023-04-22

眉山市东坡小学教师在全市小学语文优质课展评活动中获得一等奖|世界焦点

近日,为期两天的“眉山市小学语文任务群视域下单篇精读优质课展评活动”在眉山市东坡区眉师附小举行。东坡小学王秀娟老师作为全区代表之一参[详细]
2023-04-22

世界头条:荣耀首份 ESG 报告:2030 年实现碳达峰,2045 年 100% 使用可再生能源

感谢指股网网友肖战割割、雨雪载途、指股网附荣耀在环保方面的进展:在绿色产品上,荣耀当前已有104款产品获得中国质量认证中心(CQC)的环保[详细]
2023-04-22

天天精选!中国驻英国使馆发言人就所谓“海外警察站”答记者问

问:近日,英媒称英方表示中国或其他国家在英国领土上对外国人进行的任何恐吓都是不可接受的,并声称正在调查此事,以回应所谓中方“海外警察[详细]
2023-04-22

秘鲁前总统托莱多在美国自首!他将被引渡回国接受所涉腐败案审判|世界通讯

据央视新闻4月22日消息,据法新社报道,当地时间4月21日,秘鲁前总统亚历杭德罗·托莱多在美国加州圣何塞联邦法院自首。据悉,他将被引渡回国[详细]
2023-04-22

环球快消息!南华价值启航纯债基金分红 可供分配利润超26亿元

券中社4月21日讯,4月21日南华价值启航纯债基金公告称,以4月12日为基准日进行分红,A份额和C份额可供分配利润分别为14亿元和12 46亿元,分红[详细]
2023-04-22

四创电子:2022年净利同比降64.09% 拟10转3派0.94元-今日视点

四创电子披露年报,2022年实现营业收入27 21亿元,同比下降13 45%;净利润6603 72万元,同比下降64 0[详细]
2023-04-22
版权所有: 华中制冷网 All Rights Reserved
京ICP备12018864号-26
联系邮箱:2 913 236 @qq.com