当代“神笔马良”!英伟达黑科技:一句话实时P图

高质量的图片、在英伟达Selene超算上进行训练,这台超算在Green500排行榜上排到世界第二。

生成这些风景画的效果和“手法”,是不是感觉有点熟悉?

没错,大多数人看到GauGAN2的第一眼,可能都会觉得它和OpenAI的DALL·E+CLIP有点像。

今年年初,OpenAI用DALL·E和CLIP两个模型,做了个“图像版”GPT-3,同样能用一句话生成图片。

当代“神笔马良”!英伟达黑科技:一句话实时P图

不过,这两个模型生成的内容其实不太一样。

GauGAN2专注于生成风景照,DALL·E+CLIP则更多地生成具体的物体,例如一把椅子或者一个闹钟等。

当代“神笔马良”!英伟达黑科技:一句话实时P图

这与它们的原理差异也有关系,GauGAN2更加注重“单词与视觉效果”之间的关系,例如“冬天”这种模糊的状态词给照片带来的效果;DALL·E+CLIP则更注重“文字-图像”这种有明确对应关系的物体效果。

据英伟达介绍,GauGAN2不同于“文本-图像”和“分割图像-图像”一类的模型,它所能产生的照片种类更多,质量也会更高。

不过,偶尔也会出现点bug…

比如给出“沙滩(beach)”一词后,有些生成的画面中出现了语言无法描述的事物。

当代“神笔马良”!英伟达黑科技:一句话实时P图

对此,英伟达表示,他们在训练中“完全没有用到任何人像照片”。(所以可能是偶然?)

但这样一来,网友想要的“瑞克摇(Rick roll)”和“鬼畜视频生成”,GauGAN2大概也是没办法实现了。

当代“神笔马良”!英伟达黑科技:一句话实时P图

但是能生成仿佛梦境中才能见到的画面,也吸引了不少人来试玩。

这不,有人就晒出了自己生成的抽象画大作,并表示自己非常喜欢这个模型:

当代“神笔马良”!英伟达黑科技:一句话实时P图

还有人表示,GauGAN2给出了一些建筑设计的新idea啊。

当代“神笔马良”!英伟达黑科技:一句话实时P图

也有网友觉得这种能够自动生成景观的功能,未来Adobe可能也会用上。

当代“神笔马良”!英伟达黑科技:一句话实时P图

或许就是下一个画手利器?

原创文章,作者:kk数码网,如若转载,请注明出处:https://www.kkkz.net/27793.html

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注