宋朝名画“虎戴 VR”，在外网火了

大千世界 2022年06月05日 14:22 106 0

　　谁能曾想，宋朝的老虎们，有一天能在国外被玩儿火了。

　　事情是这样的，前不久谷歌不是出了个 AI 创作神器 Imagen 嘛。只要你给一句话，它就能生成符合语意的图片。

　　然后脑洞大开的国外网友们，不按套路地给 Imagen 出了道题：

　　给宋代的东方老虎佩戴 VR。

　　Imagen 也没在怕的，“啪的一下”就给出了一幅力作 ——《虎戴 VR》。

　　

宋朝名画“虎戴 VR”，在外网火了-第1张图片-大千世界

　　还别说，这幅《虎戴 VR》还真是有点那味了。不仅是画风上，VR 头戴跟老虎以及整幅画作能够保持一致。就连手柄、双虎嬉戏的感觉也都一步到位地画了出来。

　　然后还有两只老虎戴 VR，手牵着手一起“恰恰恰”的：

　　

宋朝名画“虎戴 VR”，在外网火了-第2张图片-大千世界

　　甚至 Imagen 还别出心裁地设计了个“连线”版 VR(可能在面对面看片吧)：

　　

宋朝名画“虎戴 VR”，在外网火了-第3张图片-大千世界

　　但毕竟在 AI 作画这事上，除了谷歌 Imagen 之外还有很多神器。于是，一场《虎戴 VR》作画大战就此拉开序幕。

　　(猜猜谁家的画更有“心有猛虎，细嗅蔷薇”的味道)

　　DALL-E 也来请战

　　首先来应战的，定然是 OpenAI 家的 DALL・E。

　　网友 Jacob 出于好奇，便用它做了几幅来做比较。

　　

宋朝名画“虎戴 VR”，在外网火了-第4张图片-大千世界

　　首先是满满“定妆照”风格的《虎戴 VR》(很飒啊)：

　　

宋朝名画“虎戴 VR”，在外网火了-第5张图片-大千世界

　　不难看出，DALL・E 的画作和 Imagen 在风格上还是有很大的区别。

　　Imagen 的画作更趋于简约线条风，而 DALL・E 则更多了些许油画的元素。

　　不过在意境方面，DALL・E 也是能够产出“双虎嬉戏”，甚至是拟人的画作：

　　

宋朝名画“虎戴 VR”，在外网火了-第6张图片-大千世界

　　二者相比之下，网友们给出了他们的评价：

　　

宋朝名画“虎戴 VR”，在外网火了-第7张图片-大千世界

　　大多数网友们对谷歌家的 Imagen 更买单。

　　而除了它俩之外，像 AI 绘画神器 MidJourney 也参与到了此次“大战”。不过它的作品，就显得略有些诡异了……

　　

宋朝名画“虎戴 VR”，在外网火了-第8张图片-大千世界

　　DALL·E VS Imagen

　　那么，同样作为 AI 创作神器，最近大火的 Imagen 和 DALL・E 为何画风会截然不同呢?

　　Open AI 的 DALL・E 和谷歌的 Imagen，都可以直接通过文本描述生成类似超现实主义的图像，让机器也能拥有设计师般的创造力。

　　不过，二者的“创作”原理大不相同。

　　DALL・E 2 采用 CLIP 将文本特征映射到图像特征，然后指导一个 GAN 或扩散模型生成图像。

　　所谓 CLIP，是一个在各种图像和文本上训练的神经网络，对生成的多张图片进行排序，挑选出更好的生成结果进行展示。

　　

宋朝名画“虎戴 VR”，在外网火了-第9张图片-大千世界

　　而谷歌的 Imagen 则使用纯语言模型只负责编码文本特征，把文本到图像转换的工作丢给了图像生成模型。

　　语言模型部分使用的是谷歌自己的 T5-XXL 编码器，将训练好的文本冻结。

　　图像生成部分则是一系列扩散模型，先生成低分辨率图像，再逐级超采样。

　　

宋朝名画“虎戴 VR”，在外网火了-第10张图片-大千世界

　　谷歌的 T5-XXL 有 46 亿个参数，而扩大文本编码器的规模，可以有效改善文本到图像的对应关系，和图像的保真度。

　　此外，Imagen 还使用了另一种称为 noise conditioning augmentation 的扩散技术，帮助模型学习已添加的噪声量，从而提高图像的还原性。

　　对比来看，Imagen 似乎比 DALL・E 更具有“写实”的特点：

　　

宋朝名画“虎戴 VR”，在外网火了-第11张图片-大千世界

　　目前，在 Imagen 官网上已涌现出各种新奇的图像。

　　有人给浣熊戴上了宇航员头盔。

　　

宋朝名画“虎戴 VR”，在外网火了-第12张图片-大千世界

　　泰迪熊在这里开始游蝶泳。

　　

宋朝名画“虎戴 VR”，在外网火了-第13张图片-大千世界

　　还有老鹰型的巧克力冰淇淋(嗯，还挺应景)。

　　

宋朝名画“虎戴 VR”，在外网火了-第14张图片-大千世界

　　截至目前，Imagen 和 DALL・E 都还在调试阶段，尚未向公众开放。

　　One More Thing

　　这次《虎戴 VR》AI 作画大战中，也不乏有失败的作品。

　　例如有网友就给出了用 DALL・E mini 来生成的示例。

　　

宋朝名画“虎戴 VR”，在外网火了-第15张图片-大千世界

　　不难看出，在这版中的《虎戴 VR》中，并没有任何 VR 的出现，而且老虎的面部基本上都是模糊不清。

　　据网友描述，他在生成的过程中，只是把“北宋”改成了“南宋”：

　　画作最难的“形象性”，在这次有所下降。

　　

宋朝名画“虎戴 VR”，在外网火了-第16张图片-大千世界

　　那么你觉得《虎戴 VR》，哪家 AI 神器更强一些呢?

　　参考链接：

　　https://twitter.com/hardmaru/status/1532757753797586944?s=21&amp;t=MhwVN5VXH22zFK7DWQJnCg

标签： VR AI 图像生成

本文地址： https://www.dqsj.net/keji/55350.html

文章来源：大千世界

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至23467321@qq.com举报，一经查实，本站将立刻删除;如已特别标注为本站原创文章的，转载时请以链接形式注明文章出处，谢谢！

上一篇谷歌 Pixel 7 Pro 显示驱动曝光：搭载 1440p 屏幕，可手动降至 1080p

下一篇新款沃尔沃 XC40 纯电版上市：续航最高 529 公里，补贴后售 26.7 万元起

抱歉，评论功能暂时关闭!