用企鹅做出的炸鸡什么样？“毕加索”给出了答案-快科技-科技改变生活

用企鹅做出的炸鸡什么样？“毕加索”给出了答案

狂丸
2021年01月12日 19:17
0

由“企鹅”构成的“炸鸡”长什么样？用“长颈鹿”组成的“鸡”是什么鬼...长颈鸡吗？

你或许觉得这种并不存在的事物过于荒诞，而且靠自身的想象力有点难以描述，但最近，

有AI能把这些东西画出来了。

例如当你给出设定，用“大象”构成的“鸡”，一般人还在愁鸡头应该安排在哪，这款最新的AI已经画完了，而且一口气画了几十张：

用企鹅做出的炸鸡什么样？这个AI给出了答案

情不自禁的想来一个“看懂，掌声”。

没错，OpenAI又整活了，今天要介绍的这位AI界的新晋毕加索正是他们最近训练出的图像生成器，DALL·E。

用企鹅做出的炸鸡什么样？这个AI给出了答案

关于会画画的AI，狂丸之前没少介绍过，但DALL·E有点特别，在一定的框架下，它能按照人类的文字描述，给出画面图像，无论这段描述有多不着调。

如果让你画一幅“一个小白菜宝宝穿着芭蕾舞裙遛狗”，你可能会一脸懵，但DALL·E直接就整出来了：

用企鹅做出的炸鸡什么样？这个AI给出了答案

主角换成皮卡丘也没问题，而且每只狗子都不一样：

用企鹅做出的炸鸡什么样？这个AI给出了答案

所以，这看起来就是一个可以利用文本描述生成图像的AI。人类的指令就是像是完成填空题，有一些可选选项，模式类似：绘制一个“xxx”的“xxx”，比如下图中，选取了“绿色”，得到了绿色的表。

用企鹅做出的炸鸡什么样？这个AI给出了答案（绿色，六边形，钟表）

于是，不同的关键词就组成了千奇百怪的东西，虽然看着有一丝丝沙雕，但其实这款AI在制图方面有着比较全面的功能。

DALL·E都能“画”些什么？

比较基础的就是“控制属性”。我们刚才介绍过，例如“立方体”的“老虎”，通过两个简单的关键词构成的一组词汇，然后生成画面：

用企鹅做出的炸鸡什么样？这个AI给出了答案

“环面”的“水”，很有美感：

用企鹅做出的炸鸡什么样？这个AI给出了答案

还可以“绘制多个对象”，包括他们的空间关系，像是下图：

一个“小”的“红色”的方块，“立”在一个大的“绿色”方块上。

用企鹅做出的炸鸡什么样？这个AI给出了答案

此时AI不仅要将词组正确组合，而且要形成正确的关联，避免混淆。下图是“一只绿色的大象坐在一只红色老鼠身上”，可以感受一下AI的抽象画法：

用企鹅做出的炸鸡什么样？这个AI给出了答案

另外还可以根据“画面的视角”生成图片。

如“美洲狮”“坐在山上”的“鸟瞰图”，当然也可以选择平视或者特写等多个视角选项：

用企鹅做出的炸鸡什么样？这个AI给出了答案

根据“画面风格”变动生成图片，“狐狸”“坐在森林里”的“3D渲染图”：

用企鹅做出的炸鸡什么样？这个AI给出了答案

类似的关键词，还可以换成前几年比较火的低多边形风格，也可以改成像素风格：

用企鹅做出的炸鸡什么样？这个AI给出了答案

用企鹅做出的炸鸡什么样？这个AI给出了答案

还可以生成“横截面图”，这西瓜让AI切的稀碎：

用企鹅做出的炸鸡什么样？这个AI给出了答案

其他的功能还有很多，例如“推理背景细节”，给出一个大概的方向让AI补充画面。

像是“早晨，一只水豚坐在森林里的画”，AI会根据关键词，推断光线一类的需求，然后生成不同风格的“画”这个结果，看效果确实艺术极了：

用企鹅做出的炸鸡什么样？这个AI给出了答案

而我最喜欢的是“合并不相关的概念”。

通常来说，我们组合一个词汇都是用于描述真实存在的事物，例如木质的桌子。不过好玩的是，DALL·E可以将不同概念的对象“强行”缝合，创造出新的东西，举个例子，设置由“蜗牛”组成的“汉堡”，于是就出现了汉堡蜗牛：

用企鹅做出的炸鸡什么样？这个AI给出了答案

感觉类似的生成方式，很适合做设计。下图的关键词是，一个“冰川”“形式”的“茶壶”：

用企鹅做出的炸鸡什么样？这个AI给出了答案

更进一步还可以制作“脑洞插画”，“皮卡丘”“穿着西装”“擤鼻涕”：

用企鹅做出的炸鸡什么样？这个AI给出了答案

“动物与动物之间的嵌合体”，用“长颈鹿”组成的“鸡”：

用企鹅做出的炸鸡什么样？这个AI给出了答案

还有神话中的不太好想象的“猫龙”，在AI眼里，竟然是长成这样的：

DALL-E，是什么？

如果你对去年的GTP-3有印象，就能更简单的理解DALL·E。对，GTP-3就是那个给一些词或者句子，就能够自己写文章的那个AI。

用企鹅做出的炸鸡什么样？这个AI给出了答案

这次的DALL·E也是类似的功能，只不过变成给文字生成图片了。

其本质跟GPT-3一样，还是变压器语言模型。在GTP-3那里，变压器是从“文字到文字”，这个DALL·E则更进一步，变成了“文字到图片”。

是不是很神奇？那么，这个AI又是如何做到的呢？根据DALL·E创造者OpenAI的介绍，实现这个DALL·E，有两个关键的核心。第一个，是接收数据流进行训练。DALL·E会接收图像和文字所组合的数据流，在模型训练之前，需要对数据进行预处理，一次接受后，会用到1280个标记，其中256个用于标记文本，1024个用于标记图像。

用企鹅做出的炸鸡什么样？这个AI给出了答案

之后，便是对这些数据进行自回归建模，这时候，DALL·E使用了一种名为“自注意力层”以及其中的“注意遮罩”。

怎么理解这个概念呢？大家可以回想一下，平时你在聚精会神地观察某个东西的时候，是不是会忽略周围的东西，这时候，你的注意力都集中在那个事物上？

用企鹅做出的炸鸡什么样？这个AI给出了答案

是的，在AI上，也有类似的概念：注意力机制。简单来说，就是用算法，让AI可以在不同外界需要下去选择性地观察，找出最有用的点。不同的算法得出的不同结果，就类似于咱们对同一事物的不同聚焦点，正如诗云“横看成岭侧成峰”。

而在“自注意力”上，其实与注意力，只差了一个字，它是后者的一种变体。二者的区别，就是“自注意力”减少了对外部信息的依赖，在原本就具有的“注意力”分析上，更侧重于分析数据流内部各标记的相关性。

用企鹅做出的炸鸡什么样？这个AI给出了答案

在这个DALL·E中，这样的不同注意力“遮罩”，一共有着64个。

正是有了足够多关注和分析的角度，保证了训练中同一输入中的每个图像标记，都能或强或弱地与文字标记产生关联。

其次，DALL·E还有另外一个核心：看看自己画得好不好。

你让他画画，他其实会先画出512幅画，不过嘛，AI在给你输出结果前，还会自己斟酌斟酌。

这个使用的便是CLIP网络，这是一个评价系统，它会对自己的作品进行评分，然后根据高低顺序排列，排名靠前的，才会输出给你。

DALL·E画出的沙雕作品

了解完来龙去脉，接下来就是整活时间了。

尽管DALL·E推给你的作品都是精挑细选的，但依然有很多鬼畜他妈给鬼畜开门——鬼畜到家的作品。

例如“地球的横截面”，有的像是Minecraft里的方块，有的像是切了一块火腿。

用企鹅做出的炸鸡什么样？这个AI给出了答案

美洲狮在森林里的黏土动画，狮子看完想离开森林：

用企鹅做出的炸鸡什么样？这个AI给出了答案

我这一辈子已经坐过数千次马桶，但“粉色”、“六边形”马桶还是第一次看见：

用企鹅做出的炸鸡什么样？这个AI给出了答案

同时这样的马桶，它一秒就画了一堆。

用企鹅做出的炸鸡什么样？这个AI给出了答案（共30个，以上为节选）

我们都没有见过“环形”的“西瓜”，但DALL·E给出的答案似乎也有点道理：

用企鹅做出的炸鸡什么样？这个AI给出了答案

而这个“四面体”的“斑马”彻底给我笑吐了。

用企鹅做出的炸鸡什么样？这个AI给出了答案

大自然看完，直呼内行。

用企鹅做出的炸鸡什么样？这个AI给出了答案

还有用长颈鹿构成的乌贼：

用企鹅做出的炸鸡什么样？这个AI给出了答案

下图分别是用熊猫构成的鳄鱼、羊驼、企鹅、鲸、乌贼，哪个最可爱？

用企鹅构成的黄瓜:

用企鹅做出的炸鸡什么样？这个AI给出了答案

由企鹅构成的炸鸡...那这到底算是炸鸡还是炸企鹅？

用企鹅做出的炸鸡什么样？这个AI给出了答案

不过无论是哪一种，都挺萌，而且看起来似乎也挺好吃的。

用企鹅做出的炸鸡什么样？这个AI给出了答案

最后推荐一波DALL·E绘制的最匪夷所思的画作，“企鹅与肉饼”。真正的——“笑死，企鹅肉”。

用企鹅做出的炸鸡什么样？这个AI给出了答案

文章出处：狂丸科学

#企鹅 #炸鸡

好文点赞
水文反对

观点发布网站评论、账号管理说明

热门评论

{for c in All}
         <div class="pluninfo"> 
      
      <div class="pluninfo_head" style="height:auto;">
        <div class="pface">
              {if (c.UserName=="") ||(c.UserName=="guest")} 
              <a href="javascript:;"><img src="//11.mydrivers.com/m/images/v1/qianshui.jpg"></a> 
             {else}
              <a href="javascript:;" onclick="userCommentInfo(${c.UserID});"><img src="//passport.mydrivers.com/comments/getusertouxiang.aspx?uid=${c.UserID}&size=medium"></a> 
              {if (c.UserID== 994982)} <span class="zuozhe">作者</span>{else}
            <span class="jibie">${c.userlevel}</span> {/if}
          {/if}
       </div>
        <div class="plcenter">
          <div class="pluninfo_top1"> <span class="username {if (c.usersex == 2)} girl{else} boy{/if}">  {if (c.UserName=="")||(c.UserName=="guest")} ${c.AUserName}{else}${c.UserName}{/if}</span> 
                 {if (c.Cfrom!="" && c.Cfrom != "mobile")}<span onclick="downapp_float();" title="下载驱家新闻客户端，展示小尾巴" class="span_from dev ${c.Cfrom}">${c.model}</span>{else}<span class="span_from dev {if (c.model!= "手机用户" && c.model!="")} browser{else} ${c.Cfrom}{/if}">{if (c.model!= "手机用户" && c.model!="")}<img src="${c.bwimg}">{/if}${c.model}</span>{/if}   
                </div>
          <div class="pluninfo_top2"><span>${c.IPAdd}</span><span>${c.PostDate}</span></div>
        </div>
        <div class="plright"><img src="//11.mydrivers.com/m/images/v1/plun_moreinfo.svg" alt=""/> 
          <div class="pedite_img" style="display: none;"><img src="//11.mydrivers.com/m/images/v1/triangle-up.svg" alt=""/></div>
          <div class="pedite" style="display: none;">
            <ul>
              <li><a href="javascript:;" onclick="ShowMyReply(${c.ID})" class="huifu">回复</a></li>
              <li> <a href="javascript:;" onclick="userReport(${c.ID},${c.TitleID})" class="jubao">举报</a></li>
              <li><a href="javascript:;" class="taoyan">讨厌</a></li>
              <li> <a href="javascript:;" class="dels">删除</a></li>
            </ul>
          </div> 
        </div>
      </div>
      <div style="clear:both"></div>
       
      
      <div class="pluninfo_center">${c.Content}
           {if (c.RevertContent!="")}
          	  <div class="yinyong">
        <div class=" plunxx_center1">
        <span class="username {if (c.usersex == 2)} girl{else} boy{/if}">{if (c.RevertUserName=="")} ${c.RevertAUserName}{else}${c.RevertUserName}{/if}的原贴：</span>
             ${c.RevertContent}
        </div> 
		  </div>
           {/if}
      </div>
       
      
      <div class="pluninfo_bottom">
        <div class="fayan">
          <ul>
            <li><a href="javascript:;" id="s_${c.ID}"  onclick="sndReq(${c.TitleID},${c.ID},'support',${c.Support})" class="zhichi">支持[${c.Support}]</a></li>
            <li><a href="javascript:;" id="o_${c.ID}"  onclick="sndReq(${c.TitleID},${c.ID},'oppose',${c.Oppose})" class="fandui">反对[${c.Oppose}]</a></li>
            <li onclick="ShowMyReply(${c.ID})">回复</li>
          </ul>
        </div>
      </div>
       
      
      
      <div class="div_huifu" id="div_reply_${c.ID}"></div>
      <div style="clear:both"></div>
       
    </div>
   {/for}

查看全部评论

相关报道

邮件订阅

0 | 0| 0 | 0