广告

人工智能要来抢画家的饭碗了?

DeepMind的团队成功以强化学习让AI系统绘出人脸画像,这是一种创造力吗?机器也要来抢艺术家们的饭碗了?

在9月底于英国伦敦举行的深度学习高峰会(Deep Learning Summit)上,DeepMind (ASPENCORE旗下ESM姐妹媒体EETT编按:该公司现隶属于Google母公司Alphabet)的研究科学家Ali Eslami介绍了一个非常有趣的项目,名为“人工智能与创造力”(Artificial Intelligence and Creativity)。WH0esmc

Eslami在DeepMind的团队设置了一个AI代理(agent,一个会采取某种行动的神经网络),以绘制人脸作为挑战,在一台计算机安装绘图程序(Mypaint),让它能试验各种变量,例如选择笔刷、放置(placement)、线压(line pressure)以及颜色等。该AI代理被馈入未标记的人脸照片训练数据集,而结果是令人惊讶的逼真。WH0esmc

以未标记人脸照片训练的AI代理所绘制出的人脸。WH0esmc

ec19d1154735b6754ac2dfb8dbc36e75.jpgWH0esmc

(来源:DeepMind)WH0esmc

Eslami的团队是利用了强化学习(reinforcement learning)技术。今日大多数的AI系统是采用监督式学习(supervised learning),所馈入的数据是以某种方式标记过的,因此系统能将结果与标准答案进行比对;相反的,非监督式学习则是馈入未标记的训练数据,让系统尝试以自己的方式去辨别特征。WH0esmc

强化学习就是某种形式的非监督式学习,在训练过程中,有被称为鉴别器(discriminator)的第二个AI代理对结果提供回馈,好让负责创造的AI代理去学习。在产生影像的情境中,该鉴别器可能会比较产出的影像与训练数据,然后针对是否能辨别出差异提供回馈,这种回馈可能是一种分数,以量化辨别所产生影像与训练数据集之间差异的困难程度。WH0esmc
WH0esmc
强化学习采用两个AI代理,其一负责创造影像,另一个则尝试分辨创造出的影像与实际数据之间像不像。WH0esmc

20191015-101.jpgWH0esmc

(来源:DeepMind)WH0esmc

在DeepMind教导其AI系统如何画图之前,他们已经教过该系统如何写字──去年该AI系统一开始接受的训练是各种英文字母的手写字与字体的影像(采用MNIST与Omniglot数据集),而且系统非常成功地重现了那些字母。WH0esmc

DeepMind团队还很惊讶地发现,若限制笔划数,所产出的结果就很像是人类在匆忙中写出的字迹,点与较小的特征会连在一起;该公司团队还将算法与拿着画笔的机器手臂联机,以产生手写书法。WH0esmc

一旦该AI系统能应付手写字,Eslami的团队就让系统升级以应用更大的网络,并采用更多CPU进行训练。当采用人脸照片做为训练数据集,AI系统绘制出的画像会变得越来越逼真,如下图所示的绘画过程各个阶段。WH0esmc
WH0esmc
AI系统绘制人脸画像的过程。WH0esmc

20191015-102.jpgWH0esmc

(来源:DeepMind)WH0esmc

请注意,该AI系统并没有被提供目标影像,只是创造它认为看起来像人脸的画像,而且计算机并没有看过人类是如何绘图,只是藉由强化学习的尝试错误过程去探索关于绘画的一切。Eslami表示,这里实际上有两个复杂的任务,其一是以高精准度控制笔刷,其二是管理时间, 在过程中权衡其画像结果要看起来有多逼真。WH0esmc

接下来该团队所做的事情是自问:如果我们让任务变得更困难呢?于是他们将笔划的数量限制从1,000减少到20,而让他们惊讶的是,该AI代理仍然能产生虽然更抽象、但看得出是人脸的画像。WH0esmc
WH0esmc
不同超参数(hyperparameters)下的不同AI代理所绘制的人脸“抽象画”样本。WH0esmc

20191015-103.jpgWH0esmc

(来源:DeepMind)WH0esmc

而Eslami表示,那些抽象画最让人震惊的是,该AI代理已经能清楚辨识构成人脸特征的重点──即眼睛、鼻子与嘴巴;他们原本认为AI系统只能透过模仿或是以监督式学习被教导这些抽象画,但强化学习确实也可能达成。WH0esmc

所以AI已经成功学会画图了..但这是一种创造力吗?或者只是随机结果?还有这能算是艺术吗?你可能会争辩,AI代理是利用创造力去尝试以不同的方法呈现人脸,如上面图片中的画像,即使它们看起来都像人脸,其中的差异性还是比相似性更多。WH0esmc

不过事实是,AI系统的意图并不在于将人脸抽象到绘画的最基本元素中,也不是要产生能唤起情感反应的画像,其目标是在于写实,是以画像看起来有多么逼真来评判其成功与否。WH0esmc

此外也会有人争议,AI系统绘制的画像是以高水平的技巧完成,所以这代表AI是有成就的艺术家了吗?当训练过程结束,该系统肯定能产出更好的画像,甚至学着从模糊的笔触开始,在最后添加更犀利的线条;可惜的是,今日对于何为艺术并没有严格的定义,也许这个问题的答案应该由观众们来决定。WH0esmc

编译:Judith Cheng WH0esmc
WH0esmc

(参考原文: Can an AI Learn to Draw?,by Sally Ward-Foxton)WH0esmc
WH0esmc

  • 微信扫一扫,一键转发

  • 关注“国际电子商情” 微信公众号

  • 瑞萨、易灵思、中印云端合作:ProMe系列SoM产品规划图曝

    当今时代,电子系统信息技术已经非常复杂,且电子产品的迭代速度也非常快。从AI演算到信号处理,再到高速传输、低延迟的网络,大量边缘计算无处不在。随着AI模型在边缘和云端的应用日益普及,市场对边缘计算系统开发的要求越来越高。研发工程师不仅要了解嵌入式技术,还要对存储、时钟、高速串口布局、电源的连接等技术都有相应的知识储备。在某种意义上,这增加了开发的时间和人力成本,还带来了一定的技术风险。

  • 2022年NOR Flash产值将成长21%至35亿美元

    国际电子商情22讯 得益于市场需求和平均售价(ASP)强劲增长,NOR Flash市场总量在2021年提高了63%,而这一增长势头预计在2022年得到延续,市调机构在最新报告中预计,该市场可望在2022年再增长21%至35亿美元...

  • 人工智能软件市场规模超300亿,掘金机会有哪些?

    国际电子商情21日讯 咨询机构IDC近日发布《2021年中国人工智能软件及应用市场研究报告》。数据显示,2021年全年中国人工智能软件及应用市场规模达52.8亿美元(约330.3亿元人民币)……

  • 瑞萨宣布全现金交易收购Reality AI

    瑞萨电子9日宣布,已与嵌入式AI解决方案供应商Reality AI达成最终协议,将以全现金交易方式收购后者。交易预计将于2022年年末前完成...

  • 机器视觉走过70年,到了哪个发展阶段?

    计算机视觉就是让计算机或机器理解并解释影像画面、视觉数据,某种程度替代人眼的工作,其早期实验可追溯到上世纪50年代,到70年代有了初步的机器视觉商业应用。现在发展阶段如何?

  • 2022年及以后的5项供应链预测

    在未来三到五年内,我们将看到数字供应链技术以及改善人类决策的技术的采用率有所增加。

  • 数字孪生的供应链优势

    加入数字孪生的公司数量在持续稳定增长。

  • 【有奖调查】2022年Q1(1-3月)电子元器件采购调查开始

    缺货、制裁、停工停产、货运堵塞、俄乌冲突……Q1电子制造业经营压力逐月增大,该如何应对?《国际电子商情》2022年第一季度电子元器件采购调查(3.23-3.31)现已正式启动,诚邀海内外OEM、ODM、EMS等厂商参与本次调查活动...

  • 从冬奥场馆看北斗卫星导航系统的大众市场机遇

    在世界百年未有之大变局的背景下,中国逆势而上,2020年成为全球唯一实现正增长的主要经济体,2021年经济增长将超过预期目标,为世界经济复苏带来暖意的“中国之光”。步入2022年,北京冬奥会拉开帷幕,尽显人文与科技共融的大国风范,引来全世界更多的目光,聚焦中国风采的同时也解读中国机遇。

  • 畅想元宇宙应用的四大发展路径

    近日,AspenCore旗下面包板明星博主爱因迪生,针对元宇宙发表了自己的观点。在他看来,不管增加了多少花俏的概念,元宇宙的核心就是虚拟现实(VR)。他也认为元宇宙主要有四大层次的应用……

  • 美国供应链的假冒IC(双语音频)

    几十年来,电子行业一直受到假冒 IC 的困扰,但由于供应链混乱且许多零件供应短缺,这个问题正变得普遍存在。什么是“假冒”IC,问题有多大,企业如何防范被蒙骗?

  • 元宇宙议题拉货,明年VR/AR设备出货量可望达到1202万台

    国际电子商情24日讯 市调机构预估,随着元宇宙将推动更多厂商投入虚拟世界的建设,社群交流、游戏娱乐、内容创作、虚拟经济以及工业应用等领域都会是近年发展的重心。

近期热点

广告
广告

EE直播间

更多>>

在线研讨会

更多>>