· 经典赏析 · 正文详情

麻省理工发布2018年全球十大突破性技术(10)

来源:名资汇网 2018-09-07 15:09:28

这两个网络会使用同一个数据集进行训练。其中一个神经网络叫生成网络,它的任务就是依照所见过的图片来生成新的图片,比如一个多长一条手臂的行人。而另外那个神经网络叫判别网络,它的任务则是判断它所见得图片是否与训练时的图片相似,还是由生成模型创造出来的“假货”,比如,判断那个长着三个手臂的人有没有可能是真的?

慢慢的,生成网络创造图片的能力会强到无法被判别网络识破的程度。基本上,经过训练之后,生成网络学会了识别并创造看起来十分真实的行人图片。项技术已经成为了在过去十年最具潜力的人工智能突破,帮助机器产生甚至可以欺骗人类的成果。目前,GAN 已被用于创造听起来十分真实的语音,以及非常逼真的假图片。就拿一个很有名的例子来说,来自芯片公司英伟达的研究人员们用明星照片训练出了一个 GAN 系统,而这个系统则生成了数百张根本不存在、但看起来十分真实的人脸照片。另外一个研究团队则生成了看起来十分逼真的梵高油画。在进一步训练后,GAN 可以对图片进行各种修改,比如在干净的马路上盖上一层雪,或者把马变成斑马。

但是 GAN 的成果并非完美:它们可能生成有两套把手的自行车,或者眉毛错位的脸。但由于有些图片与声音实在太逼真了,一些专家相信,GAN 在某种程度上已经开始理解它们所见到,所听到的世界的底层结构。

而这意味着,随着人工智能开始获得想象力,它们也可能开始理解它在这世界上所看到的东西。Ian Goodfellow发明出GAN后,获得Facebook首席科学家Yann LeCun、NVIDIA创办人黄仁勋、Landing.ai创办人吴恩达等大牛的赞赏,吸引了诸多的机构及企业开始研究。

在中国部分,学术机构致力于研究GAN理论的近一步改良及优化,像是中科院自动化所研究人员受人类视觉识别过程启发,提出了双路径GAN(TP-GAN),用于正面人脸图像合成,而商汤-香港中大联合实验室在国际学术大会上发表多项GAN相关研究成果。

中国企业界则是更倾向于把技术应用在服务中,相关案例不胜枚举,比如,百度使用GAN构建语音识别框架,科大讯飞通过GAN与传统深度学习框架的结合在语音合成领域获得了很大的进展。

标签

上一篇:再见电动车!充气2分钟,续航100公里的新能源车已经量产!

下一篇:华为海思有望超越联发科,排进全球前15