人与机器必将走向合作融合

2017-11-05 08:11 来源:文汇报 作者:田渊栋

  阿尔法狗的升级版——阿尔法元拥有自我学习的能力,只学习了三天就打败了阿尔法狗;沙特阿拉伯王国最近刚授予“女性”机器人索菲娅沙特公民身份,使之成为有史以来首个获得公民身份的机器人……人工智能的发展会威胁到人类社会吗? 机器人控制人类的那一天已经逼近了吗?

  大多数时候,恐慌来源于大众对于技术的无知。在人工智能科学家的眼中,目前的人工智能与人类大脑相比,就如同几个简单的符号与一部小说之间的差距。

  阿尔法元的成功只是一种投缘

  阿尔法狗在业内的影响力并不像在大众中那么大。因为在人工智能领域,每个方法都有局限性,没有一种方法是万能的。等到对新出现人工智能的每个部分都有比较清晰的了解时,它的神秘感也就和现在的这些疑惑和担忧一起,烟消云散了。

  阿尔法狗的厉害之处在于结合了工程和科研两方面的工作,通过大量计算资源和工程优化将人工智能在某一个方向推向了极致。它同时借鉴了十年来大家在围棋上以及在计算机视觉上的点滴进展,比如围棋和强化学习方向上蒙特卡罗树搜索、自对弈(俗称“左右互搏”)、随机走子盘面估值、用人工特征加浅层网络进行快速走子、权衡广度和深度搜索、权衡从头探索和先验知识,计算机视觉方向上像卷积神经网络(CNN)、残差网络(ResNet)、旋转翻折样本增强等等。这些都不是“深思”(DeepMind) 团队率先想出来的,而是过去的经验一点点积累起来得到的。只是过去的点滴进步并没有进入公众的视野,而阿法尔狗达成了这最后的一步。

  这个成功有几个先决条件。

  其一是模型和问题相互匹配。对阿尔法狗来说,模型和问题的匹配度非常重要。卷积神经网络和围棋非常匹配,所以仅用490万样本就可以学到超过人类的能力。

  对于人类来说,这种匹配性是通过各种直觉和实验去找的,而机器则可以快速试错,并很快地实现人的想法。若是模型和问题不匹配,那样本再多,用处也不大,因为机器学习中“维数灾难”的问题,要凭暴力填满高维空间,实在不是目前任何数目的计算资源所能搞定的。

  卷积神经网络能和围棋如此投缘,还是因为围棋本身的规则比较纯粹,存在某种内在美,而CNN很适合这种美,一旦适应了,计算机所具备的高速计算能力就可以全面发动,即便从零开始,完全不通过人类棋谱,仅靠左右互搏,也可以成功。路线正确之后,计算机所具备的稳定性、精确性,和超过人类几十亿倍的计算速度叠加起来,这才是使得阿尔法元能在三天内远远超过人类作为一个整体用三千年走过的路程的关键。

  其二是要身处一个完全信息透明的理想世界,并且在做出决策之后,对这个世界的规则、变化和发展有绝对正确的认知。

  围棋每下一子,大家都非常清楚地知道局面会变成什么样子,输赢也非常清楚明白。阿尔法元虽然没有使用人类棋谱,但它已经从人类这里得到了围棋世界的规则,对于过去七步之内双方下了哪些招法也完全知晓。这让它对局面的推演变得非常容易,在先天上就比人类强太多。从零开始到超越人类,这确实非常厉害,但仅仅在围棋世界这个规则分明的地方可以做到。

  第三个条件就是要有大量的计算资源。发表于《自然》杂志的两篇阿尔法元的文章,无一例外都强调了对战时所用的资源数,而有意无意地隐去了训练时所用的资源数。后者从文章(及实验)可以推算,大约在上万台甚至更多。这还仅仅只是复现结果需要的资源数目。而作为开拓者,能成功的路线百中无一,那综合各种探索试错的耗费,最后使用的资源更加是个天文数字了。

  阿尔法狗能如此惊人地处理围棋问题,是因为满足这三个条件,然而人工智能在处理其它问题上,就没有那么容易了。智能对话系统就是个很典型的例子。人类的语言既有基本语法规则,又有大量打破这个规则的例外;既有此时此境下的约定惯例,又有与时俱进的林林总总的变化。一个能与别人对话的智能系统,既要从过去的含糊的交互中深刻了解现在的基本规则,又要时刻更新自己的知识体系,能够抽象计划出说话的大概方案,还要及时推测别人的隐藏状态和世界的发展趋势———这些都是现在人工智能的难点。

  所以说,阿尔法狗在业内的影响力并不像在大众中那么大。因为在阿尔法狗上做出惊人结果的卷积神经网络,早先在计算机视觉上已获得巨大的成功,但让它去拟合含有大量离散特征的广告数据,大家都知道效果不佳。同样,“左右互搏”对其它游戏也有相当不错的效果,但让它去做优化机器翻译,未必有人工标定的数据好。

  相比之下,国外对于阿尔法狗的看法要理性很多,在各大论坛上也有更多技术上的深入探讨。等到大家有实力将阿尔法狗拆解得七零八落,对它的每个部分都有比较清晰的了解时,它的神秘感也就会和现在的这些疑惑和担忧,一起烟消云散了。

  人工智能还无法与大脑中的神经系统相比拟

  脑科学和人工智能本质上都是寻找一个算法,有效构建世界模型。大脑经过长久的进化,固有自己的运行方式,而人工智能则可以在数学原理和大数据的基础上独立发展,就像飞鸟和飞机一样,找到各自的规律。

  现实的神经元是由微分方程描述的连续信号处理器,有精细的时序结构,有电生理、离子通道和神经递质受体,有能量供应和免疫系统。碍于测量的局限和生物系统的复杂性,我们现在对于大脑的单个神经元还没有完全了解清楚,更不用说大量神经元组合在一起的系统了。

  而现有的人工智能算法基本上是和脑科学相互独立的。在各类问题上卓有成效的统计学习方法,比如说线性及非线性拟合方法、最近邻、决策树、随机森林、支持向量机等,在大脑结构中鲜有对应。即便在深度学习中所谓的神经元,也不过是线性叠加及非线性操作的组合,是现实大脑中神经元的极大简化,简化到脑科学家都不承认其为神经元的程度。

  不过,这两门学科之间的确是可以相互启发的。比如CNN的思路,就和大脑中感视野受限的神经元相似。最近,神经网络之父、加拿大多伦多大学计算机科学系教授杰弗里·辛顿试着用大脑中的柱状体思路,去改进现有神经网络的性能;也有学者用统计学习及神经网络的方法,对大脑中某些神经元的行为进行建模。

  我个人的意见是,不管是脑科学也好,人工智能也罢,本质上还是如何找到一个算法有效地构建世界模型的问题。大脑经过长久的进化,固然有自然界的鬼斧神工,但也带着大量增量进化而带来的累赘,不必对它顶礼膜拜,奉为智能的唯一模板。人工智能完全可以在数学原理和大数据的基础上独立发展,就像飞鸟和飞机的区别一样,找到自己的规律。

  以前教科书上高估了人的能力,把人类特殊化了。其实在历史长河中来看,人没有那么特殊,人作为一种智能体,遵从自己的发展规律,在自然进化的基础上,一点点认识自身及完成对自身的改造。而我们被进化赐予的那些优点、缺点和弱点,也会缩写成茫茫历史中的某一页,成为将来叱咤星海的地球文明的注脚。

  我们刚隐约看到了人工智能的一丝月光

  人并不需要恐惧害怕机器,因为机器也需要人。现实世界无比复杂,其中暗含着无法准确预测的未来。在现实世界这个庞然大物面前,机器和人一样渺小,也必然会携手同行。

  站在业内人士的角度,人工智能还有很多问题没有解决。比如,我们可以模糊地说CNN和围棋很匹配,或者CNN和计算机视觉非常匹配,所以放在一起得到了出乎意料的效果。但究竟怎样才算匹配?什么是“匹配”这个词定量及精确的定义? 对于其它问题,什么是最好的模型,需要用什么样的数据?神经网络究竟建模了什么,和我们的认知有什么区别? 这些本质问题都还没有答案,而且目前看来,不论是从工具上还是从观念上看,离摸到答案的边缘还远得很。

  二十世纪初,除了上空有两朵乌云之外,物理学的大厦基本建成;与之相比,人工智能可以说是还处在铅云密布、大雪弥漫的漫漫极夜,人们才隐约看到头顶黑云缝中有那么一点点的月光。我们只是摸黑摸久了,不习惯看到光罢了——其实,太阳还远未升起。

  不过,首先基本肯定的一点是,未来世界必然是人与机器合作,并且逐步融合的世界。在短短十年中,我们都已经离不开电脑和手机,以后如果能有更强记忆、更快推理、更准预测的人工智能产品出现,可以帮助人类看得更远、听得更清,大家一定会争相使用,并在这基础之上制造出更好的物品。试想,如果有装入大脑就可以提高一倍反应速度的芯片,那谁会拒绝?这样的大潮,无人能够反抗。

  所以说,与其害怕,不如融入。人工智能你不做,我不做,总有人做,而做出来之后,就会有极大的竞争优势。现在基于机器学习的广告系统已经是这样了———写好了程序,躺着可以赚钱,而人要做的是如何改进它。这和传统行业需要不停维护才能有稳定利润率相比,已是高了一个境界。以后人工智能做得更好的话,可以自动改进算法,那又是高了一个境界。而且这并非几百年后才会出现的事情,而是在当下就会发生的现实。历史的列车正在加速前进,以前或许还可以小跑跟随,以后只能搭车借力。

  最后,我不觉得人需要去恐惧害怕机器,因为机器也需要人。现实世界暗含着无法准确预测的未来、牵一发而动全身的复杂联系,庞大到不可想象的行动空间,以及千亿亿亿种自洽自足的目标和意义。围棋棋枰上的状态数已远远超过了宇宙中的原子总数,然而它不过是后院的一张茶几,和煦春日下的几粒石子,还有随风飘散的一口香茗。

  在现实世界这个庞然大物面前,机器和人必然会携手同行。

 

  (作者为脸书人工智能研究院研究员)

查看余下全文
(责任编辑:贾伟)
更多学术内容,请关注 www.cssn.cn
';?> ';?>