徐英瑾:人工智能研究中的"母语意识" 刍议

———以对于汉语量词的刻画为案例

2018-04-22 22:19 来源:《社会科学战线》2018年1期 作者:徐英瑾

 

  作者简介: 徐英瑾,复旦大学哲学学院教授,研究方向:人工智能哲学、认知科学哲学、维特根斯坦哲学等。

  原发信息:《社会科学战线》2018年1期

  内容提要:从英语思维的角度来讲,现有主流人工智能技术的编程语言与界面语言,对于英语言说者有明显的友好度。隐蔽在人工智能技术的中立面相背后的英语全球霸权,很可能会随着人工智能技术自身的应用得到进一步的扩张。而作为这种趋势的对抗措施,最好的办法就是激活各个非英语民族自身的文化传统,并找到其与合适的人工智能技术刻画方式相结合的方式。汉语中的量词现象,便是一个可以测试上述策略之可行性的具体案例。具体而言,与蒯因基于西语思维对于汉语或日语量词语法

  功能的刻画方式相对照,一种基于汉语自身韵律学特征的演化历程与认知隐喻理论的量词刻画方案,或许能够更合理地说明量词在汉语或日语中发挥的真实功能,而这种刻画方案自身也可以通过“非公理推演系统”而得到算法化的说明。

  关键词:量词;人工智能;隐喻;韵律学

  标题注释:国家社会科学基金重大项目(15ZDB020);国家社会科学基金一般项目(13BZX023)。

 

  一、引论:对于人工智能研究之英语本位主义的反思

  众所周知,自“人工智能”(Artificial Intelligence)这门学科1956年诞生于美国达特茅斯会议之后,英语世界就一直控制着人工智能科学的发展节奏。这就导致了一种看似很难避免的现象:与自然科学的其他学科一样,英语也成为人工智能研究的首选工作语言。而依据笔者浅见,目前英语世界在各项人工智能产品研究方面的领先地位,很可能会以某种隐蔽的方式为英语思维的进一步扩张提供助力,并对其他文化的独立性构成威胁。

  一些读者或许会觉得笔者的上述担忧言过其实,他们或许会说:逻辑与统计学才是编程工作所依赖的“基础知识”,英语只是其皮毛。面对这种指责,笔者的回应是:

  其一,正如人工智能专家麦克德莫特(Drew McDermott)所指出的,在日常生活中人类需要用到纯粹的演绎推理的场合是少之又少,因此,从某种意义上说,不作出某种变通,纯而又纯的演绎逻辑工具对人工智能研究来说是没用的。[1]而人工智能专家对于演绎逻辑规则的“变通性使用”又往往会倒逼他们为系统设置一个非常大的公理集,以便预先为尽可能多的人类常识知识进行编码(并在设置该公理集的前提下,将特定语用环境下系统的对策处理为语境知识与公理知识的“逻辑蕴含物”)。[2]很显然,这种“常识编码”工作若由英语世界的研究人员来完成的话,“英语世界的偏见”就很难不掺杂入其中了。

  其二,与演绎逻辑规则类似,统计学法则的运用并非是在真空之中,而是要以一定量的样本量为前提,而样本空间本身的创制则免不了文化偏见的渗入。譬如,当鲍曼(RSamuel Bowman)带领他的研究团队创制一个能够自动判断语句之间的文本衍推(textual entailment)关系的人工神经元网络系统之时,他们便是用如下方法为训练此类网络提供“样本库”的:给大量说英语的被试者展示特定的画面,并要求后者用英语对画面进行概括,再要求其直接写出与该概括相互矛盾或为其所蕴含的句子,等等。就这样,研究者搜集到了由570 000个英文句子的句对所构成的训练样本库,而每个句对都带有“蕴含”“矛盾”这样的句法关系标注。不过,从某种意义上说,这样的一个样本库也是一个“英语言说者的文化偏见库”,因为我们很难保证其他文化的语言言说者也会在面对同样一个画面时联想到同样的“矛盾句”或“蕴含句”。

  其三,计算机的语言一般分为“机器语言”“编程语言”与“界面语言”三类。“机器语言”是机器运作的内部代码,非专业工程师无法理解。“界面语言”即用户所接触到的语言,一般也就是英语、汉语之类的自然语言。至于编程语言,则是编程人员编制计算机程序时所依赖的工具。虽然从原则上说,编程语言是可以与界面语言相互脱节的(就像机器语言几乎是与任何一种界面语言脱节的那样),但为了方便英语国家内部的工作人员,英语世界研发的编程工具往往就是英语的某种简化形式。比如,1972年由美国贝尔实验室研发的“C语言”的标准词汇就包含了大量英文单词,譬如“auto”“double”“int”“struct”“break”等。这显然为英语国家的编程人员学习此类编程语言提供很多便利。需要注意的是,即使是在与符号主义进路不同的神经元网络技术(及其后继者深度学习技术)的研发过程中,其所依赖的编程工具(如Python)依然带有浓郁的“英语词汇的人工简写模式”的色彩,因此形成对英语国家人士更友好的学习界面。

  目前华语世界的很多计算机软件产品,其实都是英语世界首发产品的“汉化版”,而与此同时,具有母语意识的产品研发案例,却寥若晨星。至于汉语结构自身的独特性所造成的其与英语表述之间的巨大差异,虽在一定程度上为语言学界所重视,却依然没有得到人工智能学界中的自然语言处理专家们的广泛共鸣,这着实不是一种能令人感到安心的现状。有鉴于如上宏观评估,笔者认为我们有必要从语言哲学与认知语言学的角度,重新考量学界对于一些特定的汉语表达式的技术刻画方式,并通过这种重估进一步揭露“西式思维”对于汉语本真结构的扭曲效应。同时,笔者还希望能够以此为契机,为人工智能研究中母语意识的勃发,提供可行的技术实现路径。

  不过,考虑到关于“特定的汉语表达式”的具体案例是如此之多,在一篇篇幅有限的论文中,笔者只能挂一漏万地聚焦于一个能“以小见大”的语言现象,即汉语中的量词现象。

查看余下全文
(责任编辑:李秀伟)
更多学术内容,请关注 www.cssn.cn
';?> ';?>