苏丽:虚拟现实技术中延迟问题的现象学反思

2018-05-21 21:09 来源:《哲学研究》 作者:苏丽

 A Phenomenological Reflection on the Latency Problem in Virtual Reality Technology

 

  作者简介:苏丽,西安电子科技大学人文学院哲学系。

  原发信息:《哲学研究》(京)2017年第201711期 第114-120页

  内容提要:延迟问题是虚拟现实技术面临的首要难题。本文通过分析沉浸式虚拟现实系统预设的人体耦合机制和知觉回路,揭示出现行的虚拟现实技术预设了一种知觉要素之间彼此独立外在的积木模型的知觉哲学,与自然知觉经验“图形-背景”的可逆结构背道而驰。通过对梅洛-庞蒂知觉现象学中“身体虚拟维度”这一主题的挖掘和解读,可得出上述差别带来的后果是:人类身体的虚拟维度在现行的、面向对象而非面向经验的虚拟现实系统中被抑制、坍缩,从而使延迟问题成为必然。

  关键词:虚拟现实(VR)/延迟问题/知觉经验/虚拟维度

 

  众所周知,VR(Virtual Reality,虚拟现实)技术,尤其是沉浸式VR,面临的首要难关被称为晕动症(Simulator Sickness),造成晕动症的主要原因是延迟问题(Latency Problem)。(cf.Vafadar,p.1140)延迟问题产生的基本机制是:虚拟环境的投放可以看作一个快速刷屏的过程,当用户在VR环境中转动眼睛、移动头部或身体时,眼前图像应随之改变。但由于CPU(Central Processing Unit,中央处理器)和GPU(Graphics Processing Unit,图形处理器)的运行负荷,二者对人体运动的响应必有所滞后,这样,在我们内耳感受到的运动和眼睛感受到的图像——即GPU绘制输出的新图像之间,出现了错位。轻微的情况下,VR用户可能感觉到“跳帧”或“伪影”,而严重的情况下影像将会摇晃、碎裂,使用较长时间后,容易出现头疼、恶心甚至呕吐等不适现象。

  延迟问题是否可以像人们期待的那样,通过处理器运算速度的提升得到解决?对此,首先应辨析清楚的问题是:延迟问题的原因是关乎当前VR技术理念的系统性问题,还是受制于当前技术水平的阶段性问题?为考查延迟问题是否由当前VR技术的整体理念或技术范式所导致,不妨这样发问,为什么在日常知觉经验中,我们并没有感受到类似的延迟现象?自然事物或景象总是可以或快或慢地、严丝合缝地追随上我们视角的变换和身体的移动,毫无困难地呈现事物显象的更新和变化,在我们转动自己的眼睛、头部和移动身体的时候,并无“跳帧”或“晕动”的体验。那么,自然知觉经验中什么样的机制克服了延迟呢?难道是现实世界运算速度和绘制图像的速率足够快,还是它总是预先料到了我们的运动,又或者如巴尔巴拉(Renaud Barbaras)所言:“神秘的事情是:在物体被知觉到之前,(身体的)运动就仿佛已经接受了并且‘知道’了它。”(Barbaras,p.91)由此又可将问题进一步地分解为:VR知觉与自然知觉在机制或结构上有何本质上的不同之处?VR有赖于或预设了与之耦合的人类知觉的哪些能力?其中是否暗含了一种知觉理念,而这种知觉哲学本身含有对我们人类知觉经验的不当解读,或至少是完善的解读?

  本文将分析VR系统的人机回路中普遍存在的人体与VR系统之间的耦合关系,以及这种耦合关系反映出的当前VR技术预设的知觉哲学及其在哲学理路上的困难。通过对梅洛-庞蒂知觉现象学的挖掘和解读,本文将进一步指出,在自然知觉经验中,人的身体已具有一种“虚拟维度”:由于自然知觉经验中在任何一个层级上的知觉的要素之间,都具有一个“图形-背景”的动态结构,其中图形和背景的关系是可逆的辩证规范作用,这种作用开辟了一个虚拟空间,使得从接受到反馈的延迟转化为我们对事物或场景的紧密相随。而颇具佯谬意味的是,当置身于虚拟环境时,身体运动与知觉、机体与环境处于一种彼此外在的、机械因果的、工具式的关系中,这种“虚拟维度”被数字化的精确控制的虚拟现实设备压制、坍缩或扁平化了,从而使得延迟成为这种面向对象的VR技术范式必然会遇到的难题。要想从根源上消除延迟问题,必须改变当前VR技术的基本哲学理念,从面向对象的VR技术范式转向面向经验的VR技术范式。

  一、VR系统的知觉回路

  VR系统搭建起一个知觉耦合系统闭环(PCSL:perceptual coupled system loop):回路的一支是用户与I/O处理器之间通过头盔显示器、数据手套、数据服物理连接,将用户行为、头部和眼球的转动、身体的轻微或显著运动、位置和方向这些姿态数据通过跟踪检测系统及传感器转换信息输送给I/I处理器;第二支则是I/O处理器将信息传送到图形处理器,绘制生成一个新的虚拟环境图像,使得新用户视点对应的视景与这些姿态数据相匹配,输出给用户并再一次接受用户行为的反馈。所以,在一次行动中,VR系统要做的一个标准的反馈回路任务是:“读取输入、更新模拟、绘制当前虚拟环境。”(Zielinski,etc.)而在上述两个支路形成闭环回路的过程中,则可能造成跟踪检测、成像、同步更新等方面的延迟,即用户的物理运动与HMD(Head Mount Display,头戴式显示器)等设备发射眼睛的更新的光子之间的延迟。

  在VE(Virtual Environment,虚拟环境)中,事物是作为有声、有味、会动的图像被给予用户的。GPU发出的光前波载着数字信息,在视网膜上形成一个投影面,VR“期待”人眼像一架高度聚焦的摄影机,只要打开快门,关于现在世界的印象包括各种细节,便作为感觉材料高度聚焦式地被给予我们,每一帧图像作为刺激通过中央神经系统传输给大脑,大脑记录并根据逆光学机制即时地表征并还原出一个与之对应的三维环境的场景图像。不同于利用透视法描摹三维场景的二维图像,VR利用的是双目视差产生对景象的深度感:因为一个附近较小的对象与一个在远处较大对象可能在视网膜上投射出同样的图像,我们并不能从视网膜影像上提供的有效信息中“读取”出一个场景描述。所以,一旦以这样的方式思考知觉,大脑的任务就被认为是利用深度线索形成假说,作为邻近刺激的远端反应。

  以上是考虑静态场景下的VR系统知觉模型的基本预设,与VE形成回路的人体,被看作一个光感受器和大脑组成的生物-物理系统,即VE与用户,是因果性机械的刺激-反应回路。在进一步考虑知觉中的经验现象、对象识别和场景识别之前,我们先继续看动态场景情况下VR系统的知觉模型及其匹配的人体模式。

  VE根据由传感器传送的观察者的身体位置和方向信息,尽可能近于实时地绘制和调整相应图像。这要求帧频足够高,以便大脑的残留能力将独立图像前后联结起来,感觉到连续变化的场景。检测定位设备进行头部转动和移动跟踪、眼球跟踪、视线跟踪、位置/方向跟踪,无论是机械联接、超声信号还是磁场系统等,无疑都遵循了表征主义的方案。由此,人体被看作一个简单的机械组合:3个转动自由度的眼和头作为摄像机镜头;6个自由度的躯干作为可升降、转动、拖拉的摄像机支架或轨道车;除此二者作为外设用于接收光波信息之外,还有一个用于破译动态图像信息和发布指令的作为CPU的大脑。在“看见”某物和身体的运动之间,只是工具式的输入-输出关系,而不是构成性的,就像照片图像的质量不依赖于摄影机最后停留的位置那样。

  这样一种面向对象的图像投射式的、身体运动和知觉之间表征式的模拟方案中,可感世界由单个的一系列感觉性质的独立信息节块合并而成,在心灵中表征为一系列精密图像。VR与用户之间构成的回路可用下图简单描述:

  上述回路中,我们首先注意到的是,三个环节之间彼此独立外在,上线方变化引起下线方变化/运动总是单向驱动,从身体运动到追踪监测、生产图像,再到显示图像,都需要单独的时间,CPU和GPU必须拼命赶工,延迟问题的出现再自然不过了。在此不妨设想,如果这一回路是两两双向互动过程,则可以在自然知觉经验的结构中看到。其次,这几个单向的因果变量之间的输入-输出结果在VR系统中是被预先精确设置的,各个感官形态之间不形成联觉,所以从根本上力图断绝知觉中模糊性、不确定性的出现,这些自然知觉经验中固有的感觉特性被视为负面的设计缺陷。诚然,可以期待VR绘图语言能够发展到更接近真实对象显现地描摹用户在不同位置和视角下对象显现出的模糊、闪烁和更细微的形态变化,但问题是,这样势必意味着图像信息量级上的提升和延迟问题的进一步加重。在此我们也不妨设想,如果上线变量与下线变量之间并不是确定的,而是有多种可能性的、富有弹性的试探—回应—再回应—再试探模式,并且再有一个相应数据库,那么计算复杂度将大大降低,不用担心延迟,而且不确定性和模糊性在这种情况下会自然出现。而这样的情形也正是自然知觉经验结构的特征。(参见苏丽)

查看余下全文
(责任编辑:李秀伟)
更多学术内容,请关注 www.cssn.cn
';?> ';?>