齐磊磊:由大数据引起的对因果与相关的讨论

2018-01-25 10:32 来源:《自然辩证法研究》 作者:齐磊磊

  A Discussion Caused by Big Data on Causality and Correlation

  作者简介:齐磊磊(1978- ),女,山东临淄人,华南理工大学科学技术哲学研究中心博士,华南理工大学马克思主义学院副教授,主要研究方向:科学哲学与复杂系统哲学等。广州 510641

  原发信息:《自然辩证法研究》第20175期

  内容提要:大数据带来了因果与相关的显明观点,共鸣者众,争鸣者也不乏其数。因果与相关本来就是哲学上的老问题,老问题新讨论,大数据视域下重新审视两者的关系是对哲学或者大数据哲学的有益补充。相关关系可以细分为(决定论)因果、统计因果与非因果关系。相关关系包含了决定论的因果关系,决定论的因果关系必定是相关关系;统计因果找到了协调传统科学哲学的方法论与大数据方法论的中间桥梁,是大数据研究的一个中间驿站;大数据视域下通过统计因果相关可以推测集体的和个体的因果关系,但不能给出明确的证明依据;可以借助统计因果相关对因果与相关进行区别并联系起来。

  Big data brought about the obvious points on causality and correlation,which are agreed by many scholars,but there are a lot of scholars have different views on them.The relation of causality and correlation is an old problem of philosophy.But there are new discussions on the old problem.It is a useful complement to philosophy or big data philosophy to re-examine the relationship between causality and correlation from the perspective of big data.The correlation can be broken down into determinism causality,statistical causality and non causality.The correlation contains the determinism causality and the determinism causality must be the correlation.Statistical causality found the middle bridge to coordinate the relationship between the methodology of the traditional philosophy of science and the big data methodology,which is a middle station to research big data.Using statistical causality can infer the causality between the collective and the individual,but it can't give clear evidence.It can be distinguished and linked causality and correlation by statistical causality.

  关键词:因果/相关/函数/规律/大数据  causality/correlation/function/regularity/big data

  标题注释:国家社会科学基金一般项目“语义模型与表征模型研究”(14BZX025)、2016年度广州市哲学社会科学“十三五”规划课题“大数据哲学中理论与因果问题研究”(2016GZGJ57)。

  一、引言

  笔者于2015年写过一篇论文“大数据经验主义”[1],提出了大数据经验主义的概念、概括并批判了他们的基本观点。论文发表以后,国内多位学者与我交流,其中最有启发性的建议是:对因果与相关的讨论再细致些,要抓住这个问题深入说清楚。为了更好地说明因果与相关的关系,本文将相关进一步细分为:决定论因果、统计(概率)因果和非因果相关三个部分进行讨论,尤其是引入统计因果相关这个较少有人提及的概念,它既可以清楚地表达因果与相关的区别,又是两者之间联系的纽带,这样的论证进路具有一定的新颖性。为此,首先沿着从“函数”到“相关”①再到“规律”最后到“因果”这样一个自然过渡的发展路线开始。

   二、函数、相关、规律与因果

  在现实世界中,任何事物都不是孤立存在的,而是与其他事物具有千丝万缕的联系。对于这种相互关系的研究,有一个从朴素的直觉表达到精确的数学描述的过程。最先给出统一描述的来自数学上的“函数”概念,这是17世纪数学从对运动的研究中引出的一个基本概念。伽利略在近代力学的开山之作《两门新科学》中用文字和比例的语言表达函数关系,全书中比比皆是,“只差把文字叙述表为符号形式这短短的一步了”[2]44。随后,苏格兰数学家詹姆士·格雷戈里(James Gregory)在他的论文“论圆和双曲线的求积”中给出了相对比较明显的定义,但范围太窄。牛顿在他的微积分研究中用“流量”(fluent)来表示变量间(包括无穷小量间)的关系。1673年,莱布尼兹在一篇手稿中使用“函数”表示任何一个随着曲线上的点的变动而变动的量。1714年,在莱布尼兹的著作《历史》中,用“函数”一词来表示依赖于一个变量的量。伟大的数学家欧拉1734年引进了函数的数学记号y=f(x),这临门一脚踢开一般数学函数定义的大门大概花了100年。

  在莱布尼兹以及其后的数学家看来,只要事物之间在物理上存在着严格的确定的关系就可以用函数关系表示。随着离散数学和集合论的创建,函数的概念变得更加广泛。因为,集合论为刻画事物之间形形色色的联系提供了一种数学模型——关系,它仍然是一个集合,以具有那种联系的对象组合为其成员。比如人与人之间有父女关系、师生关系等;计算机程序间有调用关系、状态转换关系等。“集合论中关系不是通过描述关系的内涵来刻画这种联系,而是通过列举其外延(具有那种联系的对象组合的全体)来刻画这种联系。”[3]87所以,集合论中通常使用具有相互联系的对象的有序对的集合来表示关系。这样,一个数学集合,只要有个映射,即一个有序对,映射过来就是个关系。塔尔斯基从数理逻辑上对关系的表述也很广泛。他的定义是:“事物x与事物y有R关系,简写成:xRy。”[4]93其中R指的就是相关关系,它说明相关是指只要两个变量有关系,不管它稳定不稳定,明确不明确都是指具有这个关系,这与莱布尼兹等人对函数最初的定义不同。函数的定义演变为:只要有两个变量之间发生联系,它就是一个函数,自己也可以是自己的函数。比如A=A是个相关,具有可自反的关系;A=B也是个相关,具有相等但不是因果的关系;兄弟也是个关系,这个关系就是R,R也称之为函数。所以说,相关关系可以表示为一个数学函数,函数就是一个映射,变量之间存在一个映射,无论是人为的、天然的或者数学上把它们连接在一起就变成一个有序对,有序对就是一个关系。于是非数学的关系也纳入到相互关系的研究之中。

查看余下全文
(责任编辑:李秀伟)
更多学术内容,请关注 www.cssn.cn
';?> ';?>