科学表征模式:从命题主义到向量主义
科学表征模式:从命题主义到向量主义
符征
作者简介:符征(1979- ),男,河南内乡人,哲学博士,河南大学马克思主义学院副教授,研究方向为认知哲学(河南 开封 475001);李建会(1964- ),男,河南西峡人,哲学博士,北京师范大学哲学国际中心教授,研究方向为生物学哲学(广东 珠海 519087)。
人大复印:《科学技术哲学》2024 年 11 期
原发期刊:《科学技术哲学研究》2024 年第 20244 期 第 16-21 页
关键词:科学表征/ 命题主义/ 向量主义/ scientific representation/ propositionalism/ vectorism/
摘要:命题主义是传统科学理论的表征模式,它具有静态、过度简化、面向结果、模型固化等一系列特征。命题主义是模型驱动的科学发现模式的直接结果。当今大数据驱动显示出更广阔发展前景,与大数据驱动相应的科学表征模式是向量主义。向量主义既能容纳更多的因素,又能反映因素的变化过程和结果,在一定程度上克服了命题主义的局限性。
科学表征是指在科学研究中所应用的数据、符号、模型或其他形式的表示方式。科学表征可用于记录实验数据和观测结果,方便科学家对数据进行分析和推断,揭示事物之间的关联和规律,进而建立相应的理论和模型。对大多数科研工作者来说,他们并非针对复杂多变的现实世界本身进行直接观察分析,更多的是对科学表征进行研究。这意味着科学表征是科学家与现实世界之间的桥梁,科学家通过对科学表征的研究来了解现实世界的情况,那么科学表征的模式及其有效性就成为一个重要的科学哲学问题。
一、命题主义:传统科学理论的主要表征方式
命题是描述科学表征和科学发现的基本工具。首先,从科学发现的过程来看,发现的过程往往是通过一连串的命题扩展来进行的。这些命题在论述中用句子表现出来,于是科学发现的过程被形象地称为“句子的滚动”。其次,从科学发现的结果来看,命题是理性认识的主要载体,判断和推理都需要通过命题表达出来。所以一切科学结论都必须以命题或命题集合的方式表征,比如牛顿运动定律或热力学定律。当然结论比较复杂时也会用到数学表述,比如麦克斯韦方程,不过数学表述原则上都可以转换为命题。从历史经验来看,成功的科学表征不仅能够有效的概括知识,对世界中的现象提供合理的解释,而且能够预测未知现象,扩大对世界的理解。
在科学哲学中,逻辑经验主义首先将命题的经验确证作为哲学研究的目标。逻辑经验主义预设:无论是科学上还是哲学上有意义的语言,都以一个单独的命题为基本单元。“一个命题的意义是它表述了一种确定的事态。”[1]只有在经验上被确证为真的命题才是有意义的命题。大量的命题以逻辑推理的方式结合起来就构成了命题系统,成为一种理论,这样就可以将依靠实践探索的经验描述转化为依靠理性推理的理论描述。这种以句子为基础、以句子的逻辑结构为核心的分析方式被分析哲学继承,并贯穿在多个哲学领域的讨论中。
保罗·丘奇兰(Paul M.Churchland)将上述思想称为“理想句子自动机(ideal sentential automaton,ISA)”,其工作机制是:“一台认识机器的当前状态是由一系列句子或命题贴切的、适当的表征的……因此,合理的理智发展可通过一系列的句子集合来表征。这些句子集合恰当地以所描述的方式,前后相继相互关联。”[2]由此可知:(1)所谓的认识机器就是由命题(或句子)构成的集合,命题是认识机器中的最小单位。(2)认识机器的功能是生成具有合理性的命题集合,这里的合理性是由关系R决定的。(3)关系R并不外在于认识机器,而是通过认识机器确定的。在具体讨论中“理想句子自动机”还有各种各样的叫法,比如福多(Jerry Fodor)的“经典架构(Classical Architecture)”,克拉克(Andy Clark)的“句法图像(Syntactic Image)”,拉克索和考垂(A.Laakso & G.Cottrell)的“命题主义(Propositionalism)”[3]等。
命题主义渗透在传统科学哲学对科学理论的分析中。比如,否证主义主张:“如果在逻辑上有可能存在一个观察命题或一组观察命题与一个假说不一致,那么该假说就是可否证的”[4]74;“只有通过排除一组逻辑上可能的观察命题,一个定律或理论才能增进知识”[4]75。与上述对单个或几个命题的判断不同,历史主义则将范式的更替看作科学理论的进步标准,与范式类似的是科学研究纲领,二者都是由大量命题构成的理论体系,科学的发展或科学理论的真伪将由这样的命题理论体系来整体判断。这一标准又演变出整体认识论。比如蒯因认为,科学理论是一个相互联系的有机整体,不能拆分为命题进行逐个检验,“我们所谓的知识或信念的整体,从地理和历史的最偶然的事件到原子物理学甚至纯数学和逻辑的最深刻的规律,是一个人工的织造物。它只是沿着边缘同经验紧密接触”[5]。这一演变过程说明关于科学理论合理性的分析,从单个命题逐渐转向关于整个世界“信念之网”的判断。虽然认识对象变得越来越宽泛,但始终不变的是:这个信念之网是由若干命题构成的,所有的研究都不考虑命题是如何产生的,而是将命题当作一个毫无疑义的既定前提,重点研究命题是否成立以及命题之间的关系。
命题主义也贯穿在一些认知哲学主张中。以乔姆斯基为代表的认知语言学派认为:语言学研究的重心不应该是外在的语言现象,而是深层次的“普遍语法系统”。“我们必须将语言能力,即关于一种语言的知识,当作行为的内置抽象系统。这一系统由不同的[语法]规则构成,规则的交互作用可以确定句子的形式和内在意义。”[6]这意味着在我们所有语言背后起支配作用的是一种抽象语法系统,由其产生的深层语言必然是由命题构成的逻辑系统。认知哲学中的经典主义认为,大脑和计算机都是“认识机器”;认识的目的就是了解“认识机器”的活动;认识过程就是命题的机器加工过程。“在加工决策、概念学习和感知时唯一可用的模型,都将这些现象视为计算现象。这预设了生物体可以使用一种语言,这种语言正是计算加工的对象和结果。”[7]这说明了一般思维过程正是通过语言展开的。之所以思维和思想必须是语言状的,是因为一方面现实中上述“唯一可用的模型”都预设了这一结果,另一方面理论上思维语言具有“句法和语义一致性”的特征,能够为意义加工提供良好且独特的因果解释。因此概念和由概念形成的命题是分析的核心,反过来离开了概念和命题则无法进行思考和认知研究。
二、模型驱动:命题表征的方法论基础
命题主义科学表征是模型驱动的产物。“模型驱动”的首要步骤是确定科学模型。模型是用来描述特定过程的一种有组织的结构。模型并不是真实世界本身,而是对真实状态的概念化。科学家并不是直接研究世界本身,而是通过真实世界的一个局部的理想化模型这一中介,来间接研究世界。问题是:如何从真实世界中隔离出一个与真实世界不同,而又能正确反映真实世界的模型?答案是:我们没有任何先天的和确定的方法来证明一个模型一定是真实有效的;通常的方法是研究者在经验中不断摸索。
在科学发现中,研究者通常遵循如下方法:首先,提出问题和预设环境。研究者从一个科学问题开始,通过经验总结和大胆思考,提出关于这个问题的假设,尤其是可能会涉及哪些变量和哪些过程的假设,同时要尽量隔离其他干涉因素。通过一系列假设,确定一个模型。其次,对模型中的变量关系进行数学拟合,反复实验直到获得最优结果。一般来说,能够得到的最优结果就是对最初科学问题恰当的回答。比如,对力与加速度的关系测定拟合,得到结论是:力与加速度成正比。理论上最优数学结果总是存在的,虽然短时间内不一定立刻找到。再次,对结果的现实合理性进行测试。因为得到的数学结论是最优拟合,所以代入实际情况和最初假设往往是一致的,此时就可以围绕数学结论建立起科学理论。如果的确不一致,则必须重新拟合,直到结论与事实差距不大。其流程图如下:
在上述流程图中,模型始终是不变的,改变的是对模型内部关系的描述。这正是模型驱动的关键特征:模型是不变的,大数据是为模型服务的。
这种方法最重要的是,模型一旦确定通常就不再变化,直到发现最优数学拟合为止。模型不是绝对不能变化,问题是修改模型的充足理由是什么?一般来说,数学拟合的失败不会对模型的合理性造成挑战,人们往往只会去寻找更加复杂的数学表示。比如托勒密的地心说模型,虽然在一千多年时间内其数学计算结果都与实际情况有冲突,但是并没有被立刻抛弃,人们只是寻找更多的改进方案,直到哥白尼革命的发生。模型的变革往往要到科学革命的时候才会发生,而在常规研究时期人们主要从事的是模型内研究。所以,模型驱动模式从建模之前到拟合结束的整个过程,都受到研究者的能力的强烈的影响和限制。这种能力限制至少表现在两个方面。
图1
模型驱动科学研究方法的流程图
第一,研究者的认知能力限制。模型驱动最初步骤要提出假设确定模型,而这需要确定研究目标、预测内部机制、隔离无关因素等一系列专业知识的预备。因为模型并不是真实情况,必须大量隔离干扰因素。所以确定模型本身也是一个预测的过程,要首先预测到要解释的现象同哪些可能的因素相关,以及这些因素之间可能呈现出什么样的可能关系。过去几乎所有的科学发现都是在一定的科学假设下进行的,而一切假设都是由研究者提出的。这样的模型构建,严重依赖人的经验和先验知识假设。一旦模型被确定了之后,往往就不再变化,研究者的任务是寻找适当的大数据来进行拟合,以符合预期。但是模型是有限知识的产物,我们没有办法保证模型是正确的。如果模型本身有问题,那么由模型获得的结论也是有问题的。所以研究者需要反复根据实际结论来修正模型。建模本质上是一个试错过程,找到一个理想的模型并对其进行完善可能需要很长时间。
第二,研究者的加工能力限制。模型难以加工比较复杂的情况。模型驱动之所以有效,是因为它们基于对系统或过程的近似了解,并且可以利用经验证明其相关性。但是要接近现实,就需要复杂化内容和过程,这样可能会超过人的加工极限。现实中可能需要大量的信息才能提出一个想法,也可能花费数年却找不到答案。因此,模型一定要尽量简洁,这就意味着模型反映的因素一定要尽可能的少,因素相关性尽可能的简单,变化过程尽量符合已有的可描述的数学过程;否则当过程和内容过于复杂时,就难以获得有效结果,也就失去了模型的作用。所以,模型是现实的一种近似,模型与现实之间永远存在着一定的距离。“模型驱动方法的一个致命缺陷在于,难以在实际应用中针对特定任务进行准确建模,有时追求精确建模是一种奢侈的期望。”[8]
命题主义科学表征是模型驱动的产物,因为模型是在科学理论的基础上产生的,而模型要说明的结果仍然是科学理论。这里的“理论”通常是用命题集合的方式表征的,而且集合中命题的数量通常是有限的。并且从模型中测得的变量关系(或定律),也是用命题集合的方式来表征的。如果模型不理想,需要进一步修正,那么将会逐个判断上述假设和结论中的命题的有效性,然后逐步改变假设重新来测量变量关系。这就导致命题主义加工的情况至少有两个特征:有限和静态。有限是指命题个数是有限的,因为假设中的条件和变量的情况都是要逐个检查的,如果数量太多则不能完成逐个检验。
静态是指命题所指称的情况是相对稳定的,如果情况是变化的,命题无法涵盖,那么这样的命题将失去科学发现作用。比如在牛顿第二运动定律的应用模型中,要假设物体的质量在运动过程中不发生变化,从而只需要考虑力与加速度的关系。但事实上在具体物理情景中,物体会不断同周围环境发生物质和能量交换,其质量不可能是常量。如果要考虑质量变化的因素,那么牛顿第二运动定律将失去作用。静态模型本来就是对现实的近似,而不是现实本身,因此模型与现实不一致是正常的,这就意味着很难完全证明一个模型是失效的,也很难判断究竟在什么情况下才可以调整模型。
科学理论表征方式一直受困于传统命题主义表征方式。命题主义表征方式的局限性根本上可以归于模型驱动研究模式中人的认知和加工能力局限性,为了突破这种局限性,研究者从不同方面提出过许多批判性思路。比如在当代科学哲学中,无论是蒯因的“信念之网”,还是费耶阿本德的“反对方法”,以及科学实践哲学倡导的“实践优位”,都表现出对命题主义“理性重构”的拒斥,但是却始终没有提出能够有效替代命题主义的新进路。
三、大数据驱动:科学研究方法的变革
随着大数据加工能力的迅猛增长和深度学习技术的日益成熟,大数据驱动的科学研究引发了人们对科学研究方法的新思考,并为解决命题主义科学表征模式的局限性问题带来了新的希望。
大数据驱动研究模式是在对开放科学不断增长的需求,以及人工智能和深度学习的迅速崛起的背景下发展起来的。“大数据驱动(big data-driven)”是指通过大数据积累和应用方法,从一些大数据中提取有意义的模式来进行学习的过程。大数据积累始终是科学革命的驱动力。在当前的技术条件下,廉价的大数据存储、快速的计算机、神经网络算法的进步,以及其他以大数据为中心的方法论,使得从大数据中提取大量价值成为可能。快速大数据收集和先进的分析技术的结合,产生了从大数据科学到其他科学领域的溢出效应,目前正在推动大数据驱动的科学研究方法的扩散。随着这些新技术允许加工更大的大数据集并揭示隐藏的相关性,大数据驱动的科学正在成为继实验、理论和计算推动的科学发现之后的“第四个科学范式”。
知识生产方式的变化对我们理解科学发现模式产生了重要影响。相对于模型驱动,大数据驱动有望突破科学研究中人的认知和加工能力的局限。首先,大数据驱动几乎不需要预设专业知识。深度学习算法使用统计模型和优化算法来揭示训练大数据中的模式,可以在没有明确指令的情况下做出预测或决策。在具体做法上,以往的深度学习特征提取主要由人工完成,但是现有的技术已经支持深度学习系统自动从素材中提取有价值信息,并构建有意义的大数据特征,以便进行训练、学习和理解。杨立昆(Yann LeCun)等人谈道:“表征学习是一组方法,允许机器输入原始大数据,并自动发现检测或分类所需的表征。……深度学习的关键方面是,这些特征层不是由人类工程师设计的:它们是使用通用学习程序从大数据中学习的。”[9]
其次,大数据驱动在加工方面具有无可比拟的优势。与人类学习相比,深度学习能够以更快的速度加工更大和更高维度的大数据,并且可以通过对更加细粒度微观大数据的加工来寻找答案。比如,几十年来在生物化学领域蛋白质折叠问题是一个重要的挑战,因为可能存在的蛋白质结构数目超级大,直到2020年科学家们通过各种“手工”实验,如用X射线晶体学和冷冻电子显微镜等实验方法,才揭示了194000多种蛋白质结构。但是在2022年,被称为结构生物学领域“游戏规则改变者”的机器系统AlphaFold,“结合了同源模板和多序列比对的特征来生成预测结构,在预测具有未知折叠的蛋白质的三维结构方面表现出了卓越的准确性”[10]。它预测了超过200亿种蛋白质的结构,几乎包括所有已知的人类蛋白质。
如果说模型驱动依赖于人类的先天认知和对经验的分析来定义模型,那么大数据驱动则把大量非结构化的大数据作为归纳推理的起点,利用超强的统计分析能力来构造模型。它们的关键区别在于:模型驱动是以模型为核心的,需要用大数据去拟合模型;大数据驱动是以大数据为核心的,需要从大数据出发去构造模型,并根据模型与事实的误差来动态调整模型,直到符合事实为止。其流程图如下:
图2
大数据驱动科学研究方法的流程图
图中除了“定义问题”以外,其他环节都尽可能由机器操作,因此有可能利用机器的加工优势来突破人的认知能力与加工能力的限制。这种方法论变革,将可能重塑科学研究中许多基础性概念和方法,并导致包括科学理论表征在内的科学整体面貌的根本性变革。
四、向量主义:面向过程的科学表征方式
在大数据驱动的科学发现模式中,科学表征模式所发生的一个重大变化是:命题表征会变得十分模糊,以至于在分析发现过程和结果时,难以找到具有概念意义的语义单元,从而难以形成明确的命题表征。“大数据驱动”研究用到了大量的智能分析技术,其中应用比较广泛、发展比较迅猛的一种技术被称为深度学习系统。下面就以深度学习系统为例来分别说明这种科学表征模式变化的原因。
第一,加工方式从逻辑符号推理转变为大规模神经元构成的深度网络运算。这种系统并不是由包含语义单位的符号操作构成,而是由大量无语义内容的神经元(单元)构成的层次网络。系统可以分成许多层,每层都由可以彼此连接的大量神经元构成,其中上一层的输出可以作为下一层或其他层的输入。每个神经元和其他神经元的连接都是有权值的,因此每个神经元收到的信号都是实际信号数值乘以权值。每个神经元以及每个神经元层都有一个激活阈值,当输入信号达到阈值时就向外输出信号(激活),反之就不向外输出信号(抑制)。在理想的情况下,网络的权值和阈值都是随机的,网络根据输入运行一轮之后,将根据输出的结果与预期的误差,自动向每个单元反馈误差信号并自动修改权值和阈值,这个过程被称为“反向传播”。然后再次运行,如此循环,直到网络输出达到预期为止。
第二,加工对象从概念和命题转变为无语义的数值。值得注意的不仅仅是深度学习系统的加工方式,还有其加工对象。在整个加工过程中,被加工的对象不是传统意义上的语义单元,而是不具有语义内容的数值。针对加工过程,存在三种加工状态的数值。一是加工前的数值。理论上输入系统的最初数值是随机的,不针对现实世界的任何方面,而是由系统自动修改数值来达到预期。而在模型加工中,关于模型存在大量的以概念和命题表征为基础的预设。这些命题性预设是模型加工的起点和对象。二是加工中的数值。加工中的数值来自对最初数值的一系列数学变形,事实上我们很难理解这些中间数值的现实意义。这种难以理解不是技术上的,而是理论上我们不但不知道这些中间过程和数值的现实意义,我们甚至不知道这些数值是否具有现实意义,产生了“认知不透明”问题。而在模型加工中,我们可以用具有推理性命题系统的方式将加工过程描述出来,这一过程与模拟对象应当是一一对应的,这就要求加工对象从头到尾都是清晰的。三是加工后的数值。系统加工后的数值并不能和预设对象对应起来,或者说形成明显的现实表征,而是以向量的形式存在着。在系统的设计中程序员赋予系统中的向量与某个预设对象的对应性,但问题在于向量与预设对象的对应并非明确的,一个向量和它的大量变形都可能执行某个预设的对象,也就是说加工后的数值形成的向量与预设对象是多对一的关系。而在模型加工中,任何加工结果都明确的对应于具体的模拟对象。
第三,加工中潜在有意义的部分可能是向量。因为输入层就是由大量的神经元构成的,所以系统的输入是将大量数值同步分别输入到不同的输入层神经元中,所以在数学上可以将所有的输入集合在一起看作是一个向量。现在的深度学习系统大多数都是同步加工的,即向量中每个分量都是在同时被加工的;而加工又是分步骤离散进行的,即向量中的每个分量都会同步进行一次加工后,再同步进行下一次加工。又因为激活单元的数量是固定的,这就意味着,在加工的每一步骤中,都会产生一个特定的激活模式。这个激活模式可以用一个向量表征,即模式向量。整个加工过程就是模式向量随着时间发展而不断变化的过程。直到有一组向量对任何符合条件的输入,都会产生符合条件的稳定输出,这组向量被称为“模型向量”。相应于命题主义,这种以向量变化为描述对象的表征方式被称为“向量主义”。
如果说命题主义是面向思维结果的表征模式的话,那么向量主义则提供了一种面向过程的表征模式,它能够说明科学发现的过程和结果是不可分割的。自科学哲学中的整体论转折以来,哲学界大都接受蒯因的“信念之网”的认识论态度,认为单独一个科学命题接受经验的确证是不可能,而是整个(科学)知识构成的网络来面对整体经验的审查,但问题是:这个网络究竟有多大?在蒯因看来,它应当包括我们所有的科学知识,还要包括我们的日常知识。但事实上它仍然不够大,因为它即使包括了所有明确的概念性和命题性知识——正如命题主义主张的,它依然空缺了我们认识活动中大量的非命题性内容。维特根斯坦在《哲学研究》中对此做出明确的批评。维特根斯坦认为,相对于认识活动来说,概念和命题本身是不重要的;我们是在活动中形成概念和命题的,并且概念和命题也是随着我们的活动而变化的。因此命题主义探究方式永远被局限于认识的表层,真实的认识活动并未涉及。不过真实的认识活动充满了各种复杂性和不确定性,维特根斯坦虽然意识到命题主义的局限性,但是他除了唤醒人们对这种局限性的关注和强调认识活动转向之外,并没有很好地提供转向的具体途径。
在向量主义科学表征模式中,一些传统的科学理论概念将开始获得新说明,比如:
新说明显然是亚概念的,因为它依赖的是大量无语义的数值符号的数学操作,这些操作对象和操作过程很难同概念层次的活动建立起直接的对应。但是它的确能够以“突现”的方式产生概念意义的后果,如果那些过程不仅仅是巧合的话,那么它似乎达到了命题主义所无法触及的“深层”认知活动。这一现象的启示是:表征科学理论的恰当方式可能不是传统的静态命题组合,而是向量动力学。从这个角度来说,命题主义表征可能是对向量动力学的过度简化。向量模式的可行性与合理性还在争论之中,但是作为一种新的、与科学实践相一致的、且可能突破以往理论局限性的新方法,值得进一步关注。
参考文献:
[1]AYER A.Demonstration of the Impossibility of Metaphysics[J].Mind,1934,43(171):335-345.
[2]丘奇兰.科学实在论与心灵的可塑性[M].北京:中国人民大学出版社,2008:134.
[3]LAAKSO A,COTTRELL G.Churchland on Connectionism[C]//KEELEY B.Paul Churchland.Cambridge:Cambridge University Press,2005:114.
[4]查尔莫斯.科学究竟是什么[M].北京:商务印书馆,2018.
[5]蒯因.经验论的两个教条[C]//蒯因著作集:第4卷.北京:中国人民大学出版社,2007:47.
[6]乔姆斯基.语言和心智[M].北京:中国人民大学出版社,2016:77.
[7]FODOR J.PYLYSHYN W.Connectionism and cognitive architecture:a critical analysis[J].Cognition,1988,28(1-2):3-71.
[8]ZONGBEN XU,JIAN SUN.Model-driven deep-learning[J].National science review,2018,5(1):22-24.
[9]LECUN Y,BENGIO Y,HINTON G.Deep learning[J].Nature,2015,521:436-444.
[10]DAVID A,SUHAIL I,EVGENY T,et al.The AlphaFold database of protein structures:a biologist's guide[J].Journal of molecular biology,2022,434(2):167336.
原标题:《科学表征模式:从命题主义到向量主义》
阅读原文