论作为人类经验新形式的“数据—经验”

奥鹏网院作业 · 发表于 2021-9-3 15:20:05

论作为人类经验新形式的“数据—经验”
杨庆峰

(复旦大学应用伦理学研究中心，上海 200433)

摘要：人工智能的发展有助于反思哲学的根基性概念，比如经验。从学习模式角度看，人工智能经历了四种类型：深度学习、强化学习、效率学习和迁移学习。这些学习模式的共同特征是“从数据中学习”与“从经验中学习”，可以用“数据—经验”很好地描述机器认识世界过程中的感性获得物。“数据—经验”可以被看作是智能体通过学习算法创造出一种新的经验类型，它并不是知识论意义上的经验类型，而是具有记忆特性的经验类型。这一概念的提出，意味着数据成为经验的新来源，将“数据—经验”作为人类经验新形态来对待，更进一步验证了“深度学习是经验主义新高峰”的观点。

关键词：人工智能；深度学习；经验；智能体；记忆

“经验”是人类哲学中根基性的概念，经验主义也是人类哲学中基本的立场原则。纵观哲学史，经验在知识论、实用主义与现象学/解释学等传统中得到较多的讨论。在知识论传统中，感觉与经验、经验与知识的关系问题成为基本问题，哲学家主要探讨经验何以会成为知识的起源或者知识有效性的根据。在实用主义传统中，哲学家主要探讨内在经验(体验)何以与日常生命活动关联在一起。在现象学/解释学传统中，哲学家主要探讨艺术经验如何作为生命存在方式的根基被确立起来。无论是何种传统，其主体的设定还是人类主体的，即对人类经验的探讨。正如伽达默尔指出的，我们探究的是“人的世界经验和生活实践的问题”[注]伽达默尔：《真理与方法》，上海：上海译文出版社，2004年，第4页。。

随着智能时代的到来，AI智能体正在通过学习算法创造出一种新的经验类型，即与数据有关的经验。这种现象无疑对理解经验产生了极大影响：与智能体算法有关的经验对于人类经验有什么样的影响？本文力图用“数据—经验”来分析智能体在学习中获得的经验类型。

本文采用“数据—经验”的表达而不是“数据经验”，其主要理由是，表达深度学习中呈现出来的数据与经验的同一关系，采用“数据—经验”的说法也为了突出它与经验数据化和数据经验化的差异。“经验数据化”意味着人类经验内容被数据化，强调的是经验内容的外在化过程。“数据化经验”意味着以数据形式存在的人类经验形态，强调的是被编码后的人类经验形态，它们都可以归到数据经验这一范畴中。鉴于这一理由，文章里面的表达一律采用“数据—经验”。需要说明的是，这一概念的采用只是一种尝试性反思，重在提出问题。

一、“数据—经验”：机器通过学习算法获得的感性物
哈比斯(Demis Hassabis)在一篇讨论人工智能与神经科学的论文中指出了两个学科交汇点的过去、当下和未来。从学习角度看，他提到了过去的“深度学习”和“强化学习”、当下“持续学习”以及未来的“有效学习、迁移学习”。[注]Demis Hassabis et al.，“Neuroscience-Inspired Artificial Intelligence,”Neuron，95(19), 2017,pp.245-258.根据他的观点，人工智能发展已经度过深度学习阶段，正处于持续学习阶段，并且会进入到迁移学习阶段。[注]迁移学习是通过将源任务学习到的经验应用到目标任务，从而让目标任务的训练更灵活高效也更贴近实际情况——要解决的实际问题可能很难直接学习，因为数据不足或者无法直接与环境交互获得数据；强化学习是一种根据环境反馈进行学习的技术，它是能动体辨别自身所处的状态，按照某种策略决定行动，并根据环境提供的奖赏调整策略，最终达到最优。可以说，这一分析可以成为分析AI学习算法的基本脉络框架。本文从过去的“深度学习”开始展开分析，并为其他几种学习类型的哲学分析奠定框架基础。

深度学习的本质特征是什么？至少表现为两种主要观点：其一是数据驱动的特征，即强调深度学习是以“数据驱动为主要特征”。根据深度学习的提出者特伦斯·谢诺夫斯基(Terrence Sejnowski)的描述：“深度学习是数据密集型的，通过实例来学习如何解决难题，比如视觉对象识别、语音识别和自然语言翻译等等。”[注]特伦斯·谢诺夫斯基：《深度学习》，北京：中信出版集团，2019年，中文版序。如果从学习的角度来看，深度学习即人工智能体从数据中学习，即从大数据中寻找相关关系和固有模式。“深度学习就是一种特征学习方法，把原始数据通过一些简单的但是非线性的模型转变成为更高层次的，更加抽象的表达。通过足够多的转换的组合，非常复杂的函数也可以被学习。”[注]Le Cun, Y., Bengio, Y. & Hinton G.，“Deep Learning,”Nature,521, 2015, p.436.其二是以经验驱动为特征，即强调深度学习是从经验中学习。约书亚(Yoshua Bengio)指出“解决的办法是允许计算机从经验中学习，通过概念的等级来理解，每一个概念都用与之更简单的概念加以界定。……概念等级允许计算机通过更为简单的概念来学习复杂概念。如果我们画一个图表来显示这些概念如何建立起来，这个图就是带有许多层的深度图，因此，我们把它称为‘深度学习’。”[注]Ian Goodfellow, Yoshua Bengio, Aaron Courville，Deep Learning，The MIT Press， 2016，p.2.

如果把这两位AI学者关于深度学习的特征描述合并在一起，一个有趣的问题就会浮现出来：人工智能体“从数据中学习”与“从经验中学习”是怎样的关系？很显然，在深度学习专家的定义中蕴含着二者的同一关系。在技术专家看来，从经验中学习也就是从数据中学习。“一个AI必须基本上理解我们周围的世界，我们论证了它学习识别和分离隐藏在低层次感觉数据中的可观察环境中的下层解释性因素。”[注]Bengio, Y., Courville, A., & Vincent, P.,“Representation Learning: A Review and New Perspectives，”IEEE Transactions on Pattern Analysis and Machine Intelligence,35(8),2013,p.1798.为了更好地讨论深度学习行为的哲学本质，我们提出了“数据—经验”这一概念来说明这个问题。

在对这一概念展开哲学分析之前，可以借助案例来理解深度学习过程。在深度学习的一些著作中，从正方形例子介绍深度学习是一个经典的做法。约书亚等人指出，智能体关于正方形的学习过程经历了从“边”到“轮廓”，从“轮廓”再到“对象”的过程。

这儿的图像是被每一个隐藏单元表征的特性类型的可视化。考虑到像素，通过比较邻近像素的明亮度，第一个层次可以来轻易分辨“边”，考虑到第一个隐藏层的对“边”的描述，第二个隐藏层能够轻松寻找角和扩展的轮廓，这些被识别为“边的集合”。考虑到第二个隐藏层用角和轮廓对于图像的描述，通过找到特定角和轮廓的集合，第三个层次能够察觉特定对象的整个部分。最后，用它包含的对象部分的名义，图像的描述能够用来识别图像中表现的对象。[注]Ian Goodfellow, Yoshua Bengio, Aaron Courville，Deep Learning，p.6.

这个过程是从数据中读取重复的特性或者模式。从特性上看，深度学习能够区分出两类特性：可描述的特性与不可描述的特性。可描述的特性就是可以通过对比的方式勾勒出来的，比如在正方形的例子中，边、角、线等都是可以通过与其他临近像素明亮度的对比描述出来的，“许多人工智能的任务可以通过设计合适的为任务而提取的特性集，然后将这些特性提供给简单的机器学习算法”[注]Ian Goodfellow, Yoshua Bengio, Aaron Courville，Deep Learning，p.3.。但是，也存在着不可描述的特性。作者举了一个识别图像中关于汽车的例子。“汽车有轮子”，但是这样一个特性很难描述。“一个轮子有简单的集合形状，但是它的图像可能被落在轮子上的阴影轮子、金属部分发出眩目的阳光弄复杂了，或者前景中模糊轮子部分的对象也会产生这样的结果。”[注]Ian Goodfellow, Yoshua Bengio, Aaron Courville，Deep Learning，p.3.这种特性是“不可描述的特性”。这种情况人也会遇到。比如在黑夜里无法识别一个人或者一个树桩。读取重复的模式意味着深度学习从数据中学习到稳定的模式，这在计算机视觉中是非常重要的一个方法。在计算机视觉顶级会议(CVPR)主席德勒克·霍尔姆(Derek Hoiem)看来，计算机视觉的行为本质就是模式识别。他指出，深度网络是模式识别器，它们把新模式匹配到已知的模式中，并转化相关信息。

所以，“从经验中学习”的技术本质是从数据中学习，其哲学本质是获取可描述的特性或者发现重复的模式从而构建起对象。这个过程与哲学中所描述的人类对象认知的过程完全不同。在传统主客体认知模式中，认识是从客体出发的，主体获得对象的知识；在现象学传统中，意识行为构成意识对象。而人工智能的深度学习过程是从数据特性出发，逐步构建对象的过程，最终当特征到达一定充盈度的时候就成为对象确立起来。这明显与现象学的“充实”(fulfilment)过程是一致的。“充实即空意念和被充实意念之间的相符性的经验。一切知觉经验都包含着空意念和被充实意念的一种交织性混合物。”[注]德尔默·莫兰：《胡塞尔词典》，北京：中国人民大学出版社，2015年，第95页。但是，贸然把智能体的知觉获得的对象及其特征的认识称为知觉经验还为时过早，甚至会遭遇到一些反驳。因为机器知觉与人类知觉之间的异构性，而只能采用“拟—准”这样的说法来阐明。这样做并非是理性的方式，而只是一种类比的结果。笔者认为，可以提出“数据—经验”作为阐述机器认识世界过程中通过感性方式获得经验的新概念。这一概念的提出是为了阐述“从经验中学习”“从数据中学习”两个特征之间的同一特征。

二、“数据—经验”可以纳入何种经验传统？
如果说“数据—经验”作为阐述机器认识世界过程中通过感性方式获得的新概念，那么接下来的问题是“数据—经验”属于何种经验传统？在经验问题上，存在三种哲学传统描述了经验的本质和特性：知识论的传统、实用主义的传统和现象学—解释学的传统。那么，“数据—经验”能够纳入到哪一种经验传统中呢？

知识论的传统可以追溯到亚里士多德，然后历经近代的笛卡尔、康德一直到当代的胡塞尔。这一传统确立起“经验—知识”的理论框架。在这一框架之中，经验从对象构建、知识来源和知识有效性等三个方面服务于知识论传统。从对象建构看，经验表现为通过感性给予的质料，通过形式赋予质料意义，最终将认识对象确立起来。从“无意义的质料”到“意义对象”的确立过程是一个不断抛弃质料的过程。从科学对象的认知过程看，是不断抛弃自然对象的颜色、形状等属性因素的过程，正如W·C·丹皮尔在《科学史》一书中指出的，最终世界变成了一个只是粒子运动的世界，没有声音、没有颜色和气味，更没有了意义。从知识来源看，经验往往被看作是知识(观念)的来源。归纳法恰恰是从经验中获得知识的有效方法，尽管这种方法最终被罗素终结；与知识来源密切相关的是知识的有效性问题，经验是知识有效性的重要基础之一，生活中常听到的“眼见为实”就是说明真相及其命题来自经验的证实。由于作为建立在经验基础上的知识始终存在着错误的可能性，所以理性成为另一个非常重要的基础形式。在知识论传统中，经验仅仅作为知识的附属存在，而且并没有给经验带来有效的分类，而只是在二元的框架内不停地区分着经验与理性、经验与知识的界限，并且经验往往被看作是可错的、与意见摆置在一起，最终被抛弃。

实用主义改造了知识论的经验概念，并区分了不同的经验类型。通过詹姆士和杜威的观点可以清楚地把握到这一点。“古典实用主义的最重要特征之一，即对于传统‘经验’概念的系统的哲学改造，也是从詹姆士这儿开始的。”[注]陈亚军：《实用主义：从皮尔士到普特南》，长沙：湖南教育出版社，1999年，第106页。这里的改造，实际上是对整个认识论的批判。在这一批判基础上，他们提供了“纯粹经验”这一重要类型。在詹姆士看来，“世界上只有一种原始的素材和质料，一切事物都是由这种素材构成。这种素材就是‘纯粹经验’。它是连续的，‘似乎是完全流动的’……只是由于后来的反思，由于概念的切入，这种纯粹经验才被分割、归类……由连续、流动而变成了分离、固定的事物……由于我们习惯了概念式的思维，反而忘掉了纯粹经验”[注]陈亚军：《实用主义：从皮尔士到普特南》，第97页。。可以看出，詹姆士区分了概念思维与纯粹经验，并将后者看作是直接的生活之流，由于概念和反思的切入，生活之流被切断、分割、固定，逐渐被遗忘。这一思想在杜威那里得到了更进一步的发挥，“杜威以生命活动的图式使得经验概念得以摆脱传统知识论的限制，从而在人与自然内在连续性的基础上获得其生命力。这种拓展……是基于对传统经验概念所从属的哲学前提的变更”[注]陈怡：《试论杜威经验的方法对传统经验概念的重建》，《哲学研究》1999年第3期。。杜威区分出来的原初经验与反思经验更加夯实了经验的区分。在杜威那里，原初经验就是日常生命活动的图式，赋予人与自然生命力的根据生活。所以，这一阶段的改造“都是对传统反思视域中的‘经验’概念进行了改造，……改造后的经验，将自身集中在对‘直接的生活之流’(詹姆士)、原初经验(杜威)的描述上”[注]杨庆峰：《现代技术下的空间拉近体验》，北京：中国社会科学出版社，2011年，第51页。。所以，经过实用主义传统的改造，“原初经验”与反思经验区分开。

与实用主义传统非常相似的是现象学与解释学传统。伽达默尔对知识论的经验概念进行了深入的批判。伽达默尔在1960年的《真理与方法》中将“人类经验”区分为科学经验与非科学经验，后者如艺术经验。这本书指向的是自然科学在人类社会生活领域内的无限运用。“我们时代受日益增长着的社会合理化以及主宰这一合理化的科学技术的制约，也许比受现代自然科学巨大进展的制约要强烈的多。科学的方法论精神渗透到一切领域。”[注]伽达默尔：《真理与方法》，第3页。伽达默尔提出这样的问题：“最初的世界和后来的世界的分界线究竟在哪里呢？最初的生活意蕴是怎样转为对文化意蕴的反思经验呢？”为了解决这一问题，他从诠释学经验出发构建起新的解释学传统，而诠释学经验是建立在艺术经验和历史流传物经验之上的。

通过上述哲学史的梳理，至少可以得出如下的结论：

(1)三种经验传统的基本出发点都是人类经验。知识论传统讨论了人类知识的获得及其有效性问题，而不是非人的知识问题，并且在知识获得和知识有效性的问题上，当人们获得了有效知识之后，经验如同脚手架一样最终被拆解抛弃。认识过程是一个不断持续的过程，对经验的抛弃也是一直持续的。解释学传统所探讨的直接就是人类经验，尤其是艺术经验和历史经验，他们批判的是人类的科学经验。实用主义的传统并不是完全地以人类经验为出发点，它为探讨非人类经验留下来一些空间。

(2)需要关注到纯粹经验与人类经验的区分。实用主义所提出的“纯粹经验”是一个非常有意思的概念。在詹姆士看来，纯粹经验是世界唯一的素材和质料。这一概念应该被保留下来，因为它说出了非人的规定性，为破解人工智能经验问题提供了哲学范畴。但是，由于“数据—经验”非本源性的特性，纯粹经验无法作为有效的概念直接使用。然而随着实用主义后期的转向，其提出的原初经验，让我们重新陷入人类经验中，难以对“数据—经验”做出进一步的探讨。

(3)在经验的二元分类——原初经验与反思经验中，如果原初经验与生命相关的话，那么自然就倾向于人类生命经验。因为原初经验是与生命相关，生命作为连续性和整体性的存在物存在。

从这样三个结论出发，面对最初的问题——“数据—经验”属于何种经验传统？会发现“数据—经验”无法纳入到任何一个传统中。最基本的原因是人工智能深度学习所获得的经验属于非人类经验，此外，尽管“数据—经验”最终演化为人工智能行动所依赖的知识，但是它并不是知识的来源和知识有效性的根据。如果按照罗素的定义，人工智能是在特定情境中采取最优化的智能体，那么它所形成的知识并不存在真实有效性的问题，而是存在行动有效性的问题，它能够确保智能体在特定情境中采取最优的行动。

三、“数据—经验”与人类经验的异构性
本文第一部分指出，“人工智能体从经验中学习和从数据中学习”呈现了“数据—经验”这样一个新的问题，需要哲学加以反思；第二部分的分析已经指出，“数据—经验”无法纳入到知识论、实用主义和解释学的传统中。那么如何理解“数据—经验”？这成为迫切需要解决的问题。为了解释这一问题，笔者接下来从人类经验出发，从经验内容、经验主体、经验行为和经验的时间特性等四个角度来分析“数据—经验”的实质。

第一，从经验内容来看，“数据—经验”是数据式的经验，揭示的是从内容角度显示出来的机器数据与机器经验的内在同一关系。从人类经验出发，会碰到“经验数据化”和“数据化经验”两种不同的表述。“经验数据化”意味着人类经验内容被数据化，强调的是经验内容的外在化过程。人类经验内容是感性的、质料的存在物，而数据则是通过数据技术对人类经验内容进行特定处理后产生的存在物，所以这是经验内容数据化的根本之处。再往深处分析，则会区分出可被数据化的经验内容和不可被数据化的经验内容。具体到人类的一种过去经验形式——记忆——来说，记忆已经完全展现出数据化的特性。这一点在法国技术哲学家斯蒂格勒那里有过非常细致的分析。他指出，数据时代人类记忆外化的主要形态就是数据化的记忆。“数据化经验”意味着以数据形式存在的人类经验形态，强调的是被编码后的人类经验形态。这个范畴强调的是可被数据化的经验最终的存在形态——以数据的形式被编码、存储和提取的人类经验形式。与数据化经验相对比，在人类技术发展历程上，人类经验内容可以被归纳、整理，以知识的形态存在。这也是人类经验的一种外在化形态。只是知识化经验主要强调人类经验转变成知识命题，而当采用“数据—经验”概念的时候，强调的是数据式的经验，即经验与数据的内在同一性。具体到深度学习而言，是对深度学习过程的哲学概括，是在把握从数据中学习、从经验中学习两个基本特征中对数据与经验同一关系的概括。

第二，从经验主体看，“数据—经验”并非是人类经验，而是对智能体学习过程的概括，是人工智能体在学习过程中逐步获得的经验形态。众所周知，人类经验源自感觉和知觉。“感觉和知觉乃是经验所具有的机缘，它们供给经验以有关的材料，但它们自己却并不构成经验。当加上保持作用而在许许多多的被感觉和被知觉的情况中有一个共同的因素抽绎出来，因而在判断和执行中可以为我们所用的时候，感觉和知觉便产生了经验。”[注]杜威：《经验与自然》，南京：江苏教育出版社，2005年，第226页。对于人工智能体来说，其经验有效性处在争议之中。因此只能在类似意义上来这样使用“机器经验”“智能体经验”“智能体经验”等概念。因为智能体也采取了感觉和知觉的形式，比如具有触摸功能的人工智能，比如电子皮肤、智能皮肤、多感知功能的智能人工手指，等等，这些技术的进展都展现了机器具有类感觉功能。不过，随着深度学习和强化学习的进展，机器经验不再是类比意义上的，而是具有了独立的意义。

第三，从经验行为本身看，“数据—经验”不具备人类经验行为的规定性。从哲学史可以看出，人类经验形成了如下特定的规定性：经验内化为记忆、经验外化为知识、经验与理性的差异。这三点形成人类经验本身的独特特征。人类与世界打交道的过程所形成的经验会内化为记忆，并形成一定的模式，这种模式在与世界的交道过程中不断重复，最终成为行为的根本基础；此外，经验外化可以形成知识，经验性知识都是来自经验归纳的结果。经验构成了知识的基础。再者，就是经验与理性的差异，二者在知识来源过程中存在极大的差异。前者来自观察和归纳行为；而后者来自逻辑理性，二者在知识的有效性、来源上存在着极大的差异。那么智能体的“数据—经验”是否具有如上特征呢？在经验内化为记忆的问题上，机器存在着极大的疑问。设想这样一个过程——机器人绕过一个障碍物的场景。机器人第一次碰到障碍物，通过算法做出了绕行的决策，从而绕过障碍物。如果第二次碰到同样的障碍物，它会同样绕开。如果说行为一和行为二之间存在着经验的关系，那么就很难说是两个行为。对于人而言，不会第二次掉进同一条河里就是基于经验做出的行为；但对于机器而言，会存在两次被同一块石头绊倒的情形。机器很显然无法在两个行为之间建立起任何关系。就第二点来说，“数据—经验”是否能够外化为知识？这一点似乎没有疑问。在深度学习过程中，的确是通过数据集的学习建立起相关的知识模型；经验与理性的差异在“数据—经验”这里其界限会完全消失。因为在深度学习过程中，所有的算法、数据都是理性的产物，智能体形成的数据体验也都是理性的结果。所以以数据形式存在的经验实际上是理性设定的结果。

第四，从行为的基础看，“数据—经验”没有时间性，而人类经验具有明显的时间性特征。胡塞尔在阐述人类知觉行为的时候，特别指出了行为当下化(presentation)、滞留(retention)和前摄(protention)的时间特性，这一时间特性将经验行为的时间性确立了起来，尤其是与当下感知、记忆和预期特性联系起来。这一时间特性也有助于理解上面提到的经验与知识的关系。一般来说，知识用于指导未来的人类行为，指向未来的维度是非常明显的。这与经验行为的前瞻性密切相关。另外，它也呈现出人类经验行为与记忆的密切关系，人类行为必然会不断地成为过去，成为自身的不可分割的一部分。

经过上述分析可见，“数据—经验”与人类经验在四个方面存在着极大的差异。不过，尽管“数据—经验”与人类经验之间存在着极大的差异，将它纳入到人类经验家族以及作为经验新形态确立起来还是存在一定的可能性。

四、“数据—经验”成为人类经验的新形态之可能性
接下来本文说明的是“数据—经验”能够纳入到人类经验家族的可能性，并且论证“数据—经验”能够作为人类经验新形态的形式出现。

首先，“数据—经验”与人类经验之间存在着相似性，使得作为人工智能体独特的经验形式能够纳入到人类经验家族中。“数据—经验”来自智能体感知，这一点与人类经验的感性来源是相似的。前面的分析指出，人工智能体的经验还是通过感知获得的，只是这种感知并非是对象式的，而是表现为“前对象的”。一篇名为《欺骗自动监控摄像头：针对攻击人类监控的对抗补丁》的文章描述了一个实验：实验员用一张贴纸让AI系统无法识别出面前的对象是人。[注]Simen Thys, et al.,“Fooling automated surveillance cameras: adversarial patches to attack person detection, ”https://arxiv.org/pdf/1904.08653.pdf(2019-04-18), 访问时间：2019年9月22日。整个实验显示，运用特定的对抗补丁，能够欺骗AI系统。在对抗神经网络(GAN)中有很多案例，通过语音、图像、文本等来欺骗AI系统。对抗性的人工智能对于对象的认识过程是前对象式的过程，如果没有对抗补丁，它们能够识别面前的对象，这个过程和人类认识过程基本一致：通过感知器获得数据，并且通过这些数据建立起对象。但是，如果加上对抗补丁，它们就无法识别面前的对象，至于识别成什么则变成了技术黑箱。上述技术类文章和实验也没有能够正面回应这一问题。所以，从经验内容来源看，“数据—经验”依然来自智能体的感知。

其次，人工智能体与人类、动物之间存在着相似的先天性结构，使得“数据—经验”能够纳入到人类经验行为中。DeepMind曾经发表了一篇人工智能体走迷宫的论文，该文章指出：人工智能中类似网格的表征给智能体提供了一种欧式几何框架，它如同哺乳动物发展出的网格结构，其功能如同康德所说的空间形式，可以用来组织知觉体验。[注]Andrea Banino et al.,2018,“Vector-based navigation using grid-like representations in artificial agents,”Nature，557,2018，pp.429-433. 这篇论文极力说明三个问题：(1)智能行动体表现出与人、动物相似的类似网格表征；(2)在应对复杂的外部环境时，类似网格的表征有助于人工智能体在空间中定位、组织路径；(3)如果没有外部因素的干扰，这种表征结构是比较稳定的。上述网格结构是生物体和能动体的空间组织形式的生物框架，对于生物体来说，体现为神经元结构；对于智能体来说，体现为人工神经元的结构。这些框架的作用从哲学角度加以分析就是体现为空间直观形式，机器能够对空间对象进行识别和感知。如果是这样，来自智能机器空间知觉的“数据—经验”与来自人类空间知觉的人类经验能够以相似的方式被处理。

再次，人机融合的技术发展使得“数据—经验”以一种身体化的方式纳入到人类经验家族中。随着人工智能的发展，曾经以赛博格形式出现的人机融合体逐渐变成现实。这意味着人类的身体与机器身体的融合，在这个融合过程中，出现的第一种可能是人类的感知和行动通过技术身体得到了延伸。还有一种可能是人类与机器融合之后形成新的感知躯体，从而通过感觉器官获得新的经验形式。在这两种可能形式中，很难区分出所谓纯粹的人类经验和纯粹的机器经验。美国技术哲学家唐·伊德曾经对具身关系中出现的技术体验进行过诸多分析，他的分析展示了人类身体与技术的融合与同一。但是他的技术体验分析还是在后现象学框架下展开的，不免过于突出身体物质维度，而忽略了感知行为中的内化走向。可以看出，人与机器融合之后的知觉行为所产生的经验质料难以还原到明确的归属，但是融合的过程也说明“数据—经验”通过一种身体化的方式融合到人类经验之中，在整个分析过程中，我们已经揭示出人类身体与技术身体的合一。

“数据—经验”在何种意义上成为人类经验的新形态呢？这一问题已经变得明确起来。因为与人类经验之间存在着家族相似性，也因为人机融合过程中的融合本身，使得智能体的“数据—经验”能够成为人类的经验构成。但是，这种智能体产生的经验却又是全新的，等待哲学去澄清其实质。至少在经验形成的过程上是不可解释的，因为对抗神经网络(GAN)都是基于深度学习算法的，所以不可避免地存在黑箱问题。人类很难解释和理解为什么人工智能会无法识别出一个带上对抗贴纸的人，也很难理解为什么会把一张大熊猫的图片识别成长臂猿。毕竟对于人类而言，这样的错误是不容易出现的。所以这是全新的经验类型。

五、“数据—经验”的记忆特性
罗素在《心的分析》中指出，人类经验是一种独特的记忆现象，“经验的本质就在于由被经验的东西所导致的行为上的改变。事实上，我们可以把一个经验链条……定义为由记忆的因果关系联系在一起的一系列事件”[注]伯兰特·罗素：《心的分析》，北京：商务印书馆，2018年，第69页。。他将人类经验还原到了记忆的维度上，这为分析“数据—经验”的特性提供了可能。如果说“数据—经验”能够作为人类新经验存在，那么它理应具有同等的经验特性，而这是接下来去揭示的问题了。从深度学习的发展历史中可以概括出这一特性：“数据—经验”具有记忆特性，而这一特性内部还包含着一个难以破解的困难——灾难性遗忘，即体现为新的记忆信息与旧的记忆信息之间的关系。

如果进入到深度学习领域，就会遭遇到人工智能历史上的矛盾对立面：以马文·明斯基(Marvin Minsky)为代表的联结主义传统与以谢诺夫斯基为代表的神经网络传统。前者主张符号、逻辑和规则的重要性，其在1969年出版的《感知器》，标志着神经网络寒冬的到来。而后者主张记忆特性，他与杰弗里·辛顿(Geoffrey Hinton)等人一起抱团抵抗来自明斯基传统的压制。这种现象很容易让人想到保罗·利科在《记忆，历史，遗忘》中提出的那句非常有名的话：“记忆现象，和我们紧密地联系在一起，最为顽强地抵抗着彻底反思的傲慢。”[注]保罗·利科：《记忆，历史，遗忘》，上海：华东师范大学出版社，2018年，第31页。这句话应用在人工智能领域是再合适不过了。如今，以记忆特性为代表的深度学习传统最为顽强地抵抗着以逻辑与符号为代表的传统，而且取得了有效的成果。

进入到深度学习的历史中，会发现其内在地围绕记忆进行的变迁。谢诺夫斯基曾经对深度学习的演进做过很好的论述。他指出传统的深度学习网络存在一个输入信息影响的衰减问题，“这种网络在20世纪80年代被探索并广泛应用于语音识别。在实践中，它在具有短程依赖性的输入方面效果很好，但当输入之间的时间间隔很长，输入的影响会随着时间的推移发生衰减，网络性能就会变差”[注]特伦斯·谢诺夫斯基：《深度学习》，第162页。。这一问题的根本是记忆信息的保持。为了解决这一问题，尤尔根·施密德胡博(Jurgen Schmidhuber)采取了另外一种方法，即长短期记忆(long short-term memory,LSTM)。后来的实践证明这一方法是有效的。“长短期记忆和深度学习的结合在许多依赖输入输出序列的领域都取得了令人瞩目的成功，例如电影、音乐、动作和语言。”[注]特伦斯·谢诺夫斯基：《深度学习》，第162页。2019年施密德胡博参加了上海召开的世界人工智能大会，再次向全世界强调了自己的观点。

哈比斯的人工智能学习框架指出，深度学习已经成为过去，而未来将迎来迁移学习。这两个阶段存在着共同的问题：信息的保持过程中出现的灾难性遗忘现象。“不必遗忘而学习持续性任务的能力对于我们来说是设计通用人工智能系统的重要步骤。”[注]Shixian Wen，“Overcoming catastrophic forgetting problem by weight consolidation and long-term memory,”https://arxiv.org/abs/1805.07441(2018-05-18), 访问时间：2019年9月22日。笔者也曾经指出“对于机器而言，遗忘就是灾难性的……是通用智能形成过程中的一个关键障碍。如何处理灾难性遗忘成为AI发展过程中的必须解决的重要问题。所以从这个危机中可以看到未来AI发展可能需要解决的问题”[注]杨庆峰等：《记忆哲学：解码人工智能及其发展的钥匙》，《探索与争鸣》2018年第11期。。众所周知，遗忘是记忆问题的重要维度。所以在深度学习过程中必须处理记忆问题，不仅是旧的记忆信息的长久保留，还有如何将新的信息对于旧信息的影响降至最低。面对这一问题，技术界提出了多重消除路径。2017年以来，已经出现了若干篇论文探讨克服灾难性遗忘的路径，如Conceptors[注]参见参见Xu He, Herbert Jaeger, “Overcoming Catastrophic Interference by Conceptors,” https://arxiv.org/abs/1707.04853(2017-07-20), 访问时间：2019年9月22日。Conceptor的概念非常有趣，其主要是解决大脑功能整合的问题，在人工智能界，从现象、功能、机制和对象等角度探讨agent的问题，为了解决这一问题，他们从不同学科借鉴了相应的概念，但是这些概念彼此之间的割裂情况非常严重。如何把这些概念整合成功能整体，成为一个重要挑战。科学家也提出了多种范式，如行为主义、网络大脑、心灵社会等概念，但是都不成功。Conceptor在2014年被作为一种新的可能性。Herbert Jaeger(2014)在一篇导论性文章中给出了定义：“这是一种神经计算机制，它就像干细胞，能够区分为神经计算功能的多样性，通过这种方式，它们在看似多样的神经认知现象底下显示了一个共同的计算原则。”参见Herbert Jaeger,“Conceptors: an easy introduction,”http://cn.arxiv.org/abs/1406.2671(2014-06-10),访问时间：2019年10月11日。、拉普拉斯路径[注]Hippolyt Ritter, Aleksandar Botev, David Barber,“Online Structured Laplace Approximations For Overcoming Catastrophic Forgetting, ”https://arxiv.org/abs/1805.07810(2018-05-20), 访问时间：2019年9月22日。、注意力路径[注]Joan Serr,Didac Suris,Marius Miron,Alexandros Karatzoglou,“Overcoming Catastrophic Forgetting with Hard Attention to the Task,”https://arxiv.org/abs/1801.01423,(2018-05-29), 访问时间：2019年10月11日。。

如此，当人工智能通过感知器获得数据信息，并对数据进行编码、存储和提取处理时，这意味着“数据—经验”最为明显的特性并不是像人类经验那样能够内化为原有经验的有机部分，而是存在着一种猛烈的碰撞。这种碰撞会影响旧信息的有效性，而这是人工智能性能的重要保障。这一记忆特性非常明显地表现出来。只是体现出记忆特性的“数据—经验”却是无时间性的，它更多地表现为信息以编码的形式被存储到某一处。而人类记忆信息则不同，它会进入到意识的深渊之处，并潜藏起来成为过去，并在当下某个特定时刻被当下化。另外，需要说明的是，这里的记忆特性只是限定在记忆内容的角度。如果将时间性纳入进来的话，“数据—经验”很显然无法将自身表现为时间现象。

六、总结
“数据—经验”概念的提出源自人工智能的学习算法的实质问题。从深度学习的技术定义可以看出，深度学习主要是智能体“从经验中学习”和“从数据中学习”。通过技术层面的揭示，“从经验中学习”与“从数据中学习”是同一的关系。这二者甚至构成了深度学习过程的两个不同侧面。所以，对“数据—经验”概念的反思主要是指向这些问题：数据在何种意义上正在成为经验的新来源？“数据—经验”能否成为一个新的概念并进一步充实人类经验概念？对这一概念的哲学分析表明：

1. “数据—经验”是AI通过学习算法获得的经验，它成为机器经验的来源。根据Deep Mind创始人哈比斯的观点，过去AI学习主要是深度学习(Deep Learning)和强化学习(Reinforcement Learning)，未来关注的是有效学习和迁移学习、想象。在这四类学习中，基本的形式都是数据驱动的学习模式。

2.“数据—经验”所指向的学习过程是“从经验中学习”，其中的“经验”是指与数据有关的经验。“有关”不是一种因果关系，数据不是导致经验发生的原因，而是展现为生成关系，在数据的积累过程中形成了类似于人类经验的东西。“类似”意味着数据成为机器学习经验的生成基础。

3.“数据—经验”中的“经验”更多表现为与记忆有关的存在。记忆意味着信息的保留、特征的抽象过程，而整个深度学习所获得的恰恰是被编码的数据，而其所遭遇的瓶颈问题恰恰是记忆信息如何更好地保持。从关联记忆(associative memory)到长短期记忆(LSTM)的演变，恰恰说明深度学习在不断解决着经验的形成问题，经验形成表现为记忆信息的保持。但不幸的是，新的经验如何与旧有的经验相融合，成为通用人工智能遭遇的瓶颈问题。

4.这一概念的提出需要重新面对与经验有关的哲学命题：“无生命，无经验。”生命是经验的前提，经验是生命历程的结晶。从这个角度看，经验并不是知识论传统中被抛弃的东西，反而是生命自身经历的凝结。如果人工智能通过学习算法能够获得数据式经验，那么它理应是一种独特的生命体形式。也就是说，只有接受人工智能是一种特殊的生命形式，这一点才是有效的。

5.当把“数据—经验”作为人类经验新形态的观点确立起来的时候，也可以验证自然语言领域的泰斗丘吉(Kenneth Church)关于“深度学习是经验主义的新高峰”的观点。“经验主义复兴最直接的原因也许是大量数据可用：文本从来没有这么丰富过。10 年前，搜集了100 万词的布朗(Brown) 语料库就被弗朗西斯(Francis) 和库塞拉(Kucera) 认为是大数据，但即使在那时，也有更大的语料库，如伯明翰(Birmingham) 语料库。如今，许多地方的文本样本已经达到上亿甚至几十亿词量……通常称为文本分析的数据密集型语言研究方法采取的是实用主义手段，非常适合近来被强调的数值评估和具体的任务。” [注]K. Church ,“A Pendulum Swung Too Far，”Linguistics issues in Language Technology,6(5)，2011.此外，可参见丘吉：《钟摆摆得太远》，《中国计算机学会通讯》2013年第12期。 “从经验中学习”“从数据中学习”成为新的经验类型而被纳入到人类经验家族之中，正如丘吉说的，最终导致的结果是推动着经验主义进一步走向新高峰。

(致谢：本论文曾经在2019年12月9日南京大学召开的“人工智能与人类未来”工作坊宣读，多位专家提出了很好的建议，在此一并感谢！)

JOURNAL OF NANJING UNIVERSITY

(Philosophy, Humanities and Social Sciences) №1, 2020

		自动登录	找回密码
密码			立即注册

论作为人类经验新形式的“数据—经验”

浏览过的版块