记忆与表征结构-情感机器: 人类思维与人工智能的未来在线阅读

语速55: 80

进度0:

记忆与表征结构

威廉·詹姆斯（1890）：没有任何性能是只属于某一物体的。同样的性能可能在某一场合被看作一个物体的本质，但也会变成其他物体的非必要特征。

每个人都可以想象事物，我们可以听到大脑里的字词或短语；我们勾勒出并不存在的环境，并借助这些形象来预测未来行动可能带来的影响。人类的大部分智能来源于对物体、事件或概念的精神表征的处理能力。

但表征（representation）具体指什么？在我看来，表征指存在于大脑内的任何结构，它可以用来回答问题。只有当表征和所谈论的物体相似时，这些答案才有意义。

我们有时会使用具体的物理实体来表征事物，如使用图片或地图来寻找城市里的道路。然而，回答过去发生的事情时，我们必须使用所谓的“记忆”，但“记忆”指什么？

每一条记忆都是对过去发生事件的记录或追踪，当然，你不能追踪事件本身，至多能记录与那个事件相关的物体、想法、关系以及事件对你当时精神状态的影响，例如，当你听到“查尔斯送给琼一本书时”，可能以一种类似脚本程序的一系列If→Do Then规则来描述这个场景（见图8-17）。

查尔斯给琼书时的If→Do Then规则

图8-17 查尔斯给琼书时的If→Do Then规则

然而，你也想知道那本书是个礼物还是个借出物，查尔斯是否想讨好琼，场景中的两个人着装如何以及他们的谈话意义如何。因此，我们对任何特殊事件都会作出几个典型的表征。例如，这些记录可能包含以下内容：

● 对事件的口头描述；

● 对场景的视觉刺激；

● 涉及人物的一些模型；

● 人物情感的模拟；

● 相似场景的平行类比；

● 对未来可能事件的预测。

为什么大脑能够以多种不同的方式来表征同一事件呢？如果涉及想法的每一领域都留下了其他记录或痕迹，它们将会让你用各种各样的方式思考同一个事件，例如，通过使用口头推理或操纵精神图式，或幻想参与者的手势和面部表情。

如今，我们对大脑如何作出这样的记忆、如何获得以及“重放”记忆所知甚少。尽管我们对大脑细胞的行为运行方式知之甚多，但对细胞如何组成更大结构来表征对过去事件的记忆却一无所知。反思也不能帮助我们了解这些过程的细节，通常情况下，我们可以说的最多只是我们“记得”某些发生在自己身上的事情。所以，下面将主要描述几个结构，它们可能会被大脑用来表达存储在记忆中的知识。让我们继续思考这些结构在大脑中排列的方式。

表征知识的多种方式

我们与动物的区别在哪里？最重要的不同就是其他动物都不会问这样的问题！人类似乎有着独一无二的能力，能把想法当成事物看待，换句话说，就是使之“概念化”（conceptualize）。

然而，为了创造并使用新的概念，我们必须使用存储在大脑网里的结构形式来表达这些新的想法，因为任何细小的知识碎片都没有任何意义，除非这些细小的知识碎片是大型化框架中的一部分，且大型化框架与大脑知识网中的其他部位相联系。然而，这些联系的呈现方式无关紧要，相同的计算机可以用金属丝和开关组成，甚至可以用滑轮、积木或绳子组成，重要的是相关部分改变时，其他每一部分如何作出改变以回应这些变化。

换句话说，知识并不是由悬浮在精神世界里的单独实体“想法”构成的，它们也需要相互关联。把想法和观念想象成“抽象概念”，以图式的符号形式或以句子和篇章形式来表征想法，这通常都是有益的。然而，想要思想或概念具有实际的效果，例如使用双手移动积木、使声带发声或想出另一个想法，就必须有一些物理结构来联系大脑内部的不同表达。

本节回顾了研究者们经常用来表征计算机内部知识的一些当代观念，以及一些还没有被验证的观念和想法。由于篇幅的限制，我们并没有讨论太多细节，《心智社会》一书详细地讨论了本节中的话题。^[94]

把事件描述成故事或脚本

或许我们用来表征事件的最熟悉的方式就是把它当作一个及时描述系列事件的故事或脚本，也就是说，以故事或叙述的方式。我们在分析“查尔斯送书”的场景以及卡罗尔计划建造拱形门时，都已经使用到了这种脚本（见图8-18）。

将事件描述成故事或脚本

图8-18 将事件描述成故事或脚本

并不是所有的过程都顺次排列，大多数计算机程序主要由像这样的系列行动组成，但在某些时候，这种顺序可能会被分支的If情况打断，因此脚本可能朝向不同的方向，这取决于特定的当前条件。尽管如此，过程一旦完成，人们便可以通过列举其选择的路径简化或总结过程，如“我在尝试使用玩具积木制造拱形门，我发现必须首先建造支架，然后搭上顶盖”，这其中省略了许多在学习搭建积木时所走过的弯路。

用语义网络描述结构

故事或脚本中的每一个名目都有可能代指其他更复杂的结构，例如，为了理解“琼”或“书”的意思，读者必须首先拥有表征这两个术语的结构。一旦我们需要描述更多的细节，比如物体部分之间的关系，使用类似图8-19描述的结构便能够更好地表征人物或书本。^[95]

语义网络

图8-19 语义网络

每个所谓的“语义网络”都是符号的集合，与其他标记的联系相连。它们拥有丰富的表征形式，因为每个联系本身代指很多表征类型，图8-20中的语义网络就描述了3块拱形门积木的众多部位之间的联系。

拱形门积木中的语义网络

图8-20 拱形门积木中的语义网络

每一个部分、支撑和不接触的联系反过来代指其他结构、资源和过程，人们可以利用这些理解语义网络对其他事情的表征，例如，代表“支撑”的联系可以用来预测这种情况：如果我们移除下面支撑的积木，最上面的积木就会掉下来。

用传送框架表征多个行动

为了表达行动的效果，使用一对语义网络来表达已经发生变化的行动是非常方便的。在第5章中，我们知道如何通过改变一个名称或高层次表征的关系来替代拱顶，而不是改变成千上万的点来形成图片似的图像（参见图5-33）。

我们使用术语“传送框架”（Trans-Frame）来命名这对表征，它呈现的是行动完成之前和之后的条件。我们可以通过将一些传送框架相连，从而形成故事或叙述，来表达一系列行动的效果。图8-17所示的“查尔斯送给琼一本书”这一行动就包含5个这样的“传送框架”。

图8-21是“查尔斯送给琼一本书”这个事件的另一个版本，只有3个表达，每个框架却展示了更多的细节。

另一版本的3种表达

图8-21 另一版本的3种表达

用框架表示常识

在1974年和1986年的两本书中，我描述了框架和传送框架的概念，因此，在这里我将不再重复其细节。然而，关于其使用方法，有几个重要的知识点要重申一下。传送框架能够通过描述行动之前或之后的条件来表达行动的效果，但它也可以囊括常识的信息，如下面这些知识。

● 谁执行了行动？为何执行？行动对其他事情造成了何种影响？

● 行动从哪里、何时开始？

● 行动是否有意的？它有什么目的？

● 使用了什么方法或工具？

● 克服了什么困难？它的副作用是什么？

● 行动涉及了什么资源？接下来会发生什么？

例如，图8-22是一个传送框架，描述了琼从波士顿到纽约的旅程，其中可能有许多像下面所描述的额外的“槽”。

琼从波士顿到纽约的传送框架

图8-22 琼从波士顿到纽约的传送框架

这个传送框架包括两个语义网络，描述行动旅程开始之前和之后的条件，但它也包括了表达信息的槽，告知琼何时、以什么方式以及为什么开始了那场旅行。这些槽也包括普通问题的简单答案，换句话说，传送框架的槽通过“默认”方式涵盖了大量被我们称作常识的知识。

例如，当某人说“苹果”时，你似乎立刻就会知道苹果是长在树上的，又圆又红，人类的手掌大小，有着特殊的纹理、味道和口感，听到苹果这个词后，根本不需要反应就会知道这些常识。第6章和第7章提出了是什么使得我们的大脑如此迅速地获得其需要的常识性知识的问题。部分原因是，每个传送框架中的槽已被最为普通和典型的信息填满，而且你可以通过这些信息判断自己是否需要额外的信息。

如图8-23，你会“默认”苹果是红的，但如果你知道某个苹果是绿色的，可能会在颜色槽里用“绿色”替代“红色”。换句话说，一个典型框架描述的模式是，“默认假设”（default assumptions）通常是正确的，但一旦遇到特殊的例外情况，必须确保能够轻易作出改变。^[96]

苹果的信息

图8-23 苹果的信息

所有成年人都知道很多这样的条目，并把它们视为日常生活中的常识，但每个儿童却都需要花费几年时间学习传送框架在不同条件和领域下表现出的所有细微差别。例如，人们知道，如果在物理领域移动一个物体，会改变物体所在的位置，但如果你告诉朋友们这些信息，这条相同的信息将分布在不同的两个地方。同样，如果你听说查尔斯紧紧抓住书，也不会询问他为什么要这么做，因为你默认他和其他大多数人一样，拥有最平常的常识，他这样做就是为了不让书掉到地上。

“默认假设”的想法有助于解释人们如何快速地获得常识性知识：只要你激活了框架，许多你可能会问的问题在你开口询问之前就已经有了答案。^[97]

通过构建“知识线”来学习

假设你刚刚想出一个有助于解决某个难题P的好主意，你能从这个经验中学习到什么？其中之一就是创建新的规则：如果（If）你面对的问题就是问题P，那么（Then）尝试着寻找以前出现过的有助于解决问题P的方法。If→Then规则能够帮助你解决与问题P相似的问题，但无法帮你解决不甚相似的问题。然而，如果你能记录下寻找解决方法的思维方式，会更容易在更为广阔的情形下寻找解决的方法。

当然，复制人类思维整个状态的行为是不切实际的；但是，如果你想在发现解决问题P的方式时重新激活一些资源，则有很大可能成功。你可以创建一个全新的联系选择器，从而有助激活这些近期使用过的资源完成目标。我们称这样的结构为“知识线”（knowledge-line，或简称为“K线”），这样的知识线发挥着精神活动中的“快照”作用，因为当你后来再次激活那些资源时，它会将你置入一个相似的状态（见图8-24）。

K线激活资源

图8-24 K线激活资源

以下是一个类比，说明了知识线的运行方式。

肯尼斯·哈泽（Kenneth Haase，1968）：你想修自行车，在开始之前，双手都是红色的油漆，你使用的每一个工具上也都沾满红色的油漆。修好之后，你会记得“红色”适合“装饰自行车”。如果你使用了不同的颜色来做不同的工作，一些工具上就会有几种不同的颜色……之后，当你有一些工作需要完成时，你只需要触发一套工具，其合适的颜色和可用的资源都任你使用。

这样一来，对于每个问题或工作，知识线都会使你的大脑充满多种相关的想法，会使你进入一个有助于自己完成工作的相似的状态。

学生：我能理解新的知识线是如何被当作新思维方式的选择器的，但当需要激活这些选择器时，如何创造新的批评家？

如果我们想要使用新的知识线来解决相似的问题P，那么这个批评家应该识别一些问题P特征的组合（见图8-25）。

问题P特征的组合

图8-25 问题P特征的组合

然而，如果只有当问题P的特征全部出现时，这样的批评家才会作出反应，也就是说批评家可能无法识别与问题P稍微不同的情况，因此每个新的批评家应该仅能识别有帮助性作用的特征。

学生：我明白你的意思。假设在修理自行车时，你恰巧使用了一件把自行车变得更糟糕的工具，把工具刷红也没有任何作用，因为之后你可能会浪费更多时间。

这表明，当我们制作新的选择器和批评家时，大体说来，只要通过学习，我们就应该试着确保学到的知识能够真正地起到帮助作用。下面关于信用赋能的部分将主要讨论一些有助于确保学到的知识与未来的事情相关的过程。

学生：如果每条知识线仅被用来重新访问你已经熟悉其使用方法的思维方式，那么这些知识线还会有助于创造全新的事物吗？

这不成问题，因为当你激活知识线时，它并不能完全替代你当前的思维方式，原因是知识线在关闭一些资源的同时激活了另一些资源，但是你当前的很多资源仍能参与其中。因此，大脑中两种不同的资源集将同时处于激活状态：一种被用于当前的思考，一种被用于记忆。如果这些资源相互匹配，那么这两种资源可能会共同协助解决当前面临的难题。你可以把这两种资源以外的其他资源相结合，以一个新知识线的形式存储起来，结果就是，你为新的思维方式创造出了新的选择器。

如果当前的资源与知识线激活的资源不相匹配，该怎么办？其中一个办法就是优先考虑知识线激活的资源。但这个方法也有些副作用：我们并不希望自己的记忆重新且紧密地还原为原有的思维状态，淹没当前的想法。这是因为如果这样，我们可能会丢掉自己当前的目标，近期完成的所有工作也可能会消失。另外的办法就是，给予当前活跃的资源而不是记忆中的资源优先权，或者两种资源都进行压制。

我的答案是，使用一种方法可能永远无法取得令人满意的结果，因此，智能的人们在处理纷繁复杂的情形时总会寻找方法来（使用高层次的策略）决定哪种方式最合适。无论使用哪一种方法，最后的思维状态肯定与之前的思维状态有些许不同。所以，每种新情况都可能形成全新的思维方式，并且如果你能快速地将其“记录”下来，将会拥有一条全新的知识线。^[98]

我们应该注意到，心理表征几乎从不“白手起家”，原因是无论我们何时制作新的心理表征，它总是与旧有的心理表征相关。例如，当你理解“查尔斯送给琼一本书”这件事时，你对它的表征几乎全部是以前所建构的查尔斯、琼和书本的表征的总和。因此，听到句子之后，你的思维状态也囊括了其他概念所使用的资源。

所以，如果你尝试作出能够再现精神状态的单一知识线，那么知识线将需要和不计其数的其他资源相联系。然而，你也可以仅仅通过作出一条与查尔斯、琼和书的原有表征相联系的知识线来实现同样的效果。之后，每当你尝试激活这条新的知识线时，它会给予你一种重新经历这些精神活动的感觉（见图8-26）。

依附于其他3种知识线的知识线

图8-26 依附于其他3种知识线的知识线

联结主义和数据表征

让我们来比较以下两种不同的表征“苹果”这一常识性知识的方式。苹果是一种可食用的水果，颜色有红黄绿三种，果肉脆，色泽鲜亮，味道酸甜，种类繁多且产自欧亚地区（见图8-27）。

苹果的两种表达方式

图8-27 苹果的两种表达方式

图8-27左图是关于苹果的语义网络，描述了苹果各个部分、方面的特点以及它们之间的关系。右图是“联结主义网络”（Connectionist Network）模型的例子，也展示了苹果的一些方面，但缺乏简单的方法来区分各部分之间的不同关系，只列了一些数字，表明不同特征是如何紧密“联系”的。联结主义系统有很多实际的应用，原因是这种系统可以进行学习，从而识别模式的重要类型，而不再需要为其编程。

然而，这些基于数字的网状模型也有局限性，限制了它们进行反思。人们有时可以把这些数字价值解释为关联或可能，但因为它们并没有线索来暗示这些联系的内涵，因此其他资源很难使用这样的信息。问题是，联结主义网络模型必须将每个关系缩减为单一价值或“力量”，因此，任何形成它的证据几乎都无法存留，例如，如果你看见数字12，你是不能分辨出是代表了5+7、9+3或27-15，还是描述了房间里的人数或是人们坐的椅子的椅腿数目的。简而言之，数字表达成为高层次思维方式的障碍，而语义网络就可以清楚地解释各种各样的关系。

我提到这些，主要是因为尽管我在发明语义网络的过程中发挥了作用，但是近年来我看到，这种网络概念的普及阻碍了对人类心理学机制中高层次思想的探索。据我了解，对常识性知识的探索1980年前在不断进步，之后，人们普遍认为未来的进步取决于能否找到获取和组织上百万个常识性知识碎片的方法。这个前景如此令人震惊和宏伟，许多研究人员决定尝试着发明能够独立学习的机器，学习本身所需要的知识，概括说来，也就是发明类似第6章提到的儿童机。

很多这样的学习机器确实能学习做一些有用的事情，但很少有机器能形成较高层次的反思思维方式，我猜测主要是因为它们尝试使用数字的方法表征知识，因此很难产生富有表现力的解释。

然而，我并不认为这些语义网络不重要，我们将在“表征等级”一节中看到，可以认为，大脑中很多低层次的过程必须使用联结主义模型的一些形式。

语境知识的微粒体

我们经常面对一些模棱两可的情况，一件事情的意义取决于精神环境中余下的部分，这也适用于思维中的多种活动，因为活动的意义在于激活了哪种精神资源。^[99]换句话说，任何符号或物体本身并没有任何意义，而你对这些符号或物体的解释则取决于自己身处的精神环境。例如，当你听到词语“木块”时，你可能会认为它是进步的绊脚石、矩形的物体、用来在上面砍东西的木板子或用于在拍卖会上展示物体的木台。你会选择何种解释？

这样的选择经常取决于你自身当前的精神环境，它会让你从一系列选择中作出抉择：

● 概念的或物质的；

● 已证实的或猜测的；

● 强健的、脆弱的或可修理的；

● 公众的或私人的；

● 城市、农村、森林或农场；

● 不规则的或对称的；

● 动物、矿物或植物；

● 普通的、稀有的或独一无二的；

● 室内的或室外的；

● 居住地、办公室、剧院或汽车里；

● 颜色、纹理、硬度或强度；

● 合作的或竞争的等。

许多像这样的环境特征都有共同的名字，但许多其他事物却没有这样的表达，正如我们不具备很多描述味道和气味、手势和语调、态度和性情的词语。我建议使用术语“微粒体”（micronemes）来表达许多影响和改变我们对事物看法但难以形容的线索，图8-28表明一些环境特征可以通过机制来影响我们的精神过程。^[100]想象一下，大脑包括成千上万根线状纤维，它们贯穿大脑内部的其他结构，因此每一个微粒体的状态都能对许多其他过程产生影响。

微粒体的输入与输出