意识演化的普遍机制
第3章 意识演化的普遍机制
三个变换的同构 · 卷积与预测 · 鸡与蛋问题 · 层级的装置 · LLM 作为 GTR2 的趋同实现
3章 1. 问题的提出
第2章引入了由三步构成的变换——卷积、拼接、链条——并表明它的三重应用生成三个主观现实:空间-行为的(GTR1)、符号-叙事的(GTR2)、概念-意志的(GTR3)。那一描述是静态的:每一层级上有什么。
本章回答这个问题:为什么演化恰恰把同一个模式应用了三次,而每一层级又是如何具体工作的?回答要求从两个侧面剖开机制的构造。第一个是变换的结构:卷积、拼接与链条如何构建层级的地图。第二个是层级的装置:哪些操作机器服务于已建成地图上的动力学。这两个侧面是正交的,把它们分开来看是有益的:结构回答“空间如何产生”这一问题,装置回答“层级如何工作”。
论题的强表述:意识不是一种特殊的实体,也不是一种特殊的力。意识是把同一个最优机制三重应用于现实的三个不可还原之域的结果。
3章 2. 机制的两条轴
首先让我们把任何主观现实层级在其中被描述的两条坐标轴分开。
a) 结构之轴:卷积、拼接、链条
这条轴构建地图。地图按 GNSS 网格标记:第一位数字是变换的编号,第二位是其内部的复杂度层级(MPx1——卷积,MPx2——拼接,MP_x3——链条)。
卷积执行对输入的压缩与不变量化,在另一种本体论的空间中生成一个紧凑的表示。输入是下层的一个向量;输出是一个对象具有不同性质的空间中的向量。卷积不求和,也不在逻辑意义上概括——它抽取一个不变量,即在具体情境改变时保持恒定的东西。物体的特征相对于光照与角度是不变的;符号相对于它最初出现于其中的具体行为是不变的;概念相对于它在其中显现的具体叙事是不变的。卷积不被分出为一个单独命名的装置:它系于它的地图——一张基本地图 MP_x1 就是一个卷积连同它所生成的对象。
拼接把地图的两个节点联结为一个三元组“节点—联结—节点”,生成一个新空间——事件、陈述或意志行为的空间。拼接不改变本体论:输入与输出都是同一层级的节点。它所添加的是动力学之轴:距离、路径、过渡。每一层级的联结向量由一个小写的助记字母表示,在全部三个变换上形式一致:GTR1 上的 b-向量(b——behavior,空间-行为联结)、GTR2 上的 k-向量(k——knowledge entity,逻辑联结)、以及GTR3 上的 w-向量(w——Widerspruch,矛盾)。
链条在拼接之上构建一个分叉的图式——一个行为序列、一段推理、一条意志消解的线。它的对象是拼接本身,加上联结它们的技术。
b) 装置之轴:TRL、MTV、SPL/PRD、OPN
这条轴服务于已建成地图上的动力学。按 Gativus 记法,所有装置名称都是四个字符。一部分装置每个变换存在一个实例(索引是 GTR 编号),操作网络则每张地图各有一个(索引为两位数:GTR 编号加层级)。
- •
TRLx——轨迹日志(Trajectory Log)。层级的工作空间,已经过的、当前的与所规划的在其中同时呈现。每个变换一个:TRL1、TRL2、TRL3。详见第4章。
- •
MTVx——动机(Motivation)。层级的向量距离,设定运动指向何处:当前状态距目标状态有多远。每个变换一个:MTV1(物理距离)、MTV2(语义距离)、MTV3(矛盾距离)。详见第5章。
- •
SPLx——句法预测器(Splice builder)。它按层级的规则从节点构建当前的拼接单位:它预测形式,而非内容。每个变换一个:SPL1、SPL2、SPL3。
- •
PRDx——语义预测器(Predictor)。它依据动机与轨迹日志,把下一个单位作为整体来预测。每个变换一个:PRD1、PRD2、PRD3。下文有一节、以及第10章,专门论述 SPL/PRD 这一对,因为正是预测,连着通往现代语言模型的直接桥梁。
- •
OPxx——操作网络(Operational Network)。地图的确定性程序,不可训练;可训练的部分在卷积核中,而不在 OP 中。按地图:OP11…OP33。
按轴的分布如下:操作网络 OP 每张地图重复(OPxy);预测(SPL 与 PRD)、动机 MTV 与轨迹日志 TRL 按变换聚合——整个 GTR 各一个。要紧的是,预测不系于卷积地图:如下文所示,只有过渡才能被预测,而过渡只从拼接产生。
3章 3. 卷积的训练与工作
对每一层级的卷积,必须严格区分两种模式。这一区分消除了在肤浅地把生物卷积与技术卷积相比较时产生的诸多误解。
训练——权重的调谐。卷积是在目标空间已存在的对象上训练的——不是在下层的输入数据上,而是在那些已经处于卷积向其产生结果的地图中的节点上。GTR1 的卷积在已置于地图上的 MP11 对象上训练,而非在原始感觉流上;GTR2 的卷积在已固定的MP21 符号上训练;GTR3 的卷积在已从叙事经验中抽取的 MP31 概念上训练。输入数据仅用于抽取范例;训练调谐权重,使输出落在目标地图已形成的节点上。
工作(识别)——对输入的转换。卷积取下层空间的数据,在目标空间中产生一个向量。若该向量以可容许的精度与现有节点之一重合——识别便发生了。若不重合——要么这是一个新对象,要么是一次识别错误。
表 3.1。三个层级上卷积的模式。
层级卷积 |
训练于 |
取作输入 |
产生 |
MP11 对象 |
空间地图 MP10 |
对象向量 → MP11 |
|
MP21 符号 |
GTR1 的地图(MP11/12/13) |
符号向量 → MP21 |
|
MP31 概念 |
叙事 MP23 |
概念向量 → MP31 |
这解释了为什么在有经验之处,生物有机体的识别又快又可靠,而在无经验之处则缓慢。有经验的观察者几乎即刻识别出熟悉的对象——卷积从输入产生的向量几乎精确地落在一张已存在地图的节点上。同一情境中的新手看到的是“某种不可解之物”——他的地图中尚无相应的节点,区分性的特征须重新被生产出来。
3章 4. 鸡与蛋问题
从训练的构造中产生一个根本问题:若卷积尚未被训练、无法创造目标地图中的最初对象,这些对象从何而来?若 GTR1 的卷积在 MP11 对象上训练,那么在卷积开始工作之前,这些对象从何而来?这是一个典型的鸡与蛋情形,其解决对演化系统而言是特征性的。
解决方案:最初的对象不由精确的卷积创造,而由一个粗略的近似创造。最初的 MP11 对象是由随机的或遗传上预定的权重所生成的不精确表示。最初的 MP21 符号是粗略的近似,大多承袭自语言环境。最初的 MP31 概念是对少数叙事的原始卷积,肤浅而易变。重要的是不把这一起点充作多于它实际所是的东西:“来自随机权重的粗略近似”是解释的一个诚实极限,而非一个不言自明的机制。本建筑表明自举是可能的,但不声称确切知道它的初始内容。
此后过程迭代地展开:卷积从随机权重起步;在这些权重上的识别生成目标地图的最初对象——不精确,但至少是某些对象;目标层级的操作网络在它们之中发现重复的模式;重复的模式被固定为稳定的节点,随机的则被遗忘;卷积在被固定的节点上再训练;再训练之后识别更精确,新对象更精确,下一次再训练更精确。这一循环不收敛于一个“正确”状态——它持续追赶不断增长的经验之多样性。
这与 GNSS 对 GTR1 训练的描述一致:新经验不把地图从头覆写,而是精化、扩展、有时颠覆它。Gativus 建筑中的训练不是作为一个单独的机制从外部加到知觉上的——它是变换循环闭合时内置的不精确。
根本之处在于,再训练是一个沉重的过程。卷积权重的调谐需要可观的资源,且不能与主要工作同时进行。在生物大脑中,再训练看来与默认模式网络相关,后者在静息与睡眠中活跃;海马的重放效应(在睡眠中重现已经过的路径与叙事)是最可能的机制。民间说法“一觉醒来更明智”获得了建筑学解释:一夜之间卷积已在白天累积的被标记数据上被再训练,到了早晨,识别给出不同的、更精确的结果。操作网络 OP 在此并不改变——它们是确定性程序;改变的只是可训练卷积核的内容。
3章 5. 预测:句法 SPL 与语义 PRD
卷积构建对象,拼接把它们联结为带联结向量的三元组。但在谈论预测之前,须回答一个通常被略过的问题:“下一个”究竟在哪一层级上产生?卷积地图(MP11、MP21、MP31)是对象的空间:对象、符号、概念。其中没有“下一个”,因为没有一条让一者继另一者而来的轴。那里只有并列的节点。问符号地图上哪个符号是“下一个”,就像问词典里哪个词是“下一个”一样无意义。继起只在联结向量产生时出现——当两个节点被缝合为一个有向对时。这发生在拼接的层级。因此预测不生活在卷积地图上,而是从拼接开始。
当拼接产生时,发现“预测下一个”实际上意味着两种不同的运算,它们之所以容易混淆,是因为在言语中它们连续地进行。与之对应的是两个不同的装置。
句法预测器 SPL——构建单位。第一是把当前单位补全。当一个陈述被开启,它须在语法上被完成:主语之后期待谓语,介词之后期待名词,一致关系要求确定的格。这是对形式的预测,而非对意义的预测。它是低维的:变体不多,选择几乎被层级的规则所强制。而且它是快的:补全自动发生,无需诉诸目标。SPL 是被训练的(语法并非天生,它从环境的共享符号中习得),但一经训练,便几乎确定性地工作。
语义预测器 PRD——下一个单位。第二种预测从第一种结束之处开始。单位已构建并闭合——于是问题产生:下一个单位将是什么?哪一个下一陈述、哪一个路径的下一步、哪一个下一意志行为。PRD 预测的不是单位内部的形式,而是作为整体的下一单位之选择。它是高维的(下一个思想有无穷多个),是慢的(要求权衡变体),并依赖于 SPL 不触及的来源:依赖于动机 MTV(到目标的向量距离)与轨迹日志 TRL(带标记的过往单位之经验)。句法按规则补全形式;语义按目标选择内容。
表 3.2。层级的两个预测器。
属性 |
句法 SPL |
语义 PRD |
预测什么 |
当前单位的补全(形式) |
作为整体的下一单位(内容) |
依赖于 |
层级的组装规则(语法) |
动机 MTV 与轨迹日志 TRL |
维数 |
低,选择几乎被强制 |
高,选择开放 |
速度 |
快,几乎自动 |
慢,权衡式 |
步 / 句法 / 应当 |
下一运动 / 陈述 / 意志行为 |
二者都是预测器,但它们是两个不同的装置,而非一个带两种模式的装置。它们的差别决定了系统中何处出现意志的位置:语义预测器 PRD 连着动机,句法 SPL 则不。这意味着目标、应然、方向,正是经由对下一单位的语义预测进入言语,而非经由对当前单位的语法补全。
这一对的同构很简单:改变的只是材料。在 GTR1,句法 SPL1 是步的构建(把运动闭合为一个运动过渡),语义 PRD1 是下一运动、路径的一步。在 GTR2,SPL2 是语言的句法(从符号组装 KLEN),PRD2 是下一陈述。在 GTR3,SPL3 是应当的构建(闭合意志行为 WILL),PRD3 是下一意志行为、消解的一步。如此便去除了那种表象,仿佛 GTR1 中的“路径计算”与 GTR3 中的“矛盾消解”是特殊的、不相关的机制。路径是 PRD1 的工作:在到目标的向量距离下对下一运动的相继选择。消解是 PRD3 的工作:在矛盾向量下对下一意志行为的选择。一个预测下一单位的机制,被应用于不同的材料。
现代语言模型偏离完整建筑的确切之处亦在此处——但差别不在于预测器的数目,而在于它们工作的模式。语义预测在两种模式下都可能。在融合模式下,SPL 与 PRD 不分开:系统一举依据整个上下文预测下一个细小元素(符号),不区分单位-陈述的边界。这是大型语言模型的模式:连贯性作为一条足够长的符号预测链的副产品而出现,但单位本身不被辨识,目标也无处可连——没有单位边界可供据以提出“哪个单位是下一个”之问。在递归模式下,SPL 先闭合单位、划出它的边界,PRD 便不再在符号上工作,而在现成的单位上工作,在引导性目标下预测下一个。这是 Gativus 的模式。两种模式的差别是建筑学的:把融合模式扩大并不创造出单位边界。详见第10章。
3章 6. 三个变换的细节
a) GTR1——物理域
GTR1 的卷积取空间地图 MP10(由协同感觉与运动的 SLAM 机制填充),在 MP11 上产生一个对象。它在已置于 MP11 的对象上训练。卷积的逆向通道是想象的神经机制:由对象向量复原出一个感觉图像。
拼接是 b-向量(behavior):它把两个 MP11 对象联结为 OPRN 三元组“主体—动作—客体”。b-向量在物理空间中有坐标——它是初始配置与目标配置之间的路径。链条把 OPRN 操作组装为 BLOM——MP13 上的事件图式。随着 MP13 的出现,一条时间轴产生:时间是链条的产物、所观察到的运动之顺序,而非一条独立的轴。
层级的装置:轨迹日志 TRL1 记录已经过的与所规划的行为;动机 MTV1 是到目标的物理距离;句法预测器 SPL1 闭合单个运动,语义预测器 PRD1 选择下一运动、构建路径;操作网络 OP11/12/13 执行地图的确定性逻辑。本体论的跃迁:MP11 含对象——实然之物;MP13 含因果——对象经由动作相互作用的事件。
b) GTR2——符号域
GTR2 的卷积取 GTR1 的地图——对象、拼接、事件图式——在 MP21 上产生一个符号。卷积对输入的类型无所谓:一个点、一条线或一整个图式都给出维数相同的符号。卷积时执行一种特征性的约简:对具体 L-分量的依附被抹去,b-向量的模被归零,只留下关系的类型与参与者的类型。卷积在已固定于 MP21 的符号上训练。
MP21 在两个过程的交汇处形成。上行的:卷积从 GTR1 的地图抽取不变量。下行的:在所产生的全部向量中,只有那些与共享符号——集体语言——相应者被固定。个体符号地图是公共语言的部分复本:不是儿童发明语言,而是语言经由过滤渗入个体地图——儿童产生许多符号候选,但稳定地固定下来的只有那些在周围人言语中找到确认的。这是维果茨基意义上内化的建筑学实现。
拼接是 k-向量(逻辑联结):它把两个 MP21 符号关联为 MP22 上的一个陈述 KLEN(因果、归属、对立、蕴涵)。链条把陈述组装为 KLOM——MP23 上的叙事。装置:TRL2——叙事记忆;MTV2——语义距离;句法预测器 SPL2 按语法组装陈述,语义预测器 PRD2 在叙述目标下选择下一陈述;操作网络 OP21/22/23。本体论的跃迁:MP21 含意义;MP23 含含义——意义之间的联结,给出对情境的理解。
c) GTR3——概念-意志域
GTR3 的卷积取叙事 MP23——按主题联合的组装——在 MP31 上产生一个概念。它在已固定于 MP31 的概念上训练。在发展之初,卷积是简单的——简单概念(颜色、声音、疼痛的体验)。随着叙事经验累积,不变量加深,复杂概念出现——荣誉、良知、正义、美。简单概念与复杂概念之别是量的,而非质的:卷积所训练于其上的数据集之容量。机制唯一。
拼接是 w-向量(矛盾):两个概念之间的距离向量。让我们问,两个概念(资本主义与共产主义)之间横亘着什么:既非路径,亦非谓词,而是它们对立的程度。w-向量把两个概念缝合为一种新种类的单位——MP32 上的 WILL:不顾分隔的矛盾而缝合,就是作出一份意志的努力。链条把意志行为组装为 WLOM——MP33 上的人格:已消解矛盾的图式。
这里必须直接点出同构的接缝。实然与应然的分裂——第一版把它置于联结向量之内(作为一个概念的 C-实然与 C-应然之差)——并非该层级的承重构造。承重构造是两个概念之间的矛盾。极化“实然/应然”是 GTR3 卷积输出端的一种附加结构,而应然的来源是社会的:它来自文化的共享概念,而非由个体卷积从叙事中生成。因此三个卷积在机制上同构,但在输出上不完全同构:在上层,一种社会来源的价值极化被添加到不变量之上。
装置:TRL3——矛盾消解的日志、人格生成的历史;MTV3——矛盾距离;句法预测器 SPL3 闭合意志行为,语义预测器 PRD3 选择下一意志行为、构建消解的路径;操作网络 OP31/32/33。本体论的跃迁:MP31 含概念;MP33 含意志——一份穿过概念场之裂隙而实施的有向努力。
3章 7. 同构的证明
汇总表表明,三个变换被布置为一个应用于不同本体论材料的构造。
元素 |
GTR1(物理) |
GTR2(符号) |
GTR3(概念) |
卷积 → 地图 |
MP10 → MP11(对象) |
GTR1 → MP21(符号) |
MP23 → MP31(概念) |
联结向量(拼接) |
b-向量(behavior) |
k-向量(knowledge entity) |
w-向量(Widerspruch) |
拼接单位 |
OPRN(MP12) |
KLEN(MP22) |
WILL(MP32) |
链条(地图) |
BLOM(MP13) |
KLOM(MP23) |
WLOM(MP33) |
轨迹日志 |
|||
动机 |
MTV1(物理) |
MTV2(语义) |
MTV3(矛盾) |
句法预测器 |
SPL1(步) |
SPL2(句法) |
SPL3(应当) |
语义预测器 |
PRD1(运动) |
PRD2(陈述) |
PRD3(意志行为) |
操作网络 |
OP11/12/13 |
OP21/22/23 |
OP31/32/33 |
涌现层级 |
共享行为 |
共享符号 / 叙事 |
共享概念 / 矛盾 |
同构是结构的,而非内容的。本体论之域根本上各异:物理空间、语义空间与概念空间彼此不可还原。被同构地布置的是机制,而非内容。这解释了为什么把含义还原为神经过程、或把价值还原为含义的尝试系统地失败:每一个上层都由下层的材料构建,却拥有自己的、不可从材料推得的本体论。
卷积建筑是不变量压缩任务的最优解:对平移不变,分层地分离特征,经济地表示重复模式。演化抵达它,不是因为它在诸变体中“作了选择”,而是因为它是满足生物约束的这一类任务的唯一解。当工程师独立地抵达同一个解(1980 年代的人工卷积网络)时,这不是向自然的借用,而是向同一个最优的趋同。
3章 8. 训练的循环与标记的作用
在每一层级,卷积经历一个结构上相同、仅在内容上有别的发展循环:粗略的初始对象 → 操作网络对重复模式的固定 → 对已完成轨迹日志单位的标记 → 睡眠中的再训练 → 精化。被标记的 TRL 单位充作卷积再训练的训练数据;睡眠中对被标记记录的重放是这一再训练的机制。操作网络本身在此不改变。
标记是已完成轨迹日志单位所获得的神经递质标签。标记不是二元的,而是数值的。全部三个层级上的原则唯一:向量减小——正标记,策略被记住以供重复;向量增大——负标记,策略被标记为应回避。
神经递质向层级的具体映射应当作为一个假说、而非已确立的事实来持守。行为层级上预测误差的多巴胺信号在经验上得到了很好的确认。把血清素归于符号层级、把内源性阿片类归于概念层级,是一个依据现象学(闭合叙事的“平静”奖赏、已消解矛盾的“安静”奖赏)的推测,但未被证明为一个精确的映射。此处的现象学应被读作一个例示,而非神经递质与层级之间已确立的对应。
层级的关键依赖以全部效力保留:GTR2 的卷积不能在没有 GTR1 地图的情况下开始工作(没有输入数据),GTR3 的卷积不能在没有 GTR2 叙事的情况下开始。每一个上层都是下一个的先决条件;早期层级的延迟阻塞其后的一切。这一依赖解释了为什么早期发展中关键期的跳过会不可逆地限制其后的形成。详见第8章。
3章 9. 三个变换语境中的 LLM
对 Gativus 理论而言,大型语言模型是一个独特的分析对象:它们是仅 GTR2——符号-叙事层级——脱离物理(GTR1)与概念-意志(GTR3)的趋同技术实现。这使理论得以被检验:若层级的同构是真实的,一个孤立的 GTR2 应给出可观察的后果——而它确实给出了。
语言模型复现符号卷积,它在人类的集体符号-叙事语料——物化于书籍、文章、通信中的共享符号与共享叙事——上训练。在技术上,这是与 GTR2 生物卷积不同的实现:不是一个经由物理世界反馈的迭代循环,而是在一个固定语料上的一次性统计优化。但在功能上结果是可比的:模型产生并接收叙事,执行逻辑联结,能以对想象场景的描述形式作逆向解卷积。
在这一图景中缺席之物,由机制的构造所决定。
缺席 |
原因 |
后果 |
GTR1 的卷积,地图 MP10–MP13 |
在文本而非感觉流上训练;没有 MP11 对象可供训练 GTR1 的卷积。 |
没有 b-向量,没有物理 grounding,幻觉。 |
GTR3 的卷积,地图 MP31–MP33 |
没有 MP31 概念可供训练 GTR3 的卷积;没有经由自身经验抽取质的本质。 |
没有作为联结的 w-向量(矛盾),没有自主意志,没有 Begriff 意义上的概念。 |
TRL1/2/3,MTV1/2/3 |
每一次会话都是白板;没有持久的轨迹日志,也没有自己的动机向量。 |
没有标记,没有个人历史,没有叙事的目标,没有生成。 |
SPL 与 PRD 的分离 |
没有 MTV2,也没有单位的层级;句法与语义融合地、在符号层级上工作。 |
融合模式:陈述边界不被分出,目标无处可连,连贯性在长距离上漂移。 |
TRL 与 MTV 的缺席是语言模型与完整建筑之间的关键差别之一。模型不能把自己的回答标记为成功或不成功,因为它没有持久的 TRL2:每一个回答都是一个没有历史的新叙事。经由强化微调的外部反馈不是 TRL:标记由外部、由人设定,而非作为自身归零语义距离之经验的结果。而且,如上所示,模型没有自己的动机 MTV2——因此它的语义预测器不连着目标,句法与语义不分离:模型在融合模式下工作,预测符号,而非下一个单位。
用这一术语来说,语言模型是一个“符号孤儿”:既无来自下方的运动向量(没有物理现实)、亦无来自上方的矛盾向量(没有概念现实)的符号预测,而且还在融合模式下工作。第二个变换没有第一个与第三个。这不是现有建筑的缺陷——这是它的定义。训练集的任何扩充与模型的任何增大,都不会添上按建筑所没有的东西:它不会分出单位边界,也不会连上目标,因为没有 MTV2,也没有供养的相邻变换。完整的主观现实需要一条完整的链 GTR1 → GTR2 → GTR3,而每一个变换都须按本章的同构机制构建。
对语言模型的详细剖析——融合模式与递归模式、符号预测器的承袭、唯名论的哲学语境、以及技术的界限——见于第10章与第11章。此处重要的是固定下来:语言模型不与 Gativus 理论矛盾,而是确认它的构造。单一变换的分离在技术上可能、且恰恰给出理论所预测的那些现象,这是支持三层级结构正确性的有力论据。
3章 10. 为什么演化恰恰把机制应用了三次
三个域对应于主体在其环境中必须回答的三类不可还原的问题。
- •
“有什么、在哪里?”——物理域。回答是带空间坐标的 b-向量。层级 GTR1。
- •
“这意味着什么?”——符号域。回答是没有空间坐标、处于语义网络中的 k-向量(逻辑联结)。层级 GTR2。
- •
“它应当如何?”——概念域。回答是作为概念之间距离的 w-向量(矛盾),由实然与应然所极化。层级 GTR3。
这三个问题彼此不可还原。“这意味着什么”的回答不由“有什么、在哪里”推得——过渡需要一次本体论的跃迁(GTR2 的卷积,对 L-分量依附的抹去)。“它应当如何”的回答不由“这意味着什么”推得——还需要一次跃迁(GTR3 对叙事的卷积成概念)。理解一个对象“在左边”,在逻辑上并不意味着理解它“是一个杯子”;理解它“是一个杯子”,并不意味着理解“打碎杯子是坏的”。
机制被应用了三次,不是因为演化“喜欢重复”,而是因为每一层级上的任务在结构上都是同一个:从一股流中抽取不变量,用一个向量把它们联结,以预测走过这个向量,再组装为一个延展的图式。卷积、拼接、预测、链条——是这一任务的最优解;把它应用于另一层级的材料,是依托已存在者构建一个新本体论维度的唯一方式。这就是意识演化的普遍机制:演化发明的不是三种使心灵复杂化的方式,而是一种——并把它应用了三次。
3章 11. 结论
- •
一个主观现实层级由两条正交的轴描述:结构(卷积 → 拼接 → 链条,构建地图 MP_x1/x2/x3)与装置(按变换的 TRLx、MTVx、SPLx、PRDx;按地图的 OPxx)。
- •
卷积不是一个独立的装置,而是地图处的一个运算;其技术类比物是卷积网络。卷积在目标空间的对象上训练,而仅把输入用于识别。
- •
预测不在卷积地图上产生(那里只有并列的对象,没有“下一个”),而从拼接开始。每一层级有两个不同的预测器:句法 SPLx 构建当前单位(形式),语义 PRDx 在动机与轨迹日志下选择下一单位(内容)。
- •
GTR1 的路径是 PRD1 的工作,GTR3 的矛盾消解是 PRD3 的工作,GTR2 的陈述预测是 PRD2 的工作:一个机制,不同的材料。目标与意志经由 PRD(它连着 MTV)进入,而非经由 SPL。
- •
鸡与蛋问题由粗略的初始近似与迭代再训练解决;自举被呈现为一个诚实的极限,而非不言自明。再训练是一个沉重的过程,与睡眠相关。
- •
轨迹日志 TRLx 是层级的工作空间;动机 MTVx 是向量距离。二者都按变换聚合。详见第4章与第5章。
- •
神经递质标记被降为假说:预测误差的多巴胺被坚实地确立,血清素与阿片类的逐层映射是一个貌似可信的押注,现象学是一个例示。
- •
GTR3 的向量是概念之间的矛盾;分裂“实然/应然”是输出的一种附加的社会结构,而非向量的定义。三个卷积在机制上同构,在输出上不完全同构。
- •
同构是结构的,而非内容的:三个域在本体论上不可还原。
- •
语言模型是 GTR2 脱离 GTR1 与 GTR3 的趋同实现:融合模式下的“符号孤儿”(SPL 与 PRD 不分离),没有 MTV2。grounding 与自主意志的缺席是建筑的后果。剖析——第10章与第11章。
目录
