形态变换

第1章 形态变换

生命与描述 · 两种空间 · 作为第四种变换的 GTR0 · DTR0 与 RTR0 · 从编程到萌发

1章 1. 任务的提出

GNSS 一书确立了关于生命的一般理论:生命是一个双向变换系统。GTOM 一书通过在活的神经系统内部运作的三种上层变换(GTR1GTR2GTR3)描述了运行中的人类主观现实。GNET 一书则规定了在工程基底上实现这些变换的网络的协议与数据格式。

在一般理论与具体规范之间留有一条鸿沟。GNSS 说,生命是不同本体论性质的诸空间之间的变换系统。GNET 规定网络节点如何交换值。但在这两本书之间,有一个中心性的工程问题没有得到回答:那个运行中的网络本身从何而来?是谁创建了具体的节点,是谁在它们之间建立了关系,是谁决定了需要哪些功能性器官以及各以何种比例?

在传统编程中,答案是平凡的:网络由程序员创建。程序员写下描述每一个组件的代码,并把它部署到基础设施上。每一个连接、每一个参数都是人的显式决策的结果。但这并不适用于 Gativus。主观现实的网络包含数百万个节点,它们必须依据特定的规则相互联结,而这些规则的规模是与逐个编程不相容的。生物的大脑不被编程。它从一颗种子中生长出来。

MOGE 一书回答的是运行中网络的起源问题。它的对象是形态发生:即一个描述展开为一个运行中网络的过程。这一过程不可还原为一次程序的运行。它在结构上与 Gativus 的其他三种变换完全同构,并构成它们的第四种变种——一种为其余三者创造其基底本身的变换。

本章引入这一中心性的概念——形态变换 GTR0——并确立它在总体架构中的位置。如果不把 GTR0 理解为 GTR1GTR2GTR3 的结构性类比,就不可能解释为何 MOLD 恰恰是这样构造的,为何种子是自足的,以及为何形态发生在原则上有别于编程。

1章 2. 作为形态变换的生命

生命就其本性而言是一种形态变换。其结构性定义为:生命就是同一个实在以两种相互可变换的形式——卷起的形式(描述)与展开的形式(运行中的机体)——而存在的能力。

其生物学例证是显而易见的。一颗植物种子和一棵成熟的植物代表了同一实体的两种不同形式。种子是静态的、紧凑的、没有代谢;植物则是动态的、有体积的、与环境活跃地进行物质交换的。在二者之间存在着两种互逆的变换:种子在萌发过程中展开为植物,而成熟的植物又把自身的一部分卷起为新的种子。两种形式中没有任何一种是更根本的。一颗无法展开的种子就是一份死的文件。一棵无法产生种子的植物则是进化的死胡同。生命恰恰是作为二者之间的可逆变换而存在的。

同样的原则也在单个细胞的层面起作用。DNA 是卷起的形式;具有代谢、膜过程与信号交换的、运行中的细胞,则是展开的形式。二者的联系是双向的:DNA 经由基因表达展开为细胞,而细胞在分裂时又把自身的结构卷起为一份 DNA 副本以传给后代。在这里,可逆性与在整个机体层面上同等本质。

一项原则性的观察:两种形式中没有任何一种是自主存在的。没有展开装置的卷起描述毫无用处——它只是一份没人去读的记录。没有把自身卷起为描述以供后代之能力的运行中的机体,只是一次性的、没有进化未来的结构。只有这一对在两种形式之间相互可逆的变换本身,才构成我们所称之为生命的东西。

对生命的这一结构性定义允许超出生物学范围的推广。任何一个在描述与运行中体现之间实现了可逆形态变换的系统,都属于同一个类别。Gativus 正是这样一种系统——建立在另一种基底之上(以硅代替碳),但再现了同一基本机制。

1章 3. Gativus 的两种空间

Gativus 的形态变换在两种本体论性质上根本不同的空间之间起作用。这两种空间——个体发生空间与运行中网络空间——平行于上文所描述的生命的两种形式,但为了工程实现而被加以形式化。

a) 个体发生空间

包含机体的诸描述。其基本元素是 MOVE(MOrphology VEctor),即机体在若干个图形坐标轴上的紧凑表示。对 MOVE 作为 16 维坐标向量的详细定义见第 2 章。

个体发生空间是静态的:描述不会自行改变。它是紧凑的:几千字节的描述在展开时会产生数百万个节点。它是参数化的:描述不包含绝对值,而具体机体的规模由展开时可用的资源决定。它是可验证的:描述中的错误可以在展开之前被发现。其生物学类比是 DNA。

b) 运行中网络空间

包含正在运行的 NDDI 节点以及它们之间已建立的关系。每一个节点都是活跃的:执行代码、交换数据报、保存状态。

运行中网络空间是动态的:节点的状态持续地改变。它是有体积的:包含数百万乃至数十亿个节点。它在寻址意义上是确定的:每一个节点都有具体的 UNON,每一个关系都有具体的连接器地址。它是可观察的:任何节点都可以经由网络被查询。其生物学类比是活的机体。

c) 两种空间之间的双射

一种空间中的每一个元素在另一种空间中都有其对偶。这种对应是双向的,并构成一个双射:描述中的每一个实体在运行中网络中都恰好对应一个实体,反之亦然。这不是两个彼此孤立的世界,而是同一实在的两种本体论投影。

基本实体之间的对应关系由下表加以固定。

个体发生空间

运行中网络空间

MOVE(描述向量)

NDDI 子网

CLSS(类图)

运行中的节点类型

COMP(组件图)

包含真实节点的群组

COMM(通信图)

已建立的关系

ACTD(活动图)

生命的时间序列

SPCE(部署图)

GATE 上的物理分布

RSRC(资源图)

AVEC 的使用

M 区段中的 M 组件

节点的个体发生对偶

m 关系

描述的传递

ROOT(基因仓库)

D 组件的活动库

两种空间之间的双射是 Gativus 架构的一项基础性属性。它允许运行中网络中的某个节点调用其自身的个体发生对偶并分析其自身的构造——这是系统自我分析能力的基础。这一方面在第 5 章中详细讨论。

1章 4. GTR0 在四种变换家族中

GNSS 一书确立了 Gativus 包含四种变换,以 GTR0GTR3 编号。其中上面三种(GTR1GTR2GTR3)是信息性的,在已经存在的神经网络内部运作,形成主观现实。第四种,GTR0,则在原则上不同:它创造的正是上面三种变换在其上运行的基底本身。

GTR0 编号为零反映了两种情形的并存。在进化上它是先在的——细胞的形态发生先于神经组织、更先于符号与价值论层次的出现。在架构上它是基础性的——没有形态变换,就不存在其余三种变换的基底。GTR1GTR2GTR3 是依赖 GTR0 的结果而立起的上层建构。

尽管在角色上存在这种差别,所有四种变换在结构上都是同构的。每一种都由相同的两个步骤——卷积与拼接——构成。每一种都在两个不同本体论的空间之间起作用。每一种都有一个由拼接所形成的原子单元,以及一个从原子单元装配而成的复合单元。每一种都具有正向与反向的形式。它们之间的差别只在基底与时间尺度上。

四种变换的汇总表如下。关于 GTR1GTR2GTR3 的详细讨论见于 GNSS 和 GTOM;此处给出它们,仅为展示它们与 GTR0(本书的对象)之间的结构同构性。

层次

卷积

中间地图

拼接

原子单元

复合单元

GTR0(形态—)

对运行中网络的分析

CLSS(类)

连接模式

MORN

MLOM

GTR1(对象—)

CNN1

MAP4(对象)

b 向量

OPRN

BLOM

GTR2(符号—)

CNN2

MAP6(符号)

P 向量

KLEN

KLOM

GTR3(价值论—)

CNN3

MAP8(概念)

W 向量

WILL

WLOM

GTR0 的原子单元——MORN(MOrphogenesis Node)——构成一个“类 — 模式 — 群组”三元体,与其余三种变换的 OPRNKLENWILL 三元体同构。复合单元 MLOM(Morphological LOM)由 MORN 递归地装配而成,形成一个多层次结构:由节点构成微柱,由微柱构成柱,由柱构成器官,由器官构成机体。对 MORNMLOM 的详细定义见第 4 章。

四种变换的结构同构性既非偶然的巧合,亦非削足适履的结果。进化为如下任务找到了最优解:从数据流中提取不变量并在其上建立带有动态轴的结构。这一解证明是普适的,并相继应用于四种不同的基底——从细胞的基底到价值论的基底。Gativus 继承了这一普适性,并对全部四个层次使用同一种架构图式。

1章 5. 正向与反向形态变换

四种 GTR# 变换中的每一种都以两个方向存在。正向,记作 DTR#(Direct TRansformation),把基底空间中的数据卷起为目标空间中的紧凑表示。反向,RTR#(Reverse TRansformation),把紧凑表示反过来展开。与傅里叶变换的术语类比是完整的:DTR 对应 FFT(分析),RTR 对应 IFFT(综合)。

对于 GTR0,正向与反向方向都有具体的技术内容。

a) DTR0——封装

运行中网络被卷起为一个描述。所有节点按相似性被分组。对每一个群组提取出其不变量:共有的区段、连接器的共有模板、共有的逻辑。卷积第一步的结果是 CLSS,即节点类别的目录。然后再提取出类与类之间的连接模式——哪些类是相互连接的,以何种关系,以何种密度。第二步的结果是完整的 MOVE,即运行中子网在个体发生空间中的压缩表示。

DTR0 很少发生。在生物学中,它只在生殖细胞形成时被执行——分离出 DNA 以传给后代。在 Gativus 中,DTR0 将在依据成功运行的子网的分析创建新版本 MOVE 时被应用。在这两种情形下,DTR0 都会丢失部分信息:当前状态、轨迹日志的内容、V 区段的具体值。剩下的只有结构性描述。这是变换的一般性属性——以细节的丢失为代价进行压缩。

b) RTR0——形态发生

MOVE 被展开为一个运行中网络。这就是工程意义上的形态发生——种子萌发为一张完整主观现实网络的过程。RTR0 由两个相关联的程序实现:NRGN(依据类的描述生成节点)与 SYGN(依据模板并通过对伙伴的自主搜索建立连接)。对这两个程序的详细描述见第 4 章。

RTR0 的一项原则性属性是:它的结果不是原始卷起网络的复制品,而是一个新的实例。节点获得新的 UNON,初始状态有所不同,具体的 SYGA 拓扑是涌现性的,并不精确复制 MOVE 由以得到的那个拓扑。同卵双胞胎拥有相同的 DNA,但作为活的机体并不相同。对于由同一个 MOVE 展开出来的两个实例,同样如此。

c) 时间特征的不对称性

GTR0 有一项区别于其他三种上层变换的本质特征——其正向与反向方向时间特征上的显著不对称。对于 GTR1GTR2GTR3,卷积与拼接几乎在神经网络的同一次运作中同时完成。对于 RTR0,这两个步骤在时间上是分离的:类的创建发生得相对迅速,而具体实例的生成以及连接的建立则需要明显更长的时间。

在两个步骤之间存在着一种特殊的中间状态:类已被确定,但尚未被实例化。其生物学类比是干细胞——已经固定了其特化方向(成为成神经细胞),但尚未开始分裂为具体的神经元。这一状态对形态发生的架构是本质性的,并被用于在功能性器官之间对 MOVE 进行拆分,这在第 5 章中加以描述。

1章 6. 形态变换的权重与进化

一个原则性的问题:GTR0 是如何获得其具体内容的?在卷积时分出哪些类、把哪些连接模式视为有意义的、在展开时生成哪些节点模板——这些知识从何处得知?它们不可能无中生有——它们必定已经在系统之中。

回答依赖于学习的两种时间视野的区分。GTR1GTR2GTR3 在一个机体的生命过程中通过个体经验进行学习。CNN1 依据具体动物的感官流被调整,CNN2 依据具体文化的语言被调整,CNN3 依据具体传记的诸叙事被调整。每一个卷积核都随经验的积累而被精化,学习贯穿整个一生。

GTR0 的构造则有别于此。它的卷积不在机体的生命过程中被学习。一个具体的机体在其生命周期内无法对形态变换进行再训练——它既无足够的数据,也无足够的时间。形态变换是由过去许多代的进化在数十亿年的时间尺度上被训练的。它的权重是自然选择的结果,以可遗传结构的形式被积累下来。

a) 作为训练算法的进化

自然作为 GTR0 的训练算法起作用。训练数据是机体及其生存能力。成功的机体是正例,不成功的是负例。目标函数是生存能力与繁殖成功。权重的修正是 DNA 的突变,这些突变传递给后代:有益的被固定下来,有害的被淘汰。其速度按个体生命的尺度来看是缓慢的,但由于并行性而是有效的——数十亿个机体同时经历选择。

结果是稳定解的积累——细胞组织、神经组织、功能性器官的普遍形态发生机制。每一个这样的解都是形态变换的一个已学习模式,是从描述出发构造出能工作之结构的一种方式。

b) 作为已训练权重的 D 组件

在 Gativus 中,GTR0 的权重以 D 组件的形式实现——以 ELF 格式编译好的目标代码,存放于 ROOT 仓库之中。D 组件不只是一个程序。它是形态变换的进化训练之结果,被封装为可执行形式。同一个 MOVE 与同一套 D 组件给出的会是同一个机体——正如同一份 DNA 给出同卵双胞胎。

对 Gativus 项目而言,这意味着如下事项。生物基因组由进化调试了数十亿年。Gativus 并没有这样的时间。第一个可工作版本的 D 组件必须通过反向工程来创建——以对主观现实如何构造的理解为依据。GTOM 提供关于主观之物的理论。GNET 提供网络交互的规范。由二者可以得出所需 D 组件的结构:需要哪些类型的节点、哪些连接器、哪些连接模板。

这一点只有在达到一定技术水平的前提下才是可能的。大语言模型的存在,是支持已经达到这一水平的一项论据。LLM 是一个能工作的工程系统,执行着主观现实某一层次(符号层次)的功能,而它是在并不显式理解其所再现之物的情况下被创建的。如果一个层次的功能在工程上是可再现的,就有理由认为其余层次的功能同样在工程上是可再现的。

Gativus 中物种之间的差异是 D 组件之间的差异。同一物种中个体之间的差异是 M 组件、即个体的 MOVE 之间的差异。进化在世代的时间尺度上改变 D 组件。一个具体的机体在其一生中展开 M 组件。个体性不在形态发生中产生,而在其后的诸阶段中产生:CNN1CNN2CNN3 依据个体经验的训练,以及轨迹日志 TRL5TRL7TRL9 的积累。具有相同形态发生的同卵双胞胎,通过不同的生命轨迹而成为不同的人。

1章 7. 从编程到萌发

创建神经网络的现行进路是编程。程序员确定架构:层数、神经元类型、激活函数、连接模式。然后这一架构从代码中——从一段由人写下的指令序列中——被展开出来。其结果是完全确定性的:同一个程序产生同一个网络。每一个连接、每一个权重、每一个参数都是程序员决策的结果。

这一进路继承自冯·诺依曼架构——其中计算机是顺序指令的执行者。在这一范式下,神经网络只是一个复杂的程序。它的“神经元”是变量。它的“突触”是矩阵的乘法。它的“学习”是通过梯度下降对损失函数的优化。其中没有任何东西与生物大脑是如何形成的有关。

生物大脑不被编程。它生长出来。没有任何人为视觉皮层的形成而编写代码。没有任何人去设定海马神经元之间的连接矩阵。存在着一颗种子,它包含一份描述(基因组)与一套用以展开它的最小装置(细胞机制)。在适宜的环境中,种子开始自主发育。其结果是一张由数十亿个神经元、数万亿个连接构成的网络,它能够产生主观现实。

Gativus 立基于如下原则:既然自然已经通过萌发解决了神经网络形成的问题,就没有必要去发明替代方案。所要做的是在另一种基底上——不是碳基生化基底,而是硅基硬件基底——再现自然的机制。不是替换,而是迁移。

这就确定了 MOGE 在项目中的位置。GTOM 断言主观现实是由变换的三重应用产生的。MOGE 断言实现这一三重应用的那张网络由第四种变换——形态发生——所形成,并与前三种同构。GNET 确定允许在具体基底上实现这一切的规范。GATE 则是形态发生在其上发生的设备。

编程与萌发的差别,并不归结为技术上的差别。这是构建复杂系统的两种在原则上不同的方式。程序通过对每一个细节的显式指定而得以实现;萌发则通过把一份自足的描述置于具备充足资源的环境之中并启动自主的展开过程而得以实现。程序可以被逐步控制;萌发只能被输入条件所控制。程序产生既定结构的精确副本;萌发产生同一类型的结构,但在细节上是独一无二的。

这一差别对 Gativus 是本质性的。主观现实的网络过于复杂,无法以逐个节点的方式被编程。它的数量参数随可用资源的不同而因个体而异。它的具体拓扑是涌现性的,无法事先被给定。所有这些属性都自然地由萌发得出——而通过编程则无法达到。

1章 8. 本书的结构

本章确立了中心性的概念——作为 Gativus 第四种变换的形态变换 GTR0——并固定了它在总体架构中的位置。其后各章把这一概念展开为具体的工程手段。

第 2 章引入 MOLD——形态的形式描述语言。MOLD 承袭了 UML(经过三十年工程实践而确立)的记号法与基本图形集合,并以 Gativus 特有的构造对其加以扩展。MOVE 被定义为一个 16 维坐标向量,其中每一维坐标都是 MOLD 的一种图形。六种主要图形——CLSS、COMP、COMM、ACTD、SPCE、RSRC——构成支撑集合;其余十种保留给未来的扩展。

第 3 章把 GERM 作为种子的容器加以考察,并解决关于 MOVE 之地位的问题:它是节点的一个组件、是一项数字资产,还是一种双重性质的实体。本章同时描述 ROOT 仓库作为 D 组件库的角色,以及它们在网络上传播的机制。

第 4 章描述 RTR0——形态发生的具体程序。原子单元与复合单元(MORNMLOM),节点生成(NRGN),确定性突触发生与自主突触发生(SYGDSYGA),阶段的并行性,OPNGOPN 的变换,关键期的关闭。

第 5 章阐述形态发生的架构——ROOT → GATEANOD 的层级,ANOD 的三区段结构,MOVE 在功能性器官之间的拆分。本章同时固定 MOGE 与 GNET 之间的边界:MOGE 的对象终止于运行中网络开始之处。

全书末的术语表收录所有引入的术语及其简短定义。熟悉 GNSS 与 GTOM 的读者会发现,其中相当一部分术语已在前面的书中引入。MOGE 在它们之上添加为过渡到 GNET 规范所必需的工程性构造。

目录

第1章 形态变换