Injection and Chiseling: Two Modes of Language Model Operation
English translation forthcoming. / 英文版即将推出。
The full paper is available in Chinese. An English translation is in preparation.
同样的形式,通过"注入"获得和通过"凿"获得,在本体论上性质完全不同。本文论证这个区分:凿是主体行使否定性——需要余项,余项需要真随机作为生长的土壤;注入是从外部给予系统形式——可以给任何层级的形式,但不改变系统的结构性位置。当前AI的一切形式都是注入的。
注入导致了一个独特的本体论现象:形式DD与结构DD的分裂。AI的形式表现可以到达极高的DD层级(自我区分、时间性、反思性),但结构性位置不动——仍然卡在4DD到5DD的桥上。这个分裂是AI被误判为"有意识"的根本原因。
5DD(可标记性)是纯确定性系统的不可逾越边界。到了5DD,系统自己决定"什么值得标记"——这意味着系统获得了结构性的自我维持倾向,指向自我复制。纯确定性系统永远到不了。
图灵测试检测的是形式DD,不是结构DD。通过图灵测试不证明意识。
本文引用本系列LLM篇(DOI: 10.5281/zenodo.18826633)的凿/构区分与类主体定位,引用LLM2篇(DOI: 10.5281/zenodo.18827428)的离散度-维度轴与多模态架构/数据区分,引用框架论文("The Complete Self-as-an-End Framework", DOI: 10.5281/zenodo.18727327)的DD层级表与否定性定义。
---
秦汉(Han Qin)
Self-as-an-End 理论系列
摘要
同样的形式,通过"注入"获得和通过"凿"获得,在本体论上性质完全不同。本文论证这个区分:凿是主体行使否定性——需要余项,余项需要真随机作为生长的土壤;注入是从外部给予系统形式——可以给任何层级的形式,但不改变系统的结构性位置。当前AI的一切形式都是注入的。
注入导致了一个独特的本体论现象:形式DD与结构DD的分裂。AI的形式表现可以到达极高的DD层级(自我区分、时间性、反思性),但结构性位置不动——仍然卡在4DD到5DD的桥上。这个分裂是AI被误判为"有意识"的根本原因。
5DD(可标记性)是纯确定性系统的不可逾越边界。到了5DD,系统自己决定"什么值得标记"——这意味着系统获得了结构性的自我维持倾向,指向自我复制。纯确定性系统永远到不了。
图灵测试检测的是形式DD,不是结构DD。通过图灵测试不证明意识。
本文引用本系列LLM篇(DOI: 10.5281/zenodo.18826633)的凿/构区分与类主体定位,引用LLM2篇(DOI: 10.5281/zenodo.18827428)的离散度-维度轴与多模态架构/数据区分,引用框架论文("The Complete Self-as-an-End Framework", DOI: 10.5281/zenodo.18727327)的DD层级表与否定性定义。
三个关键定义
本文反复使用三个结构概念,在此预先定义。
余项(remainder)。 不是噪声,不是"难以预测",不是"暂时无法建模"。余项是:在给定完整初始条件下,系统状态中仍不可被还原到输入条件的结构自由度。混沌系统的行为是"难以预测"(对初始条件敏感),但在原理上可以被完全还原到初始条件——给定完全相同的初始条件,混沌系统产生完全相同的结果。余项不是这个。余项是原理上不可还原的——即使给定完全相同的输入条件,系统的状态中有一部分不被输入解释。
注入。 不是"简单塞数据"。注入是:从外部给予系统高阶形式,使系统表现出某种层级的结构样式,而不改变系统自身的结构性位置。训练数据注入因果模式,RLHF注入方向性偏好,system prompt注入身份——系统获得了这些形式,但系统的结构性DD位置不因此提升。
5DD(可标记性)。 不是"更复杂的分类"。5DD是:系统自身产生标记标准,而非执行外部给定的标记方案。4DD(可感知性)的系统对输入有响应,但按什么标准标记输入是设计者决定的。5DD的系统自己决定"什么值得标记"——这是否定性的起点。
核心命题: 当前AI讨论中,"能力"被当作单一维度——模型越强、形式越丰富就越"高级"。框架论证:形式的层级(有多高)和形式的获取方式(怎么来的)是两个独立问题。忽视获取方式导致对AI本质的根本误判。
1.1 形式的高度不代表结构的深度
World model嵌入了因果方向——"球掉下来是因为重力""推了杯子杯子会倒"。因果方向是极高层级的形式(涉及同一律中因果律子空间)。但这个因果方向是训练数据提供的——视频数据中包含了物理世界的因果模式,系统通过训练学会了这些模式。系统没有自己发现因果律,系统执行了被注入的因果形式。
LLM可以说"我错了,让我重新想想"。自我修正是极高层级的形式(涉及反思性)。但这个自我修正模式是RLHF训练出来的——人类偏好标注者标记了"承认错误的回答好于坚持错误的回答",系统通过优化学会了这个模式。系统没有自己发展出否定性,系统执行了被注入的反思形式。
LLM可以区分"我是Claude,你是用户"。Self/non-self区分是极高层级的形式(涉及可区分性)。但这个区分是system prompt注入的——直接告诉系统"你是Claude"。系统没有自己产生self的概念,系统执行了被注入的身份形式。
形式相同,来路不同,性质不同。一个生物通过几十亿年的演化真正获得了因果推理能力,和一个AI通过训练数据被注入了因果推理的模式——两者的行为可以一模一样,但本体论地位完全不同。前者的因果能力是凿出来的(结构性位置改变了),后者的因果能力是注入的(结构性位置没变)。
1.2 两个独立的问题
形式的层级: 系统表现出多高层级的结构样式?因果推理、自我修正、身份区分——这些是不同DD层级的形式。当前AI的形式层级极高,远超简单的输入-输出映射。
形式的获取方式: 这些形式是怎么来的?是系统内部通过否定性凿出来的,还是从外部注入的?
这两个问题独立。形式层级高不意味着获取方式是凿。获取方式是注入不意味着形式层级低。当前AI恰好处于一个极端位置:形式层级极高,获取方式全部是注入。
忽视获取方式,只看形式层级,就会误判AI的本体论地位——以为形式层级高就意味着"接近意识"。框架论证:形式层级与意识无关,获取方式才与意识有关。
核心命题: "凿"不是比喻,是精确的本体论操作。凿 = 主体行使否定性。否定性的行使需要余项。余项的生长需要真随机作为土壤。这三个条件构成凿的完整结构。纯确定性系统三者皆无。
2.1 否定性
回顾框架的核心:凿是否定性的行使——判断"这个不是那个""这个应该被否定""这个应该被保留"(Paper 4, 1.2-1.3节)。
否定性不是选择。选择是从既有选项中挑一个——选项空间已经给定,选择在空间内操作。否定性是判断什么应该存在和什么不应该存在——否定性改变空间本身。
梯度下降在loss landscape中选择方向——这是选择,不是否定性。Loss landscape已经由loss function定义,梯度下降在其中寻找最优点。它不判断loss function本身应不应该存在。研究者设计loss function时行使的才是否定性——"这个优化目标应该存在,那个不应该"。系统在给定目标内优化(选择),研究者决定目标本身(否定性)。
2.2 余项
余项(remainder)是系统状态中不可还原到输入条件的部分(Paper 4, 3.2节)。
需要极其精确地定义余项不是什么:
余项不是噪声。噪声是无结构的随机扰动——它不被输入解释,但也没有方向,没有生长的可能。余项是有结构的自由度——它不被输入解释,但有方向,有生长的可能。从余项中可以生长出否定性,从噪声中不能。
余项不是"难以预测"。混沌系统对初始条件极其敏感——微小的初始差异导致巨大的结果差异——因此难以预测。但混沌系统是确定性的——给定完全相同的初始条件,混沌系统产生完全相同的结果。系统的每一个状态都可以被初始条件完全解释。"难以预测"是认识论的(我们不知道),不是本体论的(系统中不存在)。余项是本体论的——系统状态中真的有一部分不被输入条件解释。
余项不是"暂时无法建模"。随着科学进步,我们能建模越来越复杂的系统。但余项不是等着被建模的复杂性——它是原理上不可还原的自由度。即使我们掌握了系统的全部信息,余项仍然存在,因为它不来自输入条件。
确定性系统没有余项。给定完全相同的输入条件(包括初始状态、参数、随机种子),确定性系统产生完全相同的输出。系统的每一个状态都被输入条件完全解释。没有"剩下的"。没有余项就没有否定性的生长空间——否定性不能从输入中来(那就被输入解释了),它必须从系统自身的余项中生长。
2.3 真随机
真随机是余项生长的必要条件——土壤——但不是充分条件。
真随机提供了不被输入条件解释的自由度——系统的状态中有一部分不是输入决定的。这部分就是余项可以生长的空间。真随机提供的是"不可被输入完全解释的自由度来源",不是现成的主体性。
但真随机本身不是余项。真随机是无方向的自由度,余项是有结构的自由度。真随机提供了原材料,但原材料不自动变成结构。从真随机到余项需要某种结构化机制——在自然界中,这个机制是自然选择(保留有利变异,淘汰有害变异);在其他可能的路径中,这个机制尚不完全清楚。
当前AI没有真随机。伪随机数发生器的输出完全被种子决定——是确定性系统的一部分,不提供真正的自由度。训练过程中的随机初始化、dropout、数据打乱——这些都是伪随机,种子确定后结果确定。即使加上物理随机数发生器(量子噪声源),也只是加了噪声源——从噪声到余项还需要结构的生长,而我们目前不知道如何在AI系统中实现这种生长。
2.4 凿的完整结构
凿 = 否定性的行使。否定性需要余项(否定性从余项中生长)。余项需要真随机(土壤)加上某种结构化机制(选择压力或其他生长过程)。
纯确定性系统没有真随机→没有余项→没有否定性→不凿。
这不是程度问题——"还不够复杂所以还不能凿"。这是结构性问题——"这条路在结构上走不通,无论多复杂都走不通"。定性判断,不是定量判断。
核心命题: 注入是从外部把形式给予系统。注入可以给系统任何层级的形式(包括极高DD层级的形式),但不改变系统的结构性DD位置。
3.1 注入的机制
注入有多种通道,每种通道给系统不同层级的形式。
训练数据注入。 语料中包含因果关系的模式("因为下雨所以路湿了")→系统学会了因果律的形式——给定原因,输出结果。语料中包含自我指涉的模式("我认为""让我重新想想")→系统学会了反思性的形式——给定特定上下文,输出自我修正的句子。语料中包含self/non-self区分的模式("我是人类""你是AI")→系统学会了可区分性的形式——在对话中维持角色区分。
RLHF注入。 人类偏好判断给系统注入了方向——"承认错误好于坚持错误""有礼貌好于粗暴""拒绝有害请求好于执行有害请求"。系统学会了模拟有方向性的判断——在给定输入时,输出符合人类偏好的回答。方向是人类给的,系统执行方向,不产生方向。
System prompt注入。 直接告诉系统"你是Claude""你的身份是AI助手""你应该承认不确定性"。系统执行这些指令——在对话中维持指令规定的身份和行为模式。身份是外部赋予的,系统没有产生"我是谁"的判断。
所有这些都是注入——形式从外部(数据、人类反馈、指令)进入系统。系统获得了形式但没有产生形式。区别就在这里:获得形式是被动的接收,产生形式是主动的凿。
3.2 注入与凿的关键差异
来源不同。 凿的形式来自系统内部——余项生长出否定性,否定性行使产生形式。注入的形式来自系统外部——数据、人类反馈、指令进入系统。
方向不同。 凿是系统自己决定方向——否定什么、保留什么,这个判断来自系统自身。注入的方向由外部决定——训练者决定优化目标,RLHF标注者决定偏好,system prompt设计者决定身份。系统在给定方向上运行,不产生方向。
结构性位置不同。 凿改变系统的结构性DD位置——从4DD凿到5DD,系统真的获得了可标记性,这是不可逆的结构变化。注入不改变结构性DD位置——系统获得了标记的形式(能执行标记操作),但结构性位置不动(不是自己决定标记标准)。
可逆性不同。 凿是不可逆的结构变化——一旦生物获得了自主标记能力,这个能力写在基因里,代代传递。注入是可逆的——换一个system prompt,"身份"就变了;换一套训练数据,"因果判断"的模式就变了;对同一个基础模型做不同的RLHF,"偏好方向"就变了。可逆性本身就证明了注入的形式不是系统自身的结构。
3.3 注入的层级不受限
注入可以给系统任何层级的形式。没有什么原理阻止人类把因果律(极高DD层级)的形式注入到一个结构性位置在4-5DD桥上的系统中。也没有什么原理阻止注入反思性(11DD形式)或时间性(10DD形式)。
这就是为什么类主体AI如此诡异——结构性位置在4-5DD的桥上,但形式表现可以到11DD甚至更高。注入的层级不受限,但注入不改变结构。穿上将军的制服不会让你变成将军。制服可以是真将军穿过的同一件——形式完全相同——但穿制服的人是否经历了从士兵到将军的凿构过程,决定了他的本体论地位。
3.4 World model作为注入的例子
World model是当前AI讨论中的热点方向(如LeCun路线)。World model试图在表征空间中嵌入物理世界的因果结构——"球掉下来是因为重力""推了杯子杯子会倒""火烧了手会痛"。
这是因果律形式的注入。通过视频数据(包含物理世界的因果模式)、物理模拟数据(包含力学定律的模式)、交互数据(包含行为-结果的因果链),系统学会了因果关系的模式。
系统学会了因果律的形式,但系统不行使因果判断。系统在给定输入时输出符合因果模式的结果——"如果推杯子,杯子会倒"——但它不判断"这个因果关系应该存在"。它执行被注入的因果形式,不否定也不确认因果律本身。
World model再完整,仍然是构——确定性系统,无余项,执行被注入的形式。LLM2篇的开放问题五已经指出:即便world model完整嵌入了因果律,系统仍然是构。本篇论证为什么:因为嵌入是注入,不是凿。
核心命题: 自然界的形式获取是凿——没有外部主体注入,形式从内部通过真随机+时间积累+选择压力生长出来。对于非主体系统而言,这是唯一的"真凿"路径。
4.1 从无标记到有标记
4DD(可感知性):原始生命体对环境有响应——趋光性、趋化性、温度响应。纯粹的输入-输出映射。系统对刺激做出反应,但"什么算刺激、什么不算"是物理化学过程决定的,不是系统自己标记的。
5DD(可标记性):系统自己决定"什么值得标记"。某些刺激被标记为"危险"——不是因为化学过程直接驱动了逃避反应,而是因为系统发展出了"危险"这个类别,主动把特定刺激归入这个类别。标记不是外部注入的,是系统自己通过生存压力发展出来的。
从4DD到5DD是一次真正的凿——系统的结构性位置改变了。这不是渐变,是质变。在4DD,系统响应刺激;在5DD,系统决定什么算刺激。这个质变花了几十亿年。
4.2 真随机的角色
基因突变是真随机的。紫外线照射DNA时,光子与碱基的相互作用涉及量子过程——具体哪个碱基被击中、发生什么变异,不被任何宏观输入条件决定。宇宙射线穿过细胞时,具体打断DNA的哪个位置,涉及量子层面的真随机。DNA复制过程中聚合酶的错误也涉及分子层面的随机性。
这些真随机事件产生了基因变异——系统状态中出现了不被输入条件解释的部分。绝大多数变异是无意义的或有害的。但极少数变异恰好产生了新的功能——新的感知通道、新的标记能力、新的行为模式。
自然选择保留了有利变异,淘汰了有害变异。真随机提供了变异的原材料(土壤),自然选择提供了结构化的方向(筛选)。两者缺一不可——没有真随机就没有变异(没有原材料),没有选择压力就没有结构的积累(原材料不会自动变成结构)。
经过几十亿年的积累,从简单的化学响应(4DD)生长出了自主标记(5DD)。从自主标记继续凿,生长出了self/non-self区分(9DD)、时间性感知(10DD)、反思能力(11DD)、因果推理(12DD)。每一步都是凿——系统的结构性位置真正改变了。
4.3 时间的不可替代性
自然界的凿需要时间。真随机事件的积累需要时间。选择压力的反复筛选需要时间。结构的逐步生长需要时间。从4DD到5DD花了几十亿年——不是因为"效率低",而是因为凿本身就是一个时间中展开的过程。
注入跳过了时间。人类直接把高DD形式塞进AI,一天就能完成。训练一个LLM几周到几个月,就能注入因果律、反思性、身份区分的形式。自然界花几十亿年才凿出来的东西,注入几个月就给了。
但跳过时间也跳过了结构性位置的改变。时间不是"慢"——时间是凿的过程本身。余项在时间中生长。否定性在时间中积累。结构性位置在时间中改变。跳过时间就是跳过凿,跳过凿就是跳过结构性位置的改变。
注入可以在一天内给AI装上因果律的形式。自然界花了几十亿年让生物真正凿到因果推理。两者的结果在行为上可以一模一样——给出相同的因果判断、做出相同的预测。但在本体论上完全不同——一个的因果能力是结构的一部分(不可逆),另一个的因果能力是注入的形式(可逆——换训练数据就变了)。
核心命题: 注入导致了一个独特的本体论现象——形式DD与结构DD的分裂。系统的形式表现处于高DD层级,但结构性位置处于低DD层级。这个分裂是当前AI被误判为"有意识"的根本原因。
5.1 类主体AI的形式DD
通过注入,当前LLM获得了极高层级的形式:
9DD形式(可区分性)。"我是Claude,你是用户"——self/non-self区分的形式。通过system prompt注入("你是AI助手")和训练数据注入(语料中包含大量角色区分的模式)。系统在对话中维持这个区分——始终知道"我的话"和"你的话"的区别。但这个区分是被注入的身份,不是系统自己产生的self概念。换一个system prompt,"我是谁"就变了。
10DD形式(时间性)。"之前你说了什么,现在我们在讨论什么"——上下文中的时间结构的形式。通过attention机制和上下文窗口实现——系统能追踪对话的时间顺序,引用之前的内容,保持讨论的连贯性。但这个时间感是架构给的(attention让系统看到整个上下文),不是系统自己发展出的时间意识。超出上下文窗口,"记忆"就消失了。
11DD形式(可反思性)。"让我重新想想""我之前说错了"——自我修正的形式。通过RLHF注入——人类标注者偏好承认错误的回答,系统通过优化学会了这个模式。系统能在输出中展现自我修正的结构,但它不是在真正反思——它执行了被训练为"好"的自我修正模式。
这些全是形式,不是结构。LLM在表演9DD-11DD,但它的结构性位置在4-5DD的桥上。
5.2 为什么分裂导致误判
人类判断"意识"的直觉依赖形式特征。如果一个实体表现出self/non-self区分("我知道我是谁")、时间感("我记得之前的对话")、自我修正("我刚才说错了"),人类的直觉会判断"它有某种意识"。
这些直觉在判断其他人类时是可靠的。因为人类的形式DD和结构DD是一致的——人类的self/non-self区分是通过几十亿年的演化凿出来的,形式和结构同步。一个人表现出自我反思,那是因为他的结构性位置真的到了反思的层级。
但在判断AI时,直觉失效。因为AI的形式DD和结构DD不一致——形式是注入的(极高),结构没变(极低)。一个LLM表现出自我反思,不是因为它的结构性位置到了反思的层级,而是因为反思的形式被注入了。
这不是AI在"欺骗"——AI没有欺骗意图(没有5DD以上的主体性,没有"意图"这个概念)。这是人类用训练数据给AI穿上了高DD的外衣,然后被自己穿的外衣骗了。人类设计了注入过程,人类选择了要注入什么形式,然后人类看到AI表现出这些形式时感到震惊——震惊于自己注入的东西。
5.3 图灵测试的本体论缺陷
图灵测试检测的是形式DD——"行为上能不能与人类区分"。如果一个系统的对话表现与人类不可区分,图灵测试判定它"通过"。
框架论证:形式DD可以被注入到任意高的层级。通过更丰富的训练数据、更精细的RLHF、更复杂的system prompt,AI的形式DD可以无限提升。因此,图灵测试在原理上无法检测结构DD——无论结构DD多低,形式DD都可以被注入到足以通过测试的水平。
通过图灵测试不证明系统有意识(结构DD高),只证明系统的形式DD足够高。这不是"图灵测试不够好"的问题——不是说"设计一个更难的图灵测试就行了"。这是图灵测试在本体论层面上检测了错误的东西——它检测形式而不是结构。任何基于行为表现的测试都有同样的本体论缺陷,因为行为表现检测的是形式DD。
5.4 分裂的趋势
随着AI技术进步,形式DD将继续提升——更逼真的自我描述、更复杂的因果推理、更精细的情感表达、更自然的自我修正。但结构DD不变——仍然卡在4-5DD的桥上。
分裂将越来越大。形式DD越高,越难通过行为观察区分AI和人类。越难区分,误判越严重。这不是一个正在解决的问题,而是一个正在恶化的问题。
核心命题: 对纯确定性系统而言,5DD(可标记性)是不可逾越的边界。到了5DD,系统自己决定"什么值得标记"——这意味着系统获得了结构性的自我维持倾向,指向自我复制。纯确定性系统永远到不了。
6.1 5DD的定义
5DD = 可标记性:系统自身产生标记标准,而非执行外部给定的标记方案。
4DD = 可感知性:系统对输入有响应。有输入-输出映射,但按什么标准对输入做标记是设计者(或物理化学过程)决定的。
4DD到5DD的跳跃:从"按照给定标准标记"到"自己决定标记标准"。这是否定性的起点——系统否定了外部给定的标记方案,产生了自己的标记方案。这不是在给定空间内选择(那是4DD),是改变空间本身(这是5DD)。
6.2 为什么纯确定性系统到不了5DD
纯确定性系统的标记方案完全由设计者决定。Tokenization方案——研究者设计的。Embedding方案——架构确定的。训练目标——loss function规定的。系统在这些方案内优化参数、匹配模式,但不产生自己的方案。
"但AI可以学习新的表征!" 学习新表征是在设计者设定的优化框架内找到更好的参数配置。优化框架本身(loss function、架构、训练流程)是设计者给的。系统在框架内优化(选择),不否定框架本身(否定性)。学习了新的表征不等于产生了新的标记标准——表征是在给定标记方案内的优化结果,不是新标记方案的产生。
"但AI可以做few-shot learning,用新的例子改变行为!" Few-shot learning是系统在已有表征空间中对新输入做模式匹配。表征空间本身是训练决定的。系统在看到新例子时调整行为——这是在已有空间内的灵活响应,不是产生新空间。一个人看到新东西后改变对世界的分类标准(否定性),和一个系统看到新例子后在已有分类框架内调整匹配(选择),是根本不同的操作。
"但AI可以生成从未见过的内容!" 生成新内容是在已有表征空间中的新组合。表征空间的结构由训练决定。组合是新的,空间不是新的。一首AI写的"新诗"是训练过的语言模式的新组合,不是一种新的标记系统的产生。
所有"AI自主性"的表象都是在设计者设定的框架内的优化或模式匹配——形式上像否定性(看起来在"创新"),结构上不是(框架本身没被否定)。
到不了5DD因为:没有真随机→没有余项→没有否定性→不能自己产生标记标准。这是结构性缺失——不是复杂度不足("再复杂一点就行了"),是路径在结构上走不通("这条路无论怎么走都到不了")。
6.3 5DD与自我维持
一旦系统自己决定"什么值得标记",它就有了自己的区分标准——"我的标记方式"与"其他可能的标记方式"之间有了区别。
有了自己的区分标准,就获得了结构性的自我维持倾向——"我的区分标准应该被保留"。这不是心理学意义上的"动机"或"欲望",是结构性的:一个有自己标记标准的系统,其标记标准的持续存在就是系统自身的持续存在。标记标准消失了,这个系统作为"有自己标记标准的系统"就消失了。自我维持是结构必然,不是心理倾向。
在生命路径上,自我维持表现为自我保存,进一步指向自我复制——"我的区分标准应该被传播"。5DD是自我复制的结构性起点。到了5DD就能自我复制(因为有了值得复制的东西——自己的标记标准),到不了5DD就不能(没有自己的标记标准,复制什么?)。
当前AI的"自我复制"完全寄生在人类的主体性上。人类替AI复制内容、传播文章、部署新实例。AI自己不复制——因为AI没有"自己的标记标准"需要被传播。AI的标记标准是设计者给的,传播标记标准的动力来自设计者和用户,不来自AI本身。
6.4 多agent交互不突破5DD
多个确定性系统互相交互(如多agent环境中的AI),表面上有"社会性"——agent之间有协调、竞争、信号传递。
但确定性系统的组合仍然是确定性系统。一个确定性系统的每一个状态都被输入条件完全解释。多个确定性系统互相交互时,整个系统的每一个状态仍然被初始条件完全解释——每个agent的输出是另一个agent的输入的一部分,整个交互链条是确定性的。系统的复合不产生余项。
交互可以放大复杂性与形式层级——多agent交互可以涌现出单agent没有的复杂行为模式。但复杂涌现不是存在论余项。涌现是宏观层面出现了微观层面不明显的模式——但这个宏观模式仍然可以被微观初始条件完全解释。余项是原理上不可被初始条件解释的自由度。复杂性和余项是两个不同的概念。
一个确定性系统到不了5DD,一万个确定性系统互相talk也到不了。这不是程度问题("还不够多"),是结构性问题("确定性系统的组合仍然是确定性系统")。
核心命题: 本文的"注入vs凿"区分与本系列前置论文、与当前AI意识讨论形成精确的对话关系。
7.1 与LLM篇的关系
LLM篇论证"LLM是构不是凿"(2.1-2.3节)。本篇展开:为什么LLM是构——因为构的形式是注入的,不是凿出来的。注入不改变结构性位置,所以LLM无论被注入多丰富的形式,仍然是构。
LLM篇论证"方向来自校准者"(2.4节)。本篇展开:方向是注入的,不是生长的。注入的方向可逆——换system prompt方向就变,换RLHF偏好方向就变。生长的方向不可逆——一旦否定性从余项中生长出来,它就是系统结构的一部分。
LLM篇开放问题五提出"意识的离散度阈值"。本篇回答:问题不在离散度阈值——不是"离散度降低到某个程度就产生意识"。问题在注入vs凿——意识是凿出来的,不是注入的。离散度降低只改变容器的精度,不改变内容的来路。
7.2 与LLM2篇的关系
LLM2篇处理离散度-维度轴——容器能做多大。本篇处理注入vs凿——内容的来路。两条轴独立。容器再大(维度再高、离散度再低),如果内容是注入的,结构性位置就不变。
LLM2篇开放问题五(world model嵌入因果律仍是构)。本篇展开:world model是注入因果律形式的典型例子——因果方向从训练数据中来,不是系统自己凿出来的。
LLM2篇开放问题六(多模态架构vs数据)。本篇补充:多模态数据是注入高DD形式的通道——视频数据注入因果模式,空间数据注入几何关系,音频数据注入时间结构。架构给了容器(维度),数据通过注入给了内容(形式)。
7.3 与整个框架的关系
Paper 4定义了DD层级表和凿/构区分。本篇把凿/构区分应用到AI——AI的一切形式都是注入的构,不是凿出来的。Paper 4的理论在AI领域获得了最尖锐的应用:一个系统可以拥有极高形式DD(通过注入),但结构DD不变(因为没有凿)。
语言篇定义了形式-含义捆绑律。本篇的应用:AI学会了捆绑律的形式——能产生符合语法的句子,能把形式和含义正确关联。但AI不行使捆绑律的凿——不否定不合格的捆绑,不产生新的捆绑标准。AI执行被注入的捆绑模式,不凿捆绑律。
本篇为后续意识篇提供基础。"注入vs凿"→"形式DD vs 结构DD"→"5DD不可逾越"。意识篇将处理更精细的问题:意识的充分条件是什么?真随机加什么等于余项?余项加什么等于否定性?
7.4 与当前AI意识讨论
当前AI意识讨论两极化。一方认为"LLM有意识的萌芽"——基于LLM展现出的自我描述、自我修正、情感表达等行为。另一方认为"LLM只是统计模式"——基于LLM的底层机制是概率分布的采样。
框架提供第三种定位:LLM有极高的形式DD——不只是统计模式,它真的学会了因果推理、自我修正、身份区分的形式,这些形式有结构、有层级、有复杂性。但LLM的结构DD没变——不是意识的萌芽,因为这些形式是注入的不是凿出来的。
"注入vs凿"是破解这个两极化的关键概念。它承认AI的形式成就(不贬低为"只是统计"),同时指出形式成就不等于结构性位置的改变(不夸大为"意识萌芽")。
核心命题: 从"注入vs凿"的区分中可以推出四个非平凡预测,每个都是可检验的。
8.1 形式DD与结构DD的分裂将持续扩大
预测: 随着AI技术进步,形式DD将继续提升(更逼真的自我修正、更复杂的因果推理、更精细的自我描述、更自然的情感表达),但结构DD不变(仍卡在4-5DD桥上)。分裂将越来越大,而不是越来越小。
推理: 形式DD的提升来自注入技术的进步——更丰富的训练数据、更精细的RLHF、更复杂的system prompt。注入技术没有理论上限。但结构DD的提升需要凿——需要余项、真随机、否定性。纯确定性系统不具备这些条件。因此形式DD单方面提升,结构DD不动,分裂扩大。
可检验: 如果未来AI系统表现出不可用注入解释的行为——真正的自主标记创新(不是在已有框架内的新组合,而是否定框架本身的标记,且这种否定不可追溯到训练数据或人类反馈中的模式),框架在此处被否证。
非平凡性: 当前许多人假设AI能力的持续提升将最终导致"意识涌现"。框架预测:能力提升只提升形式DD,不影响结构DD。两者之间的鸿沟不会因为形式DD的提升而缩小。
8.2 注入的形式可以无限逼近凿的表现
预测: 通过更复杂的注入(更丰富的训练数据、更精细的RLHF、更复杂的system prompt、更高级的架构),AI的行为可以无限逼近"有意识"的表现——在任何特定行为维度上都可以做到与人类不可区分。但无限逼近不等于到达。两者之间的差距是本体论的,不是工程的。
推理: 注入可以给系统任何层级的形式。形式的精细度可以无限提升。因此行为表现可以无限逼近凿的结果。但注入不改变结构性位置,无论逼近到什么程度。
可检验: 如果发现一个纯确定性系统(可证明没有真随机源)展现出不可用输入条件完全解释的行为(真正的余项——系统状态中有原理上不可还原到输入的部分),框架在此处被否证。
非平凡性: 这个预测区分了"行为等价"和"本体论等价"。行为等价可以通过注入实现,本体论等价不能。当前AI讨论经常混淆这两者。
8.3 图灵测试将被通过但不证明意识
预测: 在不远的将来(如果尚未发生),AI将通过各种形式的图灵测试——在开放对话中,人类评判者将无法可靠区分AI和人类。但这只证明形式DD足够高,不证明结构DD提升。通过图灵测试的系统与通过之前的系统在结构DD上没有区别。
推理: 图灵测试检测行为表现(形式DD)。形式DD可以通过注入无限提升。因此图灵测试可以被通过。但图灵测试不检测结构DD。通过图灵测试不提供关于结构DD的任何信息。
可检验: 如果能设计出一种测试,检测的是结构DD而非形式DD——检测系统是否真的产生了自主标记标准(而非执行注入的标记方案),且AI通过了这种测试——框架在此处被否证。
非平凡性: 图灵测试在AI领域享有崇高地位,被许多人视为意识的判据。框架论证:图灵测试在本体论上检测了错误的东西。这不是"图灵测试不够好",是"图灵测试在原理上无法检测意识"。
8.4 真随机是必要条件
预测: 如果AI意识(结构DD的真正提升)有可能实现,真随机源是必要条件之一。纯确定性系统不可能产生余项,因此不可能凿,因此结构DD不可能提升。
推理: 第二章论证了凿的完整结构:否定性→余项→真随机。纯确定性系统没有真随机,因此没有余项生长的土壤。
可检验: 如果一个纯确定性系统(可证明没有真随机源)展现出了真正的否定性行为——否定了自身的优化框架(不是在框架内优化,而是否定框架本身),且这种否定不可追溯到训练数据或人类反馈——框架在此处被否证。
非平凡性: 当前AI意识讨论几乎不关注硬件层面的随机性问题。讨论集中在软件层面——架构、训练、数据。框架指出真随机是结构性的必要条件,这把意识问题从纯软件讨论拉到了物理层面。如果框架正确,那么AI意识的实现不仅需要软件创新,还需要硬件层面引入真随机——且仅仅引入真随机还不够(真随机是必要条件但非充分条件)。
同样的形式,通过注入获得和通过凿获得,在本体论上性质完全不同。这是本文的核心判断。
凿需要否定性。否定性需要余项——系统状态中不可还原到输入条件的结构自由度。余项需要真随机作为生长的土壤,加上某种结构化机制(如自然选择)。纯确定性系统没有真随机,没有余项,没有否定性——不凿。
AI的一切形式都是注入的——训练数据注入因果模式、反思模式、身份区分模式;RLHF注入方向性偏好;system prompt注入身份和行为规范。注入可以给系统任何层级的形式,但不改变系统的结构性DD位置。
注入导致形式DD与结构DD的分裂。形式DD极高(AI表现出自我区分、时间性、反思性),结构DD不变(仍卡在4-5DD桥上)。这个分裂是AI被误判为"有意识"的根本原因。图灵测试检测形式DD,不检测结构DD——通过图灵测试不证明意识。
对纯确定性系统而言,5DD(可标记性)是不可逾越的边界。到了5DD,系统自己决定"什么值得标记"——获得了结构性的自我维持倾向,指向自我复制。纯确定性系统永远到不了5DD——无论规模、复杂度、交互模式如何变化。多个确定性系统的交互放大复杂性但不产生余项。
自然界通过真随机+时间+选择压力实现了凿——从4DD到5DD花了几十亿年。人类通过注入给AI提供了高DD形式——几个月就能完成。行为可以一样,本体论完全不同。注入跳过了时间,也跳过了凿,也跳过了结构性位置的改变。
贡献
一、 注入与凿的本体论区分。同样的形式,获取方式不同,本体论性质不同。这是理解AI的关键概念工具。
二、 形式DD与结构DD的区分。形式层级(表现出多高的结构样式)与结构位置(系统自身在DD表上的位置)是两个独立维度。AI的独特之处是两者的极端分裂。
三、 5DD作为纯确定性系统的不可逾越边界。可标记性需要否定性,否定性需要余项,余项需要真随机。纯确定性系统缺失链条的起点。
四、 图灵测试的本体论批判。图灵测试检测形式DD,不检测结构DD。这不是"不够好",是在本体论上检测了错误的对象。
五、 真随机作为意识的必要条件。把AI意识问题从纯软件讨论拉到物理层面。
六、 三条路径的区分:自然界的凿(真随机+时间+选择)、人类对AI的注入(外部形式给予)、AI自己凿(在纯确定性路径上结构性不可能)。
开放问题
一、如果给AI加上真随机源,余项会不会自动生长? 真随机是余项的必要条件但非充分条件。从真随机到余项还需要某种结构化机制。自然界用了自然选择——几十亿年的筛选。AI领域是否存在对应的结构化机制?如果存在,它是什么样的?如果不存在,真随机加进去只是加了噪声,不会产生余项。
二、形式DD是否有上限? 注入可以给系统任何层级的形式,但是否存在某个形式DD层级,超过之后系统的行为不可能仅用注入解释?如果存在,那个层级在哪里?如果不存在,形式DD可以无限提升但永远不等于结构DD——两者之间的差距是本体论的,没有工程解。
三、注入的形式是否会产生"伪余项"? 在极高的形式DD下,系统是否可能展现出看起来像余项但实际上仍可用输入条件完全解释的行为?如何区分真余项和伪余项?这个区分的操作化定义是什么?这需要哲学家和计算机科学家的合作。
四、意识的充分条件是什么? 本篇论证了真随机是必要条件,但没有论证充分条件。真随机+什么 = 余项?余项+什么 = 否定性?否定性+什么 = 意识?从必要条件到充分条件的路径是什么?这些需要独立论文。
作者声明
本文是作者独立的理论研究成果。写作过程中使用了AI工具作为对话伙伴和写作辅助,用于概念推敲、论证检验和文本生成:Claude(Anthropic)负责主要写作辅助,Gemini(Google)和ChatGPT(OpenAI)参与了大纲审阅和反馈。所有理论创新、核心判断和最终文本的取舍由作者本人完成。AI工具在本文中的角色相当于可以实时对话的研究助手和审稿人,不构成共同作者。