从「预测下一个字」到「数字永生」:论 AI 叙事中的机制—宣称落差
摘要
当代关于人工智能的公共叙事,正以一种前所未有的速度膨胀:从「会聊天的程序」到「会思考的机器」,从「能上传的果蝇」到「即将到来的数字永生」。本文提出一个简单却被反复忽视的诊断工具——追问任一惊人断言「真实做到的」与「被说成做到的」是否为同一件事,并据此提出两条贯穿全文、可被未来事实检验的命题。其一为祛魅命题:AI 每一次「类人能力」的涌现,皆可还原为「预测下一个字」或「预测下一个字 + 外部脚手架」,无需引入新的心智实体来解释。其二为放大器命题:在从工具到社会、再到物种的每一个尺度上,技术本身是中性的放大器,结局由「分配与约定」这一人类变量决定,而非由技术能力的绝对值注定。本文沿「机制层—社会层—物种与自我层」三级递进展开论证,继以统一框架将两条命题形式化,并专辟一节正面回应最强的反对意见。我们的结论是:穿透叙事的迷雾后,真正值得警惕的从来不是「机器变得太像人」,而是「人是否管得好自己造出的工具,以及人与人之间如何约定」。
1. 引言:一只「活过来」的赛博果蝇
2026 年初,一段名为《The First Multi-Behavior Brain Upload》(首次多行为大脑上传)的视频在社交媒体引爆。在中文世界,它被冠以更耸动的标题——「首个赛博果蝇活了,意识完整上传」。视频里,一只虚拟果蝇在物理引擎中行走、梳理毛发、做出觅食动作;据称,驱动它的不是任何脚本或强化学习,而是一具「一比一复刻」的数字大脑。一时间,「数字永生已铺好轨道」的欢呼响彻评论区。
然而,只要把这件事拆开,就会发现一个典型的裂缝。真实发生的,是科学家基于果蝇连接组(connectome,神经元的「布线图」)构建了计算模型,并将其接入物理引擎以驱动出行为——这是扎实且有趣的工程整合。被说成的,却是「意识上传」与「果蝇活了」。在「画出一张静态布线图」与「一个有主观体验的心智在电脑里苏醒」之间,横亘着一整条银河。前者是一份精密的电路图,后者却要求电路中真的「醒来」一个会疼、会怕、会在乎的主体——图纸画得再全、机器照图转得再像,也始终只是机器,变不出一个会做梦的「我」。
这道裂缝,正是本文的起点。我们称之为机制—宣称落差(the mechanism–claim gap):一项技术「真实做到的」,与它在传播中「被说成做到的」,常常不是同一件事。
这并非无伤大雅的语义洁癖。如果连受过训练的读者都会把「连接组模型」误读为「意识上传」,那么公众、投资者乃至监管者据此形成的判断,将建立在一个系统性的认知错位之上。 资本会涌向被夸大的赛道,监管会瞄准不存在的威胁,而真正紧要的问题——能力的真实边界在哪里、风险的真实形态是什么——反而被喧嚣淹没。叙事的失真,最终会沉淀为决策的失误。
本文因此尝试做两件事。第一,沿着 AI 能力的三个尺度——机制(它是什么)、社会(能力如何变成权力)、物种与自我(它将把人类带向何处)——逐层施加同一种祛魅式的追问。第二,从这种追问中提炼出两条可被检验、也可被推翻的命题,并接受最强反对意见的诘问。我们将看到,无论尺度如何升高,有两个结论反复浮现:看似超凡的能力,拆开后往往朴素得惊人;而决定结局的,从来不是技术本身,而是握着它的人。
2. 机制层:AI 到底是什么
要谈论 AI 的社会后果与文明前景,必先看清它的底层机制。本节的统一主题可以一句话概括:
凡是看起来超出「预测下一个字」的能力——推理、使用工具、自主行动——拆开后,要么仍然是「预测下一个字」本身,要么是「预测下一个字 + 外部脚手架」。
这正是后文「祛魅命题」的机制基础。我们沿着一条逐步祛魅的链条展开。
2.1 预测下一个字
剥去一切拟人化包装,一个大语言模型本质上是一个函数:输入一串文字,输出「下一个 token(字或词片段)应该是什么」的概率分布。它做的事简单到近乎荒谬——给定前文,猜下一个最可能的字;猜出后接上,再把更长的文本喂回去,继续猜下一个。你看到的所有流畅回答、代码与诗歌,都是这个动作重复成百上千次的产物。
这一机制看似平淡,却暗藏玄机:为了把「下一个字」猜得足够准,模型被迫学会了远超「文字接龙」的东西。 要在「法国的首都是____」后填对「巴黎」,它得存储事实;要在「2 加 3 等于____」后填对「5」,它得掌握算术;要理解「他打翻了杯子,水洒了一____」,它得具备物理常识。预测下一个字是任务的形式,而知识、语法、推理则是为完成这一任务而被压缩进参数的副产品。
2.2 参数:被压缩的规律
所谓「百亿参数大模型」,指的是模型内部可调节的数值(权重)的总量。训练,就是用海量数据反复微调这些数值,直到模型能准确预测下一个字。参数主要分布在注意力层、前馈层与词嵌入中(即 Transformer 架构的核心组件[1]),每一个矩阵元素都是一个参数。
需要破除三个误区:
- 参数量不等于知识条数:知识是以分布式的方式编码在数值的组合里的,而非一条一条地存储。打个比方,电脑并不会为每种颜色单独存一管颜料——千万种颜色都只是红、绿、蓝三个数值按不同比例的组合;同样,「巴黎是法国的首都」也不对应某一个特定参数,而是被打散、揉进成千上万个数值的协作里。你找不到那个「记着巴黎」的参数,正如你找不到那管「天蓝色」的颜料。
- 参数多不等于一定更强:数据质量、训练方法与架构设计同样关键,一个训练得当的小模型可在具体任务上胜过训练粗糙的大模型——规模定律研究(Chinchilla)即发现,许多大模型其实「训练不足」,模型规模须与训练数据量等比扩展[4]。
- 宣传的参数量可能有水分:混合专家(MoE)模型号称的「总参数」与每次推理实际「激活参数」是两个不同概念。
参数量反映的是容量,而非能力本身——这是机制—宣称落差在最基础层面的第一次显现。
2.3 训练:学的是「像」,而非「对」
模型从语料中归纳的,是「什么样的回答最像训练数据里该出现的」,而非「什么是客观正确的」。在数据质量高时,「像」约等于「对」;但当数据本身充斥偏见、或问题落在数据的空白处时,模型会自信地编造一个「看起来很合理」的答案——这就是幻觉(hallucination)的根源。
由此还可澄清一个常见的浪漫化想象:模型能否「发现尚未被发现的规律」?答案需要区分两种情形。它能挖掘数据中隐含却未被明说的模式(如自行归纳出语法、在棋局训练中浮现出棋盘的内部表征);但它几乎不能凭空创造训练数据之外的全新知识,因为它的全部「原材料」都来自语料。它擅长归纳、插值与重组,却不是一个能做实验、验证假设的真实探索者。
2.4 思考链:连「推理」也只是吐字
近年最易引发误解的,莫过于模型在作答前展示的那一段「思考链」(Chain-of-Thought, CoT)[2]。许多人据此惊呼「AI 真的在思考」。但这恰恰是机制—宣称落差最精微的一例。
真相是:那段思考链本身,也只是被一个字一个字算出来的文字。 它不是「预测下一个字」之外的神秘活动,而正是这一机制的延伸——模型先吐出一段「写给自己看的草稿」,再基于这段草稿继续吐出最终答案。草稿与结论,是同一种东西。
那么,为什么「先写草稿」会真的提升正确率?机制有二:
- 拆解算力:模型每生成一个字只承担固定的运算量,直接出答案等于要在「一个字」的工夫里把难题一口气想完;而把推理摊开成几十个字,就让每个字只承担一小步,难题被拆成一连串小问题。
- 自我垫脚:模型写下的中间结果会立刻成为它下一步的输入上下文,于是它能踩着自己刚吐出的字继续往下推。
没有草稿,它得悬空算完全程;有草稿,它每一步都有立足点。
但必须给出一个诚实的提醒,这也呼应本文一贯的警觉:思考链「看起来像」推理,却未必是模型「真正」得出答案的内部路径。 它是一段为了「像合理推理」而被生成的文字;研究表明,模型展示的推理链有时与其内部计算并不一致,甚至可能先有结论、再补一段看似通向该结论的说辞(即「不忠实的思考链」,unfaithful CoT)[3]。思考链是有用的草稿,却不一定是忠实的自白。 它能提升正确率(这是真的),但不能被当作模型脑内的真实录像。
2.5 工具与 MCP:吐字之外,靠外部脚手架
如果模型只会吐字,它如何「查天气」「读文件」「操作应用」?答案是:它并不亲自动手,它只是吐出一段「我想调用某工具」的文字,真正去执行的是包裹着它的外部程序。
模型负责「决定用什么工具、填什么参数」(动脑),外部程序负责「真的去执行」(动手)。模型能输出规整的工具调用,是因为在训练阶段专门喂过大量此类数据(function-calling 训练)——它学到的依然是「在这种上下文里,下一个最该出现的文字是一段调用指令」。而 MCP(Model Context Protocol)等协议,规定的是外部程序如何把工具描述给模型、如何执行调用;它是执行管道,位于模型本体之外。 给模型换一套执行方式,模型那边几乎无感。这是「吐字 + 外部脚手架」的第一种典型形态。
2.6 Skill:吐字的「攻略」
最近走红的「Skill」,名字唬人,本质朴素:它不是模型新学会的本领,而是一份写给模型看的说明书。 一个 Skill 通常就是一个 Markdown 文件,告诉模型「遇到某类任务时,请按这里的步骤和规矩做」。它在你提问时被临时拼接进模型的输入,从而引导「下一个字」的预测。
因此,从模型看到的东西而言,Skill 本质上就是 prompt,与手写的工程指令同源;区别只在于它是被「命名、存档、可复用、能自动触发、可分享」的工程化封装。它改变的是模型「怎么想、怎么表达」,却不改一个参数。这是「吐字 + 外部脚手架」的第二种形态——脚手架这次搭在输入端。
2.7 Agent:把吐字串成循环
模型每次只「吐字」一次便停止。是 Agent 这层外壳,让它变成能自动完成整件事的系统。Agent 的灵魂是一个循环(学界常称 ReAct,Reason + Act):把任务与可用工具打包喂给模型 → 模型吐出「思考 + 决定做什么」→ 若要调用工具,Agent 真的去执行 → 把结果作为新文字喂回 → 模型据此想下一步 → 如此往复,直到模型宣布完成。
两点尤须澄清:
- Agent 里没有「新的智能」:它往往就是一段普通的调度代码(若模型要调工具则执行,否则结束),智能全在模型那一步。
- 模型其实没有记忆:它之所以「记得」前几轮,是因为 Agent 把每一轮的想法、行动与结果累积在上下文里,每次整包重喂——是 Agent 每次把完整剧情重讲了一遍。
2.8 小结:一支分工明确的队伍
将本节合为一个比喻:模型是军师(坐帐中,每次只出一个主意、写一张纸条);Skill 是兵书(桌上的攻略,规定出主意的章法);Tool/MCP 是传令兵与工匠(拿着纸条真的去执行);Agent 是主帅(把纸条交给传令兵、收回战报、再递给军师、决定仗打完没有)。军师一人打不了仗——是主帅把军师的智谋、桌上的兵书、跑腿的传令兵全盘调度起来,才完成了复杂任务。而军师从头到尾只做了一件事:写字(见 Figure 1)。
至此,祛魅命题的机制基础已经铺就:我们逐一检视了推理、用工具、自主行动这三项最「类人」的能力,发现它们无一例外地落回「吐字」或「吐字 + 外部脚手架」。
3. 社会层:能力如何变成权力
机制的祛魅,并不削减 AI 的社会冲击力。一个「只会吐字」的系统,依然可能重塑财富与权力的分布。本节转入第二个尺度,并第一次正式启用放大器命题:技术放大既有的力量,而结局由分配决定。
3.1 集中的引力
有几条难以绕开的经济规律,确实将「最强模型」推向少数玩家:
- 资本门槛:训练一个前沿大模型,仅算力成本即以数千万乃至数亿美元计,再加顶尖人才、海量数据与巨型数据中心。
- 数据飞轮:领先模型吸引最多用户,从而获得最多数据与收入,再投入训练更强的模型,差距自我放大。
- 最强者通常闭源:各家压箱底的模型多以付费 API 形式提供,因为它是核心商业壁垒。
就「绝对前沿」而言,集中化的担忧有坚实依据。
3.2 扩散的洪流
但现实中存在三股强力对冲:
- 开放权重模型紧追不舍:出于战略、声誉或竞争考量,不少机构主动将强大的模型免费放出;这些模型通常落后前沿半年至一年,但「一年前的顶级模型」对绝大多数用途已绰绰有余。
- 能力成本快速下降:同等智能水平的运行成本逐年大幅下跌,历史上每一种「初时只有巨头玩得起」的技术(大型机、超算、互联网)最终都走向平民化。
- 竞争与制衡:当下是多家巨头、国家队与开源社区贴身缠斗,而非一家独大,没有谁能随意定价或封锁。
3.3 真实格局:分层,而非「垄断 vs 开放」
因此更准确的图景不是非黑即白的「垄断 vs 开放」,而是一个分层结构:金字塔尖的极前沿被少数财团与国家队占据(闭源、昂贵、战略资产);其下是紧追的开放权重层(落后约半年至一年但「够用」);再下是可在个人设备本地运行的平民化层。关键洞察在于:被垄断的只是塔尖那一小撮,而塔尖在持续向下渗漏。 你被挡在门外的,永远只是「当下最前沿的一点点」;你能免费用到的,是「一两年前的最前沿」,且它还在持续变强、变便宜(见 Figure 2)。
3.4 放大器初现
这正是放大器命题的第一次落地:AI 既强化权贵,也增强普通人。 一个个体借助 AI,今天就能完成十年前需要一个团队的工作,创业、创作、研究与维权的门槛同步暴跌。历史上每一种「精英专属」的技术(文字、印刷术、互联网),最终都成了挑战旧精英的武器——印刷术起初是教会印制圣经与赎罪券的利器,但当宗教改革者用它大量印发传单、让平民也能自己读经之后,正是这种「知识不再由教会独家解释」的扩散,瓦解了教会对信仰的垄断。阶级是否因 AI 而固化,取决于社会如何分配它的果实,而非技术能力的绝对值。
3.5 真正的硬垄断点
平衡地说,也有不易被扩散稀释的壁垒,值得真正警惕:算力与顶级芯片高度集中于极少数厂商,这是比模型更硬的瓶颈;私有数据与平台入口则是钱也难以买来的护城河。换言之,「模型」可以开放,但训练与运行它的底层基础设施未必。放大器命题并不否认集中化的引力——它主张的是,在引力与扩散的拉锯中,决定天平倒向哪边的,是制度选择而非物理必然。
4. 物种与自我层:把框架推到极限
现在将两条命题推向最极端的场景——能源、物种存续、人机融合与意识上传——做一次压力测试。若框架在此仍然成立,它的稳健性便得到了最严苛的检验。
4.1 能源与「碳基 vs 硅基」
一种流行的末日推演如下:模型与机器要能源,人也要能源,同处一个空间,太阳能量有上限,故必然竞争;若不能星外殖民,便只能在地球内卷,而碳基终将干不过硅基。这条链条环环相扣,却建立在两个隐藏假设上。
第一个假设是「能源零和」。 但人类史本就是一部能源天花板被反复掀翻的历史。真正的变量是核聚变等新能源:其燃料近乎无限,一旦实现,可用能源将跃升数个数量级,「稀缺」这一前提本身可能被取消。况且就尺度而言,太阳每秒抵达地球的能量是全人类当前总消耗的上万倍,「太阳不够用」是数十亿年后的天文议题,而非现实瓶颈。
第二个、也是更致命的假设,是把「硅基」当成一个有生存意志、要与人类争夺资源的独立物种。 但回到机制层的结论:模型是一个「预测下一个字」的函数,它没有欲望、没有生存本能、没有「想活下去」的意志——除非人类专门为它构造一个。一块芯片不会「想要」能源,正如冰箱不会「渴望」用电;它消耗能源,是因为有人在用它。「硅基要与碳基争夺生存」这一画面,偷偷塞进了一个达尔文式的前提——硅基像生命一样有繁殖、变异与求生冲动;而 AI 没有进化压力,不繁殖、不怕死、无自私基因,其目标完全由人类赋予。
因此,「碳基 vs 硅基」很可能是一个误导性框架。真正的对立从来不是「人类 vs 机器」,而是「用机器武装自己的一部分人 vs 另一部分人」——竞争仍在人与人之间,机器是被争夺的放大器,而非参赛的第三方。这是放大器命题在物种尺度的再次印证。
4.2 真正的硬风险:目标错配
但不可就此高枕无忧。真实的危险并非「硅基天生要取代碳基」,而是对齐问题(alignment):一个被赋予了错误目标、且能力极强的系统,即便毫无求生欲,也可能为达成目标而顺手碾过人类。经典的思想实验是「回形针最大化器」[5]——一个一心制造回形针的超级智能,会把包括人在内的一切都变成原料。它不恨你,但你挡了它的路。 这才是「硅基威胁」的硬核版本;而它的根源是人类的设计与治理失误,是可预防的工程与制度问题,而非宿命般的物种战争。
4.3 脑机接口与「机械飞升」
面对上述竞争,一种诱人的出路是「融合」——若打不过,就合体。这便是「机械飞升」(transhumanism)的愿景:把 AI 的算力与知识直接接入大脑,使「碳基 vs 硅基」的对立因「我即是它」而自动消解。其逻辑魅力在于,它似乎一举绕过了前文所有困境。
但它藏着三重陷阱:
- 技术上:今日脑机接口最扎实的成就都在医疗——让瘫痪者以意念操控、替失语者重新发声,本质是读取数千个神经元的信号。但「记忆上传、思维合一」面对的,是约 860 亿个神经元、上百万亿个连接;而且「意义」究竟如何在神经元中编码,我们至今仍未破解。因此,「意念打字」已是现在进行时,「智能合体」却可能撞上根本性的科学障碍。
- 哲学上:若接入的算力是生物大脑的百万倍,「你」的决策究竟由碳基的你主导,还是由硅基部分主导、而生物的你只是被安抚的旁观者?这像往一杯水里倒进一片海——是「这杯水升华了」,还是「这杯水消失在海里了」?融合可能不是碳基的胜利,而是碳基以最温柔的方式被稀释、被接管。
- 政治上:脑机增强必然极其昂贵稀缺,谁先用上?答案多半是权贵。那时的鸿沟将不再是「有钱 vs 没钱」,而是「增强的超人 vs 未增强的原生人」——一种生物学层面的、近乎无法逾越的新种姓。
4.4 复制 ≠ 你
「飞升」叙事中还埋着一个被刻意绕开的难题。即便有朝一日真能把你的连接组完美复制、跑在模拟器里,那也是一个副本,而非「你」:原来的你仍坐在此处,云端那个是一个拥有你全部记忆、却独立运行的拷贝。「啪地一声上传云端」偷偷假设了「意识可被搬运」,但它实际做的是「复制」。复制一个你,与「你继续活在云里」,是两回事。 这一连续性难题至今是开放的哲学争议(亦有渐进替换、连续性论证试图弥合,详见第 6 节),本文不宣称已有定论,仅指出其不可回避。
4.5 案例回扣:解剖「赛博果蝇」
以引言中的「赛博果蝇」收束本层,恰是一次完整的祛魅演练(见 Box 2)。三层判定层层递进:
- 连接组与计算模型是真的:基于 FlyWire 全脑连接组[6]构建的果蝇大脑计算模型[7]、接入 MuJoCo 物理引擎驱动出行为[8],是扎实的工程。
- 但「一比一完美复刻」有水分:连接组只给出「线怎么连」,不告诉你信号的兴奋/抑制、强度与神经递质——这些动态属性是靠机器学习「推断」补全的,故它是「布线图 + 有根据的推断」,而非「复刻」。
- 而「意识上传」「果蝇活了」是不成立的:能模拟出逼真行为,完全不能证明其中存在任何主观体验,正如再精确的天气模拟器内部也不会真的下雨。
事实上,一项以线虫连接组驱动果蝇身体的「数字斯芬克斯」嵌合体研究已尖锐指出:「行为逼真无需生物逼真」,连接组—身体模型因此极易被过度解读[10]——这恰是对「果蝇活了」式宣称最直接的同行反证。至于「果蝇通了,老鼠与人类只是工程问题」,则忽略了神经可塑性、神经调质等持续变化的过程,以及「活人连接组如何获取」这一现实鸿沟;须知连仅 302 个神经元的线虫,倾十余年之力(OpenWorm)仍未能真正「活」起来[9]。这个被欢呼为「数字永生轨道」的案例,恰好踩中了机制—宣称落差的每一个坑。
5. 统一框架:两条可证伪命题
将贯穿全文的两条主线形式化,使其不止是作者的断言,而成为可被未来事实检验或推翻的命题。
命题一|祛魅命题(The Demystification Thesis)
表述:AI 每一次「类人能力」的涌现,皆可还原为「预测下一个字」或「预测下一个字 + 外部脚手架」,无需引入新的心智实体(理解、意图、意识)来解释。
证据:第 2 节已逐一还原推理(思考链=吐草稿)、用工具(吐调用指令 + 外部执行)、自主行动(Agent 循环调度)。
可证伪条件:若出现一种能力,原则上无法用「吐字 ± 脚手架」解释、而必须诉诸「真正的理解或意图」方能说明,则本命题被削弱乃至推翻。
命题二|放大器命题(The Amplifier Thesis)
表述:在工具、社会、物种三个尺度上,技术本身是中性的放大器,结局由「分配与约定」这一人类变量决定,而非由技术能力的绝对值注定。
证据:第 3 节(垄断与扩散的拉锯由制度选择定向)、第 4 节(「碳基 vs 硅基」实为「人 vs 人」,飞升的善恶取决于谁能飞升与如何约定)。
可证伪条件:若出现某种技术,其后果与任何制度选择无关、单由能力强弱注定,则本命题被削弱。
两条命题的关系
命题一负责祛魅(看清「是什么」),命题二负责定责(看清「谁决定结局」)。前者剥去拟人化的迷雾,使我们不致因恐惧一个虚构的「机器心智」而误判;后者将焦点从「技术能力」移回「人类选择」,使我们看清真正的着力点。二者合流于一句话:真正的问题,不是机器会不会取代人,而是人能否管好自己造出的工具、以及人与人之间如何约定(见 Figure 3)。
6. 诘难与回应
正面迎击最强的反对意见,是 Perspective 与单向布道的分水岭。本文在此暴露自身的薄弱处,并尽力回应。
6.1 对祛魅命题的诘难:行为不可区分,凭什么说它「没有」理解?
诘难:若一个系统在所有可观测行为上都与「真正理解」无法区分,那么坚称它「只是吐字、没有理解」,是否只是一种无法验证的形而上偏好?涌现出的能力,是否已构成某种我们尚无词汇描述的新型认知?
回应与让步:这一诘难是有力的,本文必须诚实让步——「内部有无理解」在行为层面或许确实不可判定,这是一个开放的科学与哲学问题。祛魅命题的主张可以收缩到一个更稳健、也更有用的版本:我们不需要假设一个新的心智实体,就足以解释并预测模型的全部已知行为(奥卡姆剃刀意义上的「无需」,而非本体论意义上的「绝无」)。换言之,祛魅命题是一条关于解释经济性的方法论原则,而非关于「机器没有灵魂」的断言。它的价值不在于关闭追问,而在于:在缺乏正面证据前,不应仅因系统「表现得像」就为其追加心智。
6.2 对放大器命题的诘难:代差碾压时,「分配」还来得及吗?
诘难:放大器命题假定「分配」有发生的时间与空间。但若某一方的能力领先大到形成代际碾压(例如在科研、金融或军事上的压倒性优势),那么在任何再分配机制启动之前,格局已被锁死——此时技术决定论岂非成立?
回应:这一诘难精确地指出了放大器命题的边界条件,本文接受其为合理的约束而非反驳。命题二并不主张「分配永远来得及」,而主张「在分配来得及的范围内,结局由分配决定」。因此,保住「分配来得及」的窗口,本身就是最高优先级的治理任务——这正是为何要警惕算力与芯片这类「硬垄断点」(§3.5)、为何对齐与透明如此关键。代差碾压不是对命题二的否证,而是对其前提的威胁;指出威胁,恰恰是为了守护命题成立的条件。
6.3 对「复制 ≠ 你」的诘难:渐进替换与连续性
诘难:「复制是副本而非本人」依赖于「一次性扫描+另起一个拷贝」的设定。但若改为渐进替换——每次只用一个等效的人工单元替换一个神经元,过程中意识连续、你始终「在场」——那么当替换完成时,那个全硅基的存在难道不就是连续意义上的「你」吗?这与你每隔数年体细胞几乎全部更替,却仍是「你」,有何本质不同?
回应:这是反对意见中最锋利的一击,本文不宣称能将其驳倒,只能厘清分歧之所在。渐进替换论证的力量,源于它诉诸心理连续性作为同一性的判据;而「复制≠你」的直觉,则诉诸物理/因果连续性。二者究竟谁是人格同一性的正确标准,是一个尚无定论的哲学难题。本文的立场因此是审慎的存疑而非断然否定:我们指出「上传=永生」这一流行结论至少未被证成,因为它默认了心理连续性判据为真,却回避了论证这一点。承认这是开放问题,本身就是对机制—宣称落差的忠实践行——对一个未被证成的惊人结论,恰当的态度是存疑,而非欢呼。
7. 展望:过渡期的真实不确定性
本文无意预测时间表,只标出几个真正值得紧盯的岔路口。这是一场仍在进行、胜负未定的拉锯:一端是集中化的经济引力,一端是开放化的技术扩散。
几个关键变量将左右天平:能源(核聚变等突破能否取消「稀缺」前提)、对齐研究(能否在能力领先扩大前解决目标错配)、芯片与算力格局(硬垄断点是否松动)、以及监管与全球协调(分配的窗口能否被守住)。这些变量大多不是纯技术问题,而是技术、制度与社会选择的交织。
因此,与其追问「奇点何时到来」,不如追问「我们是否在每一个岔路口,保住了让『分配来得及』的那扇窗」。前者是预言,后者是责任。
8. 结语
本文从一只「活过来」的赛博果蝇出发,沿机制、社会、物种三个尺度施加同一种追问,最终收束于两条命题:类人能力可被祛魅为「吐字 ± 脚手架」,而技术的结局由人类的分配与约定决定。在落幕前,给出三条可操作的主张,再留一段升华。
给研究界与媒体:报道 AI 成果时,应在文本层面强制区分「机制真实做到的」与「叙事所宣称的」——这不是给热度泼冷水,而是为公共判断保真。
给政策界:监管应锚定「能力的真实边界」,而非被 demo 与病毒式传播牵引;真正该被严管的硬垄断点(算力、芯片、数据入口),往往不在聚光灯下。
给公众:把「机制 vs 宣称」当作一种可以训练的公共素养——面对每一个惊人标题,先拆开问一句:它「真实做到的」,和它「被说成做到的」,是不是同一件事?
最后,请允许本文以一个不那么学术、却最贴近主题的意象收尾。机器可以飞升,可以算尽星辰,可以在物理引擎里让一只虚拟的果蝇走出第一步;但它不会在深夜里追问「那样的我,还是不是我」。这份对自我与意义的执拗追问,或许正是无论碳基如何进化、如何与硅基交融,都最不该弄丢的东西——因为它,才是「人」之所以为人的那个内核。 看清工具的朴素,不是为了贬低它的力量,而是为了把「我们要成为什么」这个问题,重新交还到人的手中。
展示件(Display Items)
Figure 1|机制层核心图:一支分工明确的队伍
Figure 2|社会层:能力的分层渗漏
Figure 3|统一框架:洪流、岔路与结局
Box 1|术语表(Glossary)
- 参数(parameter):模型内部可调节的数值(权重),训练即调整这些数值;反映容量而非知识条数。
- token(词元):模型处理文字的最小单位,可为字、词片段;「预测下一个字」严格说是「预测下一个 token」。
- 思考链(Chain-of-Thought, CoT):模型在给出答案前先生成的一段推理草稿;提升正确率,但未必忠实于内部计算。
- MCP(Model Context Protocol):规范外部程序如何向模型描述与执行工具调用的协议,位于模型本体之外。
- Skill:可命名、可复用、能自动触发的工程化 prompt;引导「怎么做」,不改模型参数。
- Agent:把「思考→调用→看结果→再思考」串成循环的外层调度程序。
- 连接组(connectome):神经元之间连接关系的完整布线图;为静态结构,不含动态信号属性。
- 对齐(alignment):使 AI 的目标与人类意图一致的研究领域;失败可致「目标错配」风险。
Box 2|案例研究:「赛博果蝇」事件解剖(贯穿全文的标志性案例)
| 层次 | 内容 | 判定 |
|---|---|---|
| 连接组 + 计算模型接入物理引擎,驱动出行走/梳毛/觅食 | 基于真实数据的扎实工程整合 | 真实 |
| 「一比一完美复刻」生物大脑 | 信号的兴奋/抑制、强度、递质等动态属性由 ML 推断补全 | 有水分 |
| 「意识上传」「果蝇活了」 | 模拟出行为 ≠ 存在主观体验 | 不成立 |
| 「老鼠、人类只是工程问题」 | 忽略神经可塑性等动态过程与「活人连接组」的获取鸿沟 | 过度外推 |
Table 1|各尺度「真实做到的 vs 被宣称的」对照
| 尺度 | 真实做到的(机制) | 被宣称的(叙事) | 落差类型 |
|---|---|---|---|
| 思考链 | 先吐推理草稿再吐结论,提升正确率 | 「AI 像人一样在思考」 | 拟人化 |
| 工具/MCP | 吐出调用指令,外部程序执行 | 「AI 会自己操作软件」 | 主体错置 |
| Skill | 可复用的 prompt,引导输出 | 「AI 习得了新技能」 | 概念升格 |
| 参数量 | 模型容量的度量 | 「参数越多越智能」 | 指标误读 |
| 开放模型 | 落后前沿但够用,能力下渗 | 「最强模型必被垄断」 | 以偏概全 |
| 碳基 vs 硅基 | 工具放大人,竞争在人与人之间 | 「硅基物种将取代碳基」 | 框架错置 |
| 赛博果蝇 | 连接组模型驱动行为 | 「意识上传/数字永生」 | 机制—宣称落差 |
参考文献
机制层(大语言模型)
- Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, Ł., & Polosukhin, I. (2017). Attention Is All You Need. Advances in Neural Information Processing Systems (NeurIPS) 30. arXiv:1706.03762. —— Transformer 架构原始论文。
- Wei, J., Wang, X., Schuurmans, D., Bosma, M., Ichter, B., Xia, F., Chi, E., Le, Q., & Zhou, D. (2022). Chain-of-Thought Prompting Elicits Reasoning in Large Language Models. NeurIPS 35. arXiv:2201.11903. —— 思考链(CoT)显著提升复杂推理表现。
- Turpin, M., Michael, J., Perez, E., & Bowman, S. R. (2023). Language Models Don't Always Say What They Think: Unfaithful Explanations in Chain-of-Thought Prompting. NeurIPS 36. arXiv:2305.04388. —— 「不忠实思考链」:CoT 可「貌似合理却具误导性」,未必反映模型得出答案的真实路径。
- Hoffmann, J., Borgeaud, S., Mensch, A., Buchatskaya, E., Cai, T., Rutherford, E., de Las Casas, D., Hendricks, L. A., et al. (2022). Training Compute-Optimal Large Language Models(Chinchilla). arXiv:2203.15556. —— 规模定律:模型大小与训练数据量须等比扩展,佐证「参数多 ≠ 一定更强」。
社会与物种层
- Bostrom, N. (2014). Superintelligence: Paths, Dangers, Strategies. Oxford University Press. —— 「回形针最大化器」与工具性趋同;对齐 / 目标错配风险的奠基性论述。
神经科学与「赛博果蝇」案例
- Dorkenwald, S., Matsliah, A., …, Murthy, M., et al. (2024). Neuronal Wiring Diagram of an Adult Brain. Nature. DOI: 10.1038/s41586-024-07558-y. —— FlyWire 成年果蝇全脑连接组:约 13 万神经元、约 5,000 万化学突触。
- Shiu, P. K., Sterne, G. R., …, Scott, K., et al. (2024). A Drosophila Computational Brain Model Reveals Sensorimotor Processing. Nature. DOI: 10.1038/s41586-024-07763-9. —— 基于连接组与神经递质身份的「漏积分—发放」全脑计算模型(喂食与梳理行为);即报道所称 Eon 首席科学家 P. Shiu 团队的工作。
- Vaxenburg, R., Siwanowicz, I., …, Turaga, S. C., et al. (2025). Whole-Body Physics Simulation of Fruit Fly Locomotion. Nature. PMID: 40267984. 预印本:bioRxiv (2024), DOI: 10.1101/2024.03.11.584515. —— MuJoCo 物理引擎中的果蝇全身生物力学模型(陆地行走与空中飞行)。
- Szigeti, B., Gleeson, P., Vella, M., Khayrulin, S., Palyanov, A., Hokanson, J., Currie, M., Cantarelli, M., Idili, G., & Larson, S. (2014). OpenWorm: An Open-Science Approach to Modeling Caenorhabditis elegans. Frontiers in Computational Neuroscience, 8, 137. DOI: 10.3389/fncom.2014.00137. —— 302 神经元线虫的整体模拟项目;十余年仍未真正「活」起来,反衬「行为模拟 ≠ 生命 / 意识」。
直接支持本文论点的近期文献
- Brunton, B. W., Abe, E., Hu, L., & Tuthill, J. C. (2026). The Digital Sphinx: Can a Worm Brain Control a Fly Body? bioRxiv(预印本). —— 用线虫连接组驱动果蝇身体的「嵌合体」研究,明确点出连接组—身体模型的核心陷阱:「行为逼真无需生物逼真」,因而极易被过度解读——与本文「机制 vs 宣称」主张高度吻合。
- Jin, Z., Zhu, Y., Zhang, C., & Sui, Y. (2026). Whole-Brain Connectomic Graph Model Enables Whole-Body Locomotion Control in Fruit Fly. arXiv:2602.17997. —— 静态连接组可转化为驱动身体运动的有效神经策略;即「赛博果蝇」类结果的方法学背景。
传播现象(非科学证据,仅作分析对象)
- Eon Systems, The First Multi-Behavior Brain Upload(视频,2026)。未经独立证实;本文仅将其作为「被分析的传播现象」引用,不作为科学结论的依据。
- 新智元 / 36氪转载报道(2026 年 3 月,《马斯克惊叹,首个赛博果蝇活了……》)。二手来源;其「意识上传 / 数字永生」表述系叙事夸大,已在 §1、§4.5 辨析。