2026 年 1 月 - 立委NLP频道

多模态大模型输入信号的离散化

量化/离散化并不是为了把 Transformer 的隐藏维度 d 变短；d 是模型容量的选择。它更像是把感知信号先压缩成更紧凑的 token 序列：要么减少 token 数 n，要么减少每个 token 的比特数，从而降低数据、缓存和生成难度；而进入 Transformer 后，仍统一用 d 维表示进行推理与融合。

d （任何token投影成同一个长度 d 的隐藏向量，这是真正的内部token表示，作为网络的处理对象）是大模型训练的一个超参数。并不与token离散还是连续直接相关，虽然连续token的design，会促使研究者倾向于选择更大的 d，好留下/捕捉更多的信息。

一个自然的问题是：如果最终都要投影到同一个固定的隐藏维度 d 里，那我把视觉表示做离散量化，岂不是“重复劳动”？

答案是：不重复。量化/离散化解决的主要不是“d 该多长”，而是另外三件更贵、更要命的事：序列长度 n、比特数/带宽、以及生成端的难度。做个比喻，d 只是“车道宽度”，量化更多是在“减少车流量、压缩货物体积、换一种更容易开车的路”。

量化/离散化并不是为了把 Transformer 的隐藏维度 d 变短；d 是模型容量的选择。它更像是把感知信号先压缩成更紧凑的 token 序列：要么减少 token 数 n，要么减少每个 token 的比特数，从而降低数据、缓存和生成难度；而进入 Transformer 后，仍统一用 d 维表示进行推理与融合。

一、d 固定不等于成本固定：真正的重头往往在 n 和注意力

在 Transformer 里，最敏感的是 token 数 n，因为注意力的开销大体跟 𝑛平方走。

例子：256×256、8×8 patch → 1024 tokens

这时再“固定 d=1024”，仍然要付出 1024×1024 规模的注意力矩阵成本。

而很多离散化方案（尤其是“先编码到更小的潜空间 latent，再离散”）真正干的是：
把 n 从 1024 砍到更小（比如 256、128、甚至更少），这是实打实的减法。

关键点：
离散化经常和“空间下采样/潜空间token化”绑定出现，它省的首要是 n，而不是 d。

二、量化/离散化的“省”，经常发生在 Transformer 之外：数据、缓存、I/O、显存

即便进模型后都变成 d 维向量，离散表示仍然有明显优势，因为它让“流动的东西”从浮点变成整数码int：

数据存储与训练管线：连续 latent 往往是 fp16/fp32 的大块张量；离散 code 是 int（再配合熵编码就更夸张了），数据集体积、读盘带宽、吞吐都会降很多。

中间结果缓存：比如多轮编辑、视频生成、多段推理，缓存离散码（index）比缓存高维连续特征更省得多。

跨模块传输：端侧/服务端/多机之间传中间表示时，离散码天然更省带宽（也更不容易“飘”或“糊”）。

这些开销在真实系统里非常“肉疼”，而且往往比你想象的更早成为瓶颈。

三、离散化还会改变“生成问题”的性质：从回归连续值变成选码本

生成模型最难的一步是什么？很多时候是：
在高维连续空间里生成“看起来像”的东西，既要细节又要稳定。

离散码本（VQ 这类）把生成变成：

先生成一串离散符号（选哪个 code），

再由解码器把符号还原成图像/音频。

这会带来两个常见收益：

学习目标更“像语言”：LLM的自回归/序列建模更顺手。

错误更可控：连续回归的小偏差会导致视觉上糊、飘；离散码的错误更像“选错词”，后处理或自回归本身的纠偏空间更大。

当然它也可能带来副作用（码本过小会导致“积木感/失真”），但这不是“重复劳动”，而是在换一种折中。

提炼一下，总结如下

很多读者第一次听到“把图像也离散成 token”，都会产生一个自然的疑问：既然最后进到 Transformer 里，所有 token 都要被投影成同样长度的隐藏向量 𝑑
（例如 1024），那把视觉表示做离散量化，岂不是重复做功？

关键在于：量化并不是为了把 𝑑 变短。𝑑 是模型容量的选择——就像“这台大脑有多宽的工作台”。量化真正改变的，是另外两件更昂贵的东西：一是序列有多长（token 数
𝑛），二是每个 token 以多少比特在系统里流动（存储与带宽）。

以 256×256 的图片为例，按 8×8 patch 切分就是 1024 个 token，长度已经是“千级”，注意力的开销会随 𝑛 平方放大；这时哪怕 𝑑 固定，计算也依然很重。很多“离散化”方案往往同时在做一件更实惠的事：先把图像编码到更低分辨率的潜空间，再在潜空间里离散化，从而把
𝑛 从 1024 压到更小的量级——这才是省算力的第一刀。

更重要的是，离散 token 在 Transformer 之外也能显著省钱：它让中间表示从高维连续张量（浮点表示）变成整数码（int表示），数据集更小、读写更快、缓存更轻，跨模块传输的带宽压力也更低。换句话说，离散化是在“运输与存储层面”先把货物压缩了；至于进入大模型之后是否用 𝑑 = 1024 来统一表示，那是“工作台宽度”的问题，两者并不矛盾。

所以，把视觉信号离散成 token 不是重复劳动，而是把成本从“又长又重的连续序列”转成“更紧凑、更易搬运的符号序列”，从而让多模态统一建模更接近语言模型那套LLM成熟的工程范式。

置顶:《立委关于大模型与AI的科学网博客汇总》

When Agents Become the Default Gateway, Will the Operating System Be Rewritten?

When Agents Become the Default Gateway, Does the App Store Model Collapse?

The Great Software Shake-Up of the Agent Era — Starting with OpenClaw

Some Basic Agentic AI terminology

OpenClaw as a case study of the coming Agentic AI era

Agent 时代的临界点：谈谈 OpenClaw 的安全隐患

Agent 时代的一些术语澄清

当 Agent 成为默认入口，App Store 模式是否崩塌？

当 Agent 成为默认入口，操作系统会不会被重写？

Agent 时代的软件产业大洗牌：从 OpenClaw谈起

2026年智能体范式大爆发：从认知幻象到工业化协同

腾讯科技春节访谈，Agent 这一年：沸沸扬扬之后

多模态大模型输入信号的离散化

The Removal of Autopilot: A Misjudgment of Trust, Pricing Power, and Timing

Autopilot 被剥离: 一次关于信任与定价权的误判

2026-1-28 10:33

自动驾驶已经解决了，但我们还没准备好告别驾驶

2026-1-28 10:06

How FSD Quietly Took Control of Pricing Power

2026-1-26 19:36

If Robotaxi Fails, This Is Where It Will Fail

2026-1-26 19:33

保险降价，是自动驾驶第一次“自证盈利模型”

2026-1-26 15:18

FSD 会拯救“最不被保险欢迎的人”

2026-1-26 15:13

如果 FSD 真的会失败，特斯拉最可能栽在哪里？

2026-1-26 05:59

Insurance Voted First Why FSD 13 / 14 / 15 May Reprice the E

2026-1-26 05:58

从 FSD 13 到 Unsupervised（F15）：自动驾驶如何穿透保险、监管与商业模式

2026-1-26 05:18

多少牛人陷入大模型的认知茧房？

2026-1-23 14:51

从open ai 主打的耳后AI耳机谈起

2026-1-23 14:47

耳机是你的贴身陪伴吗

2026-1-23 11:39

从 “Fake It” 到 “Vibe It”

2026-1-23 11:37

全双工到天花板的豆包

2026-1-3 22:40

FSD + Grok：超人老司机，带着“实习导游”上路

2026-1-3 11:02

梁文峰团队的 mHC 研究在做什么

2026-1-2 18:22

AI 编年史：公元 2025

2026-1-2 18:20

从“眼球 + SaaS”到“大模型商业”

2026-1-2 18:16

AI Reflections on 2025

多模态进化论：从“看图说话”到“原生直觉”

2025-12-18 12:49

正常的模型反哺不会导致模型坍塌

2025-12-18 12:45

2025 年 AI 感怀

2025-12-18 12:43

大模型训练的数据“炼金术”

热度 1 2025-12-16 01:06

再论大模型压缩的“有损”与“无损”

2025-11-24 14:30

大模型是无损压缩还是有损压缩，李飞飞与伊利亚谁是对的？

2025-11-24 11:47

GPT非监督学习到底怎么就学会了各种监督任务呢？

2025-11-10 15:27

自学习是思想革命，Transformer是工程火箭

2025-11-8 08:27

CNN与RNN——让机器学会看与听

2025-11-8 08:26

Backpropagation: The Key to Deep Neural Networks

2025-11-8 08:25

The Chain Rule: The Mathematical Guarantee Behind Backpropag

2025-11-8 08:24

2025-11-8 08:23

2025-11-8 08:22

2025-9-19 10:16

2025-9-19 10:13

尼克讲座第二弹：语言=思维=智能=计算=图灵机？

2025-9-19 10:10

Breakthroughs in Speech Technology in the Era of Large Model

2025-9-14 11:07

Neural Codec: Key Audio Techniques in the LLM Era

2025-9-14 11:06

大模型时代的语音技术突破：超写实和全双工

2025-9-13 01:37

说说神经 codec，大模型时代的音频技术要点

2025-9-12 17:25

跨模态连接器范式：谷歌模型Flamingo回顾

2025-9-3 09:39

图文对齐的关键一跃：CLIP 回顾

2025-9-3 09:37

注意力塌缩：关于“秩”的误会与真相

2025-8-30 12:03

BERT 双向 vs. GPT 单向与“低秩之虑”

2025-8-28 10:22

自监督学习的两大模型，为什么GPT跑赢了BERT成为王者？

2025-8-23 14:02

Is the World Material or Informational?

2025-8-19 11:33

AI 的威胁：不是恶意，而是作用链

2025-8-18 18:13

一个日常生活真实需求的 Deep Research 案例

2025-8-9 04:19

老友访谈：AI对工作市场的影响（审核未通过）

2025-8-4 12:43

从 Suno 看 AIGC 艺术民主化大潮

2025-8-3 02:03

狼来了，狼来了，“奇点”狼这次是真要来了吗？

2025-8-1 12:48

notebookLM赋能：隐藏推理，大模型推理模型的新动向

2025-7-31 10:33

思维等于语言吗??

2025-7-25 12:53

Is Thinking Equal to Language?

2025-7-25 12:52

GPT作为序列数据的无损压缩器

2025-7-8 14:04

与尼克等老友唠大模型压缩理论

2025-7-8 14:02

破除“无损压缩即智能”的迷思

2025-7-8 14:00

Demystifying the misconception of "Lossless Compression as I

2025-7-8 13:58

要区分GPT训练中的压缩，与拿GPT当压缩器工具

2025-7-7 03:21

信息论科普：GPT对给定序列无损压缩的最终区间

2025-7-7 03:19

信息论科普：香农极限（Shannon Limit）

2025-7-7 03:17

GPT无损压缩小问答（3）：算术编码

2025-7-7 03:16

GPT无损压缩小问答（2）：为什么说GPT是无损压缩？

2025-7-7 03:14

GPT无损压缩小问答（1）：高压缩率导致系统脆弱

2025-7-7 03:13

Yann LeCun 所鼓吹的「世界模型」与GPT+Diffusion有什么不同

2025-6-22 02:08

像素值是“连续变量”，还是工程上的伪装？

2025-6-22 02:01

从0实现并理解GPT

2025-6-4 00:43

大模型科普：探秘莎翁风格的诞生之旅（无代码版）

2025-6-3 15:32

LLM的后训练强化学习是怎么工作的

2025-6-2 10:26

从0实现并理解GPT （审核未通过）

2025-6-1 03:08

从零实现莎士比亚风 GPT科普解说（审核未通过）

2025-6-1 03:07

揭大模型科普：探秘莎翁风格的诞生之旅（无代码版）（审核未通过）

2025-6-1 03:05

解读EMPO全程无监督推理新范式

2025-5-27 14:08

Decoding the New EMPO Reasoning Paradigm

2025-5-27 14:07

MeanFlow: AI图像生成的降维打击

2025-5-22 19:15

Review of Autoregressive and Diffusion Models for Video Gene

2025-5-3 04:02

Unveiling the Two "Superpowers" Behind AI Video Creation

2025-5-2 12:49

非量化自回归视频生成模型NOVA的技术路线

2025-5-2 11:11

立委科普：揭秘AI创作视频的两种“神功”

2025-5-2 11:09

中文分词的前世今生

热度 2 2025-3-30 12:57

大模型如何解锁AI各种任务成为通用引擎的？

热度 2 2025-3-29 12:36

Grok：大模型为什么要超大数据？（4o配图）

2025-3-28 06:14

Grok: 大力出奇迹的背后

2025-3-28 06:10

《“蜜蜂巢”里的子弹：JFK档案解密后》

2025-3-27 06:37

Grok：超大数据的大模型为何能收敛？

热度 1 2025-3-27 06:34

Gemini Deep Research：用“Logits Lens”洞察神经网络的奥秘

2025-3-23 14:22

检索增强（RAG）与窗口数据的互补性 (图文版）

热度 1 2025-3-20 18:09

03 deep research： Challenges and Prospects of Advanced Reaso

2025-3-20 18:04

Sonnet3.7: 推理大模型的挑战与前景（图文版）

2025-3-20 17:57

数学圆舞曲：欧拉恒等式（配乐诗朗诵）

2025-3-20 03:27

人类 vs 恐龙：一场关于“不作不死”的滑稽短剧

热度 1 2025-3-18 12:17

deep research: 最新颈椎病手术指征与治疗概览

2025-3-18 12:12

关于颈椎病，大模型医疗建议靠谱吗？

热度 1 2025-3-18 12:05

给奶奶讲一下AI最新物种“大模型代理”

2025-3-14 15:34

Decoding LLM-native Agents: Bridging Compilation and Interpr

2025-3-13 02:42

The Agent Era: The Contemporary Evolution from Chatbots to D

2025-3-13 02:38

o3 deep research: 智能体的应用和演进

2025-3-10 18:21

万字长文解析 LLM-native Agent 及其混合计算方式

2025-3-10 07:13

楔Xiao Hong Red：肖弘其人

2025-3-10 07:05

Agent元年：从聊天机器人到数字员工的当代进化史

热度 1 2025-3-9 00:00

Agent：数字代理的崛起与未来

热度 1 2025-3-8 23:56

o3 deep research: LLM 驱动的 Agent 综述

热度 1 2025-3-8 23:49

【外一篇：推理范式演进中的概念】

生成式AI学习中容易混淆的几个术语

2025-3-5 17:06

再谈自然模态数据是高维空间的低维流形

2025-3-4 09:12

The Three-Stage Scaling Laws Large Language Models

2025-3-3 15:06

大模型三阶段的 scaling laws 接力赛

2025-3-3 10:59

Fundamental Limitations of Deep Learning: Origins in Data-Dr

2025-3-3 04:29

深度学习的局限性研究综述

热度 1 2025-3-3 02:31

o3 deep research: 深度学习局限性研究报告

热度 1 2025-3-3 02:26

左脚踩右脚可以飞吗，谈交替使用监督微调和强化学习的后训练

2025-2-28 05:22

o3 Deep Research: DeepSeek R1 多阶段训练流程问答解析

2025-2-28 04:27

RPA 赛道与大模型Co-pilots早期创业者的困局

2025-2-27 12:31

Linguists Should Find Self-Attention Intuitively Familiar

2025-2-25 02:14

语言学家应该很容易理解自注意力机制

热度 1 2025-2-24 17:49

符号主义被打入冷宫太久了，难道神经是AI的终结者吗？

2025-2-24 02:00

Has Symbolism Been Sidelined for Too Long?

2025-2-24 01:59

如何理解自注意力机制中的QKV分工？

2025-2-21 05:31

Transformer 和注意力机制简介

2025-2-21 05:25

DeepSeek: Learning to Think Slowly Without Human Supervision

2025-2-16 01:03

DeepSeek爆火真相：不靠“人盯”，让AI自己学会慢思考

热度 2 2025-2-15 11:01

Reasoning Paradigm (Query+CoT+Answer) Support scaling law?

2025-2-14 23:29

Understanding DeepSeek R1\'s Reasoning

2025-2-14 14:10

DeepSeek 笔记：R1 部署阶段的推理机制

2025-2-14 08:52

DeepSeek 笔记：推理新范式 query+cot+answer 支持新的 scaling law 吗？

2025-2-14 08:49

Hallucinations in AI: Bug or Feature? A Deep Dive into DeepS

2025-2-10 03:05

从R1幻觉谈起，大模型幻觉是缺陷还是创意火花？

2025-2-10 02:17

推理强化模型中思维链的本质

热度 2 2025-2-8 04:11

R1: 《立委列传》

2025-2-6 03:14

推理强化学习是端到端的监督，推理过程的非监督

热度 1 2025-2-1 14:00

RL: Supervised Outcomes, Unsupervised Processes

2025-2-1 13:58

DeepSeek R1：《少年DS之烦恼》

2025-1-31 03:04

告诉李雪琴一个激发写段子灵感的秘诀：找deepseek R1

2025-1-30 23:12

DeepSeek 风暴下看看它的论文

2025-1-27 23:58

DeepSeek\'s R1 Paper: A Storm in AI LLM Circle

2025-1-27 23:56

The Turbulent Second Chapter of Large Language Models

2024-9-9 05:31

大模型风云诡谲的下半场：scaling 失效？

2024-9-8 08:25

Professor Ma\'s long paper out

2024-9-6 00:35

马毅教授的演讲，值得一听

2024-9-5 22:09

NLP老司机的AIGC旅程

2024-9-4 22:40

解耦才能解套：再谈视频中的人物一致性问题

2024-9-2 18:27

马毅教授称，已经揭开完全揭开神经网络的面纱

2024-9-1 17:45

人形机器人大热，但看不到商业闭环

2024-9-1 07:14

推动AIGC商业落地，出门问问的「产模结合」实践

2024-8-31 07:17

2024-8-31 05:54

2024-8-28 08:15

2024-8-28 07:46

2024-8-28 07:13

2024-7-5 07:43

2024-7-1 14:33

2024-6-28 15:41

2024-6-26 19:28

Nick traching the AI history for LLM theoretical foundation

2024-6-26 17:07

2024-6-23 15:37

2024-6-20 09:26

2024-6-20 05:07

2024-6-17 00:53

2024-6-5 10:08

【唐诗300首 AIGC 配乐：白居易琵琶行】

2024-6-2 07:35

2024-5-20 18:11

2024-5-20 18:10

2024-5-20 18:07

2024-5-20 18:05

2024-4-5 19:14

Suno：《宋輝：人生笑话》-- 献给插队一代人（审核未通过）

2024-4-5 19:12

2023-8-18 19:41

热度 1 2023-8-17 18:26

2023-8-14 15:34

2023-8-11 17:34

2023-8-9 10:53

奇妙元体验AIGC奇妙：《岁月如歌：神秘园》

2023-7-11 05:54

《AI浪潮：辛顿的 AI 威胁论与马斯克如出一辙》

热度 1 2023-5-7 23:54

《AI潮流：跟Andrew学如何调用 ChatGPT 做自己的服务前台》

2023-5-5 08:45

《AI潮流：与 ChatGPT4 聊“买房送老公”背后的语言学》

2023-5-5 08:45

《AI潮流：开发者提示工程公开课中的二原则》

2023-5-5 08:44

【AI 浪潮：超级词匠 ChatGPT4 的百变文风】

2023-5-1 22:25

【AI 浪潮：自主性是人类智能的最后堡垒吗】

2023-4-30 18:47

【AI 浪潮：GPT-4 的上下文逻辑与常识还是不够稳固】

2023-4-30 18:46

【AI 浪潮：数据中心的大模型时代】

2023-4-30 18:44

快讯：腾讯科技AI未来指北系列今天直播间与鲁总唠一唠大模型（LLM）

2023-4-23 07:32

【劳碌命论LLM：大模型推理的细节编造是 feature，不是 bug】

2023-4-23 07:24

ChatGPT Tsunami and Its Impact on IT Landscape and Ecosystem

2023-3-8 08:27

AIGC“尖峰系列”丨李维博士：人类语言“通天塔”建成，ChatGPT的辉煌与挑战

2023-3-6 21:06

《AI浪潮：chatGPT 搞定了人类语言》

2023-2-13 01:11

The Removal of Autopilot: A Misjudgment of Trust, Pricing Power, and Timing

In recent weeks, Tesla quietly made a structural change to its driver-assistance lineup in North America: new vehicles no longer include the traditional “flagship” Autopilot function—lane centering combined with adaptive cruise control—as a standard feature. Instead, the full experience is now effectively gated behind the expensive FSD subscription.

On paper, this looks like a routine product and pricing adjustment. In reality, the intensity of the user backlash suggests something much deeper was touched.

This is not merely a feature debate. It is a question of trust, pricing boundaries, and the ethics of transition.

Autopilot Was Never “Just a Feature”

For many Tesla owners, Autopilot was not an optional convenience. It was the reason to buy a Tesla in the first place.

Long before Full Self-Driving became a grand vision, Autopilot delivered something tangible:

- Reliable lane keeping
- Competent adaptive following
- Daily, repeatable stress reduction in real driving

It represented Tesla’s earliest and most visible lead over competitors—not in theory, but in practice.

More importantly, Autopilot functioned as a trust generator. It was the psychological bridge that allowed drivers to gradually relinquish control to software.

Without that bridge, the promise of FSD would never have been credible.

Autopilot Was Never Truly “Free”

Much of the public debate rests on a flawed premise:
that Autopilot was a free feature Tesla is now taking away.

Historically, this is not accurate.

For long periods, Autopilot was bundled into the vehicle price by default, with no opt-out option. Customers paid for it implicitly, not optionally.

As a result, removing it from the baseline experience and re-introducing it through subscription feels, to many users, like a disguised price increase—not an upgrade path.

In consumer trust economics, disguised price increases are among the most damaging moves a company can make.

Timing Matters: You Cannot Remove the Base Before Delivering the Replacement

From an engineering perspective, Tesla’s desire to unify its driving stack under FSD is understandable. Maintaining parallel systems is costly and inefficient.

The problem is not the direction—it is the timing.

At this moment:

- FSD remains explicitly labeled as supervised
- Unsupervised autonomy has no public, binding timeline
- Legal responsibility still rests with the human driver

Under these conditions, Autopilot is not legacy baggage.
It is the stable base layer that allows users to tolerate experimentation above it.

Removing that base before a clearly superior, cost-effective, fully accepted alternative exists is perceived as withdrawing safety capital before depositing its replacement.

This is not a technical error.
It is a trust error.

Why Early Adopters Are Especially Angry—Even When Unaffected

One striking aspect of the backlash is that many critics already own FSD and are not personally impacted.

Their reaction is instructive.

Early adopters lived through:

- Autopilot’s formative advantage years
- FSD beta’s chaotic, error-prone experimentation
- Acting as data providers, testers, and tolerance buffers

They accepted risk because the foundation was solid.

The moment that foundation is removed, even symbolically, it signals something unsettling:

If this can be unbundled abruptly,  nothing that exists today is truly safe from re-monetization tomorrow.

That realization triggers defensive outrage—not entitlement.

Tesla’s Perspective Is Rational—But Incomplete

To be fair, Tesla is not acting blindly.

From a corporate standpoint:

- Driving capability is transitioning from a vehicle attribute to a continuously evolving service
- FSD’s endgame involves robotaxis and time monetization
- A free or semi-free Autopilot tier complicates long-term pricing power

Elon Musk has repeatedly stated that FSD pricing will rise as capability increases.

That logic is internally consistent.

But it omits a critical constraint:

You may price the future,
but you cannot pre-emptively withdraw today’s sense of safety
to finance tomorrow’s ambition.

This Is Not a Technology Debate—It Is a Pace Debate

At its core, the disagreement is not about whether autonomous driving will arrive.

Most informed users believe it will.

The disagreement is about how we move through the transition.

For many drivers, the ideal state is not permanent autonomy, but choice:

- Drive when you want
- Delegate when you don’t

Stable Autopilot combined with supervised FSD came closest to that balance.

It was not perfect—but it respected human agency.

Conclusion: The Market Will Respond

This decision will not destroy Tesla.
But it will likely produce measurable consequences:

- Slower adoption among new buyers
- Increased subscription skepticism
- A cooling of community goodwill

Those signals are not punishment. They are feedback.

Great companies are not defined by never making mistakes, but by whether they learn to recalibrate before trust erosion becomes structural.

Tesla still has time to do that.

But only if it recognizes that trust, once unbundled, is far harder to resubscribe.

Autopilot 被剥离: 一次关于信任与定价权的误判

最近，Tesla 在北美市场对其驾驶辅助功能体系进行的一次调整，引发了远超预期的用户反弹：新车不再标配传统意义上的 Autopilot（车道保持 + 自适应巡航），取而代之的是对 FSD 订阅的兜售。

表面上，这是一则“产品线与定价策略调整”的新闻；但从用户反应的烈度来看，这更像是一次对既有信任结构的碰撞。

一、为什么反弹如此强烈？

如果仅从功能角度看，Autopilot 的剥离似乎并不影响车辆的被动安全或基础主动安全指标（例如自动紧急刹车）。但问题恰恰在于：Autopilot 从来不只是一个功能。

对大量特斯拉车主而言，Autopilot 是：

- 决定是否购买特斯拉的关键理由
- 从“人控”走向“机控”的心理过渡层
- 对 FSD 未来愿景产生信任的现实锚点

尤其对早期用户来说，Autopilot 是一个已经被长期验证、每天可用、稳定可靠的系统。
正是这个“可依赖的现在”，支撑了用户对“尚未完成的未来”的耐心。

二、被忽略的事实：Autopilot 并非“免费赠品”

很多争论中存在一个模糊前提：

Autopilot 是不是“原本免费的，现在被拿走了”？

事实是：

Autopilot 并非纯粹免费，而是被隐含计价、打包进整车价格体系中的。

在相当长一段时间里，Autopilot 是默认配置，没有 opt-out 选项。用户并非“没付钱”，而是被动为其付费。

因此，当它被单独拆分、重新进入订阅或付费体系时，许多用户产生的并不是“功能缩水”的情绪，而是更直接的判断：

这是一次变相涨价，以及对于用户体验锚点的无视。

这恰恰是最容易伤害用户信任的商业行为之一。

三、在没有替代方案之前，剥离基座意味着什么？

从工程与产品逻辑上看，特斯拉推动技术栈统一、减少系统分裂，是可以理解的。
但问题在于时序。

在当前阶段：

- FSD 仍被官方明确标注为 supervised
- 无人监管（unsupervised）没有明确时间表
- 法律与责任主体仍然高度依赖人类司机

在这种情况下：

先移除已经成熟、被广泛信任的 Autopilot，而非先交付一个等价或更优的廉价替代体验，本质上是在透支既有信用。

这不是技术问题，而是产品伦理与信任边界的问题。

四、为什么早期用户的愤怒尤为尖锐？

一个耐人寻味的现象是：很多表达愤怒的声音，来自仍然拥有 FSD、甚至并未直接受影响的老用户。

原因并不复杂。

我们这些早期用户经历过：

- Autopilot 明显领先同行的阶段
- FSD beta 千疮百孔、问题频出的阶段
- 作为“技术极客”“小白鼠”，用耐心与数据参与系统演进的阶段

我们之所以愿意忍受早期的不成熟，有一个前提：

基座是稳的，业内领先的。现在几乎所有厂家所有车型，都开始提供某种程度的车道保持与跟车的辅助驾驶，但感觉还是特斯拉的 auto-pilot 最靠谱。

当这个基座被拆解，哪怕自己暂时不受影响，也会本能地意识到：

如果这种做法成立，那么未来任何“既得体验”，都可能被重新定价。

这不是情绪化的抵触，而是对规则被单方面改写的警觉。

五、特斯拉并非“没算清楚账”

必须承认，特斯拉并非不知道风险。

从公司视角看：

- 自动驾驶能力正在从“车辆属性”转向“持续演进的软件服务”
- FSD 的终局是 Robotaxi 与时间货币化
- Autopilot 作为“免费层”，长期支持可能成为技术与定价的阻碍

尤其是在Elon Musk 多次强调 FSD 未来将随着能力提升而涨价的背景下，将驾驶能力整体纳入订阅体系，在商业逻辑上并非不可理解。

但问题在于一句话：

你可以为未来定价，但不能在未来尚未交付之前，就先抽走用户今天的安全感，剥夺用户的选择权。

六、结语：市场终会给出反馈

我并不认为这次调整会“毁掉特斯拉”。但我相信，它会带来一段必要的市场反馈期：

- 新用户的犹豫
- 社区情绪的降温
- 对订阅价值更苛刻的审视

如果特斯拉足够伟大，它终将学会在速度之外，重新尊重节奏。

自动驾驶已经解决了，但我们还没准备好告别驾驶

Full self-driving is a reality, a solved problem — at least for the driver who still wants to drive.

多年来，关于自动驾驶何时能解决，一直存在争论。马斯克最近声称 FSD 是个已经解决的问题。对此，我是基本同意的。

如果一定要给出一个具体的答案，我的结论并不激进，却可能让很多人不舒服：

对个人驾驶体验而言，FSD 已经在事实上完成了。

至少，在 supervised FSD 这一形态下，它已经达到了个体体验意义上的“天花板”。

一、技术标签与真实体验的脱节

从官方定义看，当前的 FSD 仍然被严格标注为 supervised，属于所谓 L2级别。
这意味着：
法律上，司机必须随时准备接管；
责任上，人类仍是最终驾驶主体。

但从真实使用经验出发，这个标签与体验之间已经出现了明显脱节。

在连续数月的日常驾驶与多角度测试中，我实际上不再需要接管车辆（特殊情形不算，例如对它选择的停车位不满，接管停在其他位置）。并不是因为系统“完美无缺”，而是因为它已经稳定到足以让我进入一种持续的 relax 状态——
不再紧张地盯着前方路况，不再把注意力持续锁定在驾驶动作本身。

这不是演示视频，也不是短时测试，而是长期、重复、可复现的日常状态。

二、“完美”并非无瑕，而是边际收益枯竭

当我说 supervised FSD 在体验层面已经“完美”，并不是指它已经白璧无瑕、永不犯错。

我指的是另一件事：

从 99.9% 到 99.99%，甚至 99.999%，对个体驾驶者而言，体验收益已经趋近于零。

对绝大多数个人用户来说，我们的驾驶场景具有天然的限制：

- 活动半径有限（多围绕家庭与固定区域）
- 驾驶时间有限（一天几小时已经非常多）
- 路况分布高度重复

在这样的条件下，“长尾事故率”的持续下降，已经很难被感知。它仍然重要，但不再是体验意义上的跃迁。

三、为什么特斯拉仍然必须继续“卷那几个 9”

这里必须明确区分两个视角：

个体用户的视角
与
系统级部署者的视角

对特斯拉而言，FSD 的目标不是“让某个或某批用户放松”，而是要在 全球范围、数百万乃至上千万辆车 上长期稳定运行。

在这种规模下，任何微小概率事件都会发生，并迅速演化为监管、舆论与公共安全事件。

因此，对特斯拉来说：

- 99.9% 远远不够
- 99.99% 仍然危险

为了最后那几个 9，即便需要成倍提升算力、传感与系统冗余，也在所不惜。这不是偏执，而是规模化系统的宿命。

四、真正的质变，不在“更好”，而在“不再被允许接管”

下一次真正的质变，来自 unsupervised FSD的普及。

那将是一个完全不同的阶段：

- 人类不再被允许接管
- 人类不再是驾驶主体
- 车辆从“辅助系统”变为“自主系统”

这不是体验升级，而是权力结构的切换。但必须诚实地说：这未必是所有驾驶者最向往的状态。

对我与不少人而言，理想的状态并不是“我永远不能碰方向盘”，而是：

想开就开，不想开就交给系统。

在这个意义上，supervised FSD 反而是一种极其珍贵、且注定短暂的理想的平衡态。

五、时间被正式货币化的那一天

从商业角度看，FSD 订阅价格真正大幅上行的锚点，并不在于技术“又好了多少”，而在于 unsupervised FSD 获得监管批准、合法上路的那一刻。

因为在那一刻：

- 时间被正式货币化
- 注意力被正式定价
- 风险被正式从个人转移给系统

当你上车就可以睡觉、工作、娱乐，当车辆成为你的移动客厅或办公室，你节省下来的时间、精力，甚至生命风险，都会被清晰地标上价格。

那时，订阅费不再是“软件费用”，而是 时间与安全的分成机制。

六、一个反直觉的结论

当无人驾驶成为社会默认的出行方式，人类驾驶反而会变成一种昂贵的奢侈品。就像今天骑马一样：不是因为它更高效，而是因为它更“酷”、更稀罕、更昂贵、更有怀旧的奢侈感。

但在那个时代真正到来之前——或许还需要 5 到 10 年的制度过渡期——我们正身处 supervised FSD 的黄金时代：

法律仍然默认是人类驾驶；系统已经足够成熟（越俎代庖为常态）；而个人驾驶权，尚未被剥夺。

这是我从 FSD beta 到 supervised FSD，五年多使用与观察的真实心路历程。

而现在，正是体验意义上的自动驾驶的天花板时刻。尽情享受吧，在我们不得不交出方向盘之前。

一旦真正进入无人驾驶时代，robotaxi 随叫随到，而且会像公共交通一样便宜；那时，几乎没有任何经济理性，再去供养一辆价值数万美元、利用率不到10%、占据生活成本的大头（仅次于房贷）、只为“自己开”的私家车。

How FSD Quietly Took Control of Pricing Power

The First People Autonomous Driving Saves

For years, the commercialization debate around autonomous driving has been framed as a consumer question:

Are people willing to pay for self-driving?

That question is already outdated.

What is actually happening is more structural and far more consequential:
pricing power is migrating—away from human preference and toward system-level risk reduction.

Insurance pricing is the first place where this shift becomes visible.

Insurance Is Not a Subsidy. It Is a Proof Mechanism.

In much of the U.S., monthly auto insurance premiums hover around $200–$250.
When the use of Tesla’s Full Self-Driving (FSD) demonstrably lowers accident rates, insurers begin to respond—not rhetorically, but financially.

A 40–50% premium reduction translates into $100–$125 per month in savings.
That alone is enough to offset the current $99/month FSD subscription fee.

At that point, FSD stops being an “extra expense.”
It becomes a risk arbitrage instrument: users exchange control for lower expected loss.

This is not marketing.
It is actuarial gravity.

The Hidden Feedback Loop: Safety → Insurance → Adoption → Pricing Power

Once this mechanism scales, it creates a powerful positive feedback loop:

1. FSD adoption reduces accident rates
2. Reduced accident rates trigger insurance discounts
3. Insurance savings neutralize the perceived cost of FSD
4. Adoption accelerates
5. Data improves → system safety improves further

At scale, subscription pricing becomes adjustable upward—not because users are enthusiastic, but because the alternative is objectively more expensive and riskier.

That is how pricing power changes hands.

Why Traditional Insurance Starts to Break

Classical auto insurance is built on one premise:
risk is priced based on the human driver.

Once system-driven safety enters the equation, this model destabilizes.

Low-risk drivers using FSD exit the traditional insurance pool first.
What remains is a concentration of higher-risk drivers—older, distracted, accident-prone, or living in high-incident regions.

Insurers then face a binary choice:

- Raise premiums → lose even more low-risk customers
- Don’t raise premiums → absorb unsustainable losses

This is textbook adverse selection, and it has no graceful exit.

Legacy insurers like GEICO are not failing operationally; they are being structurally disintermediated.

The Truth: FSD Benefits “Bad Drivers” Most

There is a persistent misconception that autonomous driving primarily benefits skilled, attentive, tech-forward users.

Risk economics says otherwise.

From a system perspective:

- Improving a good driver yields marginal gains
- Constraining a bad driver yields massive variance reduction

FSD does not care who you are.
It only cares how much control it has.

Once control is transferred, individual differences collapse toward a shared safety baseline.

This leads to a conclusion:

The people autonomous driving truly saves most are those the insurance market no longer wants.

Not out of compassion—but efficiency.

Technology compresses variance.
It always works where variance is highest.

From Product to Infrastructure

If FSD adoption were limited to elite users, it would remain a premium feature.
But once it begins absorbing high-risk drivers and visibly lowering aggregate accident rates, its role changes.

It becomes infrastructure.

At that point:

- Not using FSD becomes the higher-risk choice
- Manual driving begins to resemble a premium liability activity
- Human control starts to look like an opt-out, not the default

Insurance pricing is simply the first societal signal of this inversion.

Tesla and Insurers Are Quietly Aligned

Companies like Lemonade are aligning with a future in which:

- Risk is priced at the system level
- Safety is statistically provable
- Liability migrates away from individuals and toward platforms

In that future, insurers don’t fight autonomy—they follow it, because that is where solvency lives.

Final Thought

When insurance premiums fall, the question is no longer whether people want autonomous driving.

The real question becomes:

At what point does human driving become the unaffordable option?

That is how pricing power changes—not by persuasion, but by math.

If Robotaxi Fails, This Is Where It Will Fail

Robotaxi is often framed as a technical moonshot.
That framing is wrong.

The technology is not the primary risk.

If Robotaxi fails, it will fail for non-technical, system-level reasons.

1. Not Safety—But Perceived Safety

Statistical safety is not the same as social acceptance.

A system can be 10× safer than humans and still fail if:

- Incidents are rare but spectacular
- Media amplification is asymmetric
- Human-caused accidents are normalized, machine-caused ones are not

Robotaxi must overcome salience bias, not just engineering benchmarks.

Insurance backing helps—but perception lags data.

2. Regulatory Latency, Not Regulatory Hostility

Most regulators are not anti-autonomy.
They are anti-liability ambiguity.

Robotaxi fails if:

- Responsibility is unclear across software, fleet operator, and manufacturer
- Incident attribution cannot be cleanly resolved
- Legal frameworks lag operational reality

Progress stalls not at approval, but at scalable approval.

3. Operations, Not Algorithms

The hardest part of Robotaxi is not driving.

It is:

- Fleet maintenance
- Edge-case recovery
- Cleaning, vandalism, misuse
- Geographic scaling without human fallback

Algorithms scale geometrically.
Operations scale linearly—and break under friction.

This is where many promising systems historically collapse.

4. Unit Economics Under Real Load

Robotaxi looks extraordinary in slide decks.

It becomes fragile when:

- Utilization is uneven
- Urban density is lower than modeled
- Insurance, maintenance, and downtime are fully accounted for

If margins depend on perfect conditions, the model will not survive contact with reality.

5. Public Trust Is Path-Dependent

One early, mishandled failure can poison years of progress.

Robotaxi does not get unlimited retries.
Trust, once lost, is slow to rebuild.

This makes early-stage discipline more important than speed.

The Bottom Line

Robotaxi will not fail because autonomy “doesn’t work.”

It will fail if:

- Society cannot agree on liability
- Regulators cannot scale approval
- Operators underestimate real-world friction
- Or trust collapses faster than it can be rebuilt

Technology is necessary—but insufficient.

FSD 会拯救“最不被保险欢迎的人”

关于自动驾驶，有一种普遍但隐蔽的误解：

FSD 是给好司机、理性人、技术精英准备的高阶工具。

这个判断，在风险经济学和保险逻辑面前，不再成立。真实世界发生的，可能恰恰相反。

1. 传统保险失败的，不是“价格”，而是“分层能力”

传统汽车保险的核心能力只有一个：根据“人”的历史行为，对风险进行分层定价。一旦 FSD 开始规模化，这套逻辑会迅速失效：

- 低事故率人群 + FSD → 风险被系统性压缩 → 保费显著下降
- 这些优质用户，会最先离开传统保险池

留下来的是什么？

- 事故率更高
- 行为更不可控

此时，保险公司并不是“经营不善”，而是进入了一个不可逆的反向选择死亡螺旋：

- 提价 → 赶走中间层
- 不提价 → 直接亏损

2. 被传统保险抛弃的人，恰恰最需要 FSD

当传统保险体系开始“挑人”，被挤出去的，并不会是那些自律、谨慎、驾驶能力强的人。被决绝投保的，往往是：

- 年龄偏大、反应慢
- 注意力易分散
- 历史驾驶记录差
- 居住在事故高发区域

在“以人定价”的体系里，他们是不可承保的风险，拖累保险，压缩保险的盈利空间。但在“以系统定价”的体系里，他们反而是改造空间最大的对象。因为 FSD 的逻辑完全不同：

FSD 不关心你是谁，只关心它接管了多少控制权。

一旦控制权被让渡，个人差异会被强行压缩到同一条技术曲线上。这就是那个很多人没看清、但极其重要的事实：

技术面前人人平等，技术红利不挑拣对象。

3. 无人承接，并不等于无人可救

当传统保险拒保或天价定价时，社会并不能“蒸发”这些人。他们依然要出行、要工作、要生活。这时，唯一还能系统性降低他们风险的方式，只剩下一个：

让人退居后台，让FSD上前台。

从系统视角看：

- 把“好司机”变得更安全 → 边际收益有限
- 把“差司机”拉回平均水平 → 边际收益巨大

这意味着一个非常反直觉的演化路径：

FSD 的规模化，并不一定来自技术信仰者，而更可能来自被传统体系放弃的人。

不是选择，而是被迫。

4. 这正是 FSD 会“全民化”的原因

如果 FSD 只在高质量用户中渗透，它永远只是一个高端选配。但一旦它开始：

- 吸纳高风险人群
- 显著降低他们的事故率
- 在统计意义上“抹平人群差异”

它就越来越转化为基础设施。到那时，社会认知会发生反转：

- 不使用 FSD，才是高风险行为
- 人类驾驶，会逐步变成一种需要额外付费、额外审查的“奢侈自由”
- 类似吸烟、极限运动那样，被单独定价、单独监管

5. 一个不太政治正确，但几乎不可避免的结论

如果把这条逻辑推到终点，会得到一个令人不安、但极其现实的判断：

自动驾驶，并不是只解放最好的人，而是先拯救最容易出事的人。

6. 这会加速FSD 普及

“低质用户多了，会不会拖慢 FSD 的社会接受？”

恰恰相反。真实路径更像这样：

1. 传统保险提价或拒保
2. 高风险用户被挤出
3. 唯一可行的降风险手段是技术接管
4. FSD 成为“被迫选择”
5. 事故率显著下降
6. 安全性数据更具说服力
7. 公众与监管态度开始松动

这是一个由成本和风险驱动的强制加速过程。

FSD 的真正护城河，不是好司机的喜爱，而是坏司机的无路可退。

保险降价，是自动驾驶第一次“自证盈利模型”

围绕自动驾驶的讨论，长期存在一个误区：

“FSD 到底值不值得用户掏钱？”

这个问题，在今天已经不重要了。

真正在发生的，是一个更底层、更冷酷、也更不可逆的变化——定价权正在从‘用户意愿’迁移到‘系统安全性’。

而保险费率，正是这场迁移中第一个被撬动的支点。

一、当保险节省，足以覆盖订阅费：商业逻辑已经闭环

我们先把账算清楚。

在美国市场，很多特斯拉车主的第三方保险费用，大约在 250 美元/月。因为 FSD 的使用，Lemonade 把保险费率下调 50%，那么车主每月可以节省 125 美元。而当前 FSD 的订阅价格是 99 美元/月。也就是说，对大量车主而言：

FSD 并不是一项新增支出，而是一项“用更低风险换取现金流”的工具。

甚至在账面上，你是免费用了最好的自动驾驶软件，还由此带来一些紧进帐。这不是营销补贴，而是风险被系统吸收后，自然释放出来的。

二、这会极大加速 FSD 的渗透率

一旦这种模型被用户、保险公司和市场同时验证，它会产生极强的自我加速效应：

使用 FSD → 事故率下降 → 保险费下降 → FSD 实际免费或“变便宜” → 更多人使用 → 数据规模扩大 → 系统更安全

这是一个典型的正反馈飞轮。

在这种情况下，FSD 的渗透率从目前约 20% 提升到 50%–75%，并不需要很久。而当渗透率上来之后，FSD 月费的上调，反而会变得“顺理成章”——因为它不再是“额外花钱”，而是你已经被验证能省钱、还能更安全的默认选项。

三、传统汽车保险，将不可避免地被“反向选择”击穿

这套模型一旦规模化，对传统汽车保险行业的冲击会非常直接。

低事故率、风险更低的优质客户，会率先流失。留下来的，是事故率更高、赔付压力更大的群体。保险公司为了覆盖风险，只能选择：

- 提高保费
- 提高免赔额
- 或降低服务质量

这会进一步加速优质与中等客户的出逃，形成一个典型的 adverse selection（反向选择）死亡螺旋。对那些高度依赖传统车险业务的老牌公司而言，这不是竞争，而是新时代的结构性挑战。

四、这一切，只是 Robotaxi 之前的“热身”

需要强调的是：FSD + 保险降价，本身不是终局。它只是为一个 万亿级市场 做铺垫：Robotaxi。

Robotaxi 面临的两个最大阻力是：

1. 公众的恐惧与不信任
2. 监管的不认可与不放行

但这两个问题，最终都归结为同一个核心：

是否足够安全，以及是否被社会相信足够安全。

保险费率的下降，恰恰是这个问题最现实、最有说服力的市场回应之一。它不是宣传，不是愿景，而是第三方机构用自己的资产负债表给出的判断。

五、特斯拉和 Lemonade 在“同一条船上”

Lemonade 这样的保险公司，真正押注的，是一个长期趋势：

- 自动驾驶会持续降低事故率
- 风险定价方式会从“人”转向“系统”
- 保险将从被动赔付，转向主动选择更安全的技术路径

这条路如果走通，特斯拉、自动驾驶保险、Robotaxi 平台，都会站在同一侧。

这不是短期博弈，而是一条高度一致的长期战略路径。

结语

当保险开始降价，讨论“要不要为自动驾驶付费”，已经晚了一步。

真正的问题是：

当系统已经被证明更安全、更便宜、更可预测，人类驾驶是否还配得上‘默认选项’这个位置？

FSD 保险降价，只是第一声响铃。后面的变化，会比大多数人想象得更快，也更彻底。

如果 FSD 真的会失败，特斯拉最可能栽在哪里？

在自动驾驶的讨论中，最没价值的反对意见，通常是情绪性的：“我不敢坐”“我看过事故视频”“机器永远不可能像人一样”。

真正值得认真对待的反对意见，只有少数几条，而且每一条都指向系统性风险。

一、最大风险依然是“长尾世界”

即便在 FSD 13/14 阶段，系统已经能覆盖绝大多数日常驾驶分布，但真实世界的难点永远在0.9后的多少个9的长尾场景：

- 极端天气
- 非标准施工路况
- 人类博弈行为（挑衅、误导、违规）
- 区域性交通文化差异

如果这些长尾场景无法被足够快地吸收进训练与部署闭环，那么系统安全性会出现“平台期”，而不是持续拉开差距。

二、Unsupervised 的真正难点，是责任结构而非技术

技术跑通，并不等于社会结构准备好了。

无人监督意味着：

- 事故责任从“人”转移到“系统 / 公司”
- 保险对象从“个人”转移到“平台”
- 法律纠纷从个体事故，升级为系统性风险

如果责任认定、赔付机制、跨州/跨国的法规长期无法趋同，那么 Unsupervised 可能在技术上成立，在制度上被“限速”。

三、工程化与规模化，也是最容易被低估的风险

实验室里表现优秀的系统，和百万级车辆、全天候运行、地点无差别部署，完全不是一个量级的问题。

真正的挑战包括：

- 软件快速迭代与稳定性的张力
- 回滚机制与事故复盘的工业化能力
- 成本曲线是否能支撑大规模普及
- 算力、硬件、供应链是否同步进化

如果工程化能力跟不上，技术优势可能被“消耗”在运维复杂度中。

四、商业模型的反噬风险

订阅与 Robotaxi 的前提是：用户始终相信系统在“持续变得更安全”。

一旦出现长期停滞，哪怕不是倒退：

- 订阅提价会遭遇强烈反弹
- 保险费率可能停止下调甚至回升
- 市场预期可能快速反转

自动驾驶的商业模型，本质上是对未来安全提升的提前定价。如果未来无法兑现，估值会被修正。

结语｜真正的分歧，不在“能不能”，而在“能否持续进步”

所以，自动驾驶真正的分水岭从来不是某一次事故，也不是某一次发布。

而是一个更冷静的问题：

它是否还能在未来 5–10 年里，持续、稳定地拉开与人类驾驶的安全差距？

如果答案是肯定的，那么保险、监管、商业模式都会（被迫）跟上。如果答案是否定的，那么所有故事都会在某个阶段自然淡化，甚至熄火。

Insurance Voted First Why FSD 13 / 14 / 15 May Reprice the Entire Mobility Industry

The most important signal in autonomous driving is not a product launch, a demo video, or even user sentiment.

It is insurance pricing.

When a third-party insurer lowers premiums for vehicles running Full Self-Driving (FSD), it is not making a philosophical statement. It is making a probabilistic bet—with capital at risk—that the accident distribution has structurally changed.

Insurance does not argue.
Insurance does not speculate.
Insurance pays—or bleeds.

And that is why recent premium reductions tied to FSD usage matter far more than most headlines suggest.

This essay argues that what we are witnessing is not a feature upgrade, but a multi-layer phase transition—one that simultaneously cuts across technology, insurance, regulation, and business models.

At the center of this transition are three distinct milestones: FSD 13, 14, and the forthcoming 15.

1. Why Insurance Is the Most Credible Third-Party Signal

Manufacturers can claim safety improvements.
Users can report subjective experiences.
Regulators can hesitate.

Insurance companies cannot afford any of that.

A third-party insurer lowering premiums is effectively saying:

“Based on real-world data, we believe the expected loss curve has shifted—and will continue to shift—in a statistically meaningful way.”

This is qualitatively different from manufacturer-subsidized discounts.
It reflects external actuarial confidence, not internal marketing intent.

In complex socio-technical systems, insurance pricing is often the earliest monetized acknowledgment of risk reduction—long before regulation or public consensus catches up.

That is why insurance frequently moves first.

2. Regulation Is Not First-Principles. Mortality Is.

Autonomous driving debates often stall on “regulatory conservatism.”
But this framing misses the first principle.

The ultimate regulatory objective is safety, and safety is measurable:

- Fatalities per million miles
- Severe injury rates
- Accident frequency distributions

If a system persistently outperforms human drivers on these metrics, regulatory hesitation becomes increasingly difficult to justify—because delay itself begins to carry a measurable human life cost.

Insurance companies, driven purely by loss statistics, respond faster than regulators precisely because they are already optimized around these metrics.

The pattern is predictable:

Insurance reprices risk → adoption increases → data quality improves → social acceptance rises → regulatory pressure mounts → regulatory frameworks adapt

3. FSD 13 / 14 / 15: Not Just Version Numbers

Many observers still frame FSD commercialization as a simple question:
“Are users willing to pay for autonomous driving?”

That question is already outdated.

What is actually happening is far more consequential:
pricing power is quietly migrating.

FSD 13: Establishing the Feasibility of Superior Safety

Before the breakthrough in data-driven, system-level end-to-end training, progress in FSD was fundamentally sawtooth-shaped. Performance regressions were not uncommon, and unresolved issues—such as phantom braking that resisted targeted engineering fixes—undermined user confidence.

As a result, users often disengaged preemptively in moderately complex scenarios, not because the system had failed, but because confidence was fragile. This led to a second-order effect with broader implications: FSD-on safety data lacked credibility in the public eye, because frequent human takeovers made apples-to-apples comparison with human driving inherently difficult or twisted.

FSD 13 marked a decisive technical inflection.

With end-to-end training finally working at the system level, the data flywheel became real. Users broadly experienced a step change in stability and safety. Disengagement rates dropped sharply, and—critically—the resulting safety data became persuasive rather than debatable.

The significance of FSD 13 is this:

It completed the feasibility validation of FSD as a system capable of exceeding human driving safety. Autonomous driving began to behave as a coherent, continuously improving system, benchmarked explicitly against human-level safety—and supported by objective, credible, apples-to-apples data.

At this point, the question shifted from “Does this work?” to “How fast can it compound?”

FSD 14 (Ongoing): Insurance Begins to Recognize the Shift

Roughly a year after FSD 13, FSD 14 achieved full Point-to-Point autonomy—the final mile of actually-"full" driving automation—and reached a safety level approximately seven times better than human driving. A critical transition followed.

For the first time, autonomous driving began to systematically reduce accident rates across real-world, large-scale driving distributions, outperforming human drivers by a clear statistical margin.

This directly triggered a cascade of downstream effects:

Insurance premiums began to decline materially
“Money saved” was more readily reallocated—psychologically—to FSD subscriptions
Subscriptions ceased to feel like discretionary add-ons and instead became the natural price of risk absorbed by the system

This is precisely the point at which insurance and subscriptions entered a positive feedback loop.

Risk reduction started being monetized.

FSD 15 (Unsupervised): From Subscription to Platform Economics to Robotaxi

Once FSD enters the unsupervised stage (sooner than most expected), a true phase transition occurs.

At this point, FSD is no longer merely an advanced driver-assistance system for individual users. It becomes:

- Callable by third parties
- Deployable at fleet scale
- Capable of participating directly in revenue sharing
- Legally upgraded from an L2 label designation to L4

The business model undergoes three simultaneous shifts:

1. Subscription pricing gains upward flexibility, as safety advantages continue to widen
2. Vehicle margins can be compressed or even sacrificed, with hardware reduced to an access point
3. Robotaxi becomes a cash-flow multiplier, combining platform take rates with scale

At that stage, Tesla no longer needs to rely primarily on vehicle manufacturing and sales margins. Instead, it can become a compounding cash engine driven by:

- Near-zero-marginal-cost software subscriptions from end users
- Near-zero-marginal-cost ecosystem licensing and system calls from other automakers
- Its own vertically integrated robotaxi operations

The first two are classic high-margin digital businesses. The third—if production and deployment can scale fast enough—has the potential to price mobility close to public transit while offering on-demand convenience.

If that happens, the mobility market expands dramatically. Private car ownership faces existential pressure, and human driving increasingly resembles a high-risk, high-cost activity rather than a default mode of transport.

In that world, autonomous driving does not merely disrupt transportation.
It reorients the trajectory of modern society itself.

4. Insurance, Subscriptions, and the Feedback Loop

Insurance repricing is not the endpoint. It is the gateway.

As accident risk is absorbed by the system:

- Insurance premiums fall
- Psychological resistance to software subscriptions weakens
- “Savings” are reallocated toward autonomy features

This creates a powerful feedback loop:

Safer systems → lower insurance → higher subscription acceptance → more data → safer systems

At later stages, this loop extends into fleet operations and Robotaxi platforms, where:

- Insurance is pooled
- Marginal safety improvements directly expand margins
- Hardware margins become secondary to software and platform economics

This is how automobiles begin to resemble smartphones: hardware as distribution, software as compounding leverage.

5. The Industry Repricing: From Manufacturing to Risk Operations

Once autonomy scales, automotive competition shifts away from traditional axes:

Old competition

- Powertrains
- Styling
- Brand differentiation

New competition

- Data flywheel efficiency
- Deployment and rollback discipline
- Accident analysis pipelines
- Regulatory negotiation competence
- Long-term operational stability

The central risk is no longer technological capability alone, but engineering maturity at scale.

6. The Single Point of Failure

All of this rests on one assumption:

Autonomous safety continues to improve—consistently, measurably, and durably.

If progress stalls:

- Insurance repricing halts or reverses
- Regulatory momentum slows
- Subscription economics weaken
- Platform valuations compress

Autonomy is, fundamentally, a forward-priced safety claim.

If the future does not deliver, the market will reprice swiftly.

Conclusion: The Most Dangerous Driver Is Still Human

The societal value of autonomous driving is not convenience or novelty.

It is predictability.

Human drivers are not dangerous primarily because they lack skill—but because fatigue, emotion, distraction, and overconfidence cannot be systemically eliminated.

If autonomous systems continue to pull ahead statistically, the moral framing will eventually invert.

The question will no longer be whether machines are safe enough.

It will be why we continue to tolerate humans at the wheel.

Insurance lowering premiums is merely the first bell.

It signals that, quietly and without ceremony, the risk curve has already begun to move.

从 FSD 13 到 Unsupervised（F15）：自动驾驶如何穿透保险、监管与商业模式

保险降价只是序章

最近，一则并不算“热搜”的新闻，在业内却分量极重：第三方保险公司开始为开启 FSD 的特斯拉车主大幅下调保险费率。

很多人第一反应是：“这不就是省点钱吗？” 但如果你对保险、监管和技术商业化稍有经验，就会意识到——这是一类极少被误判的信号。

因为保险不是口号，不是发布会，不是股评；保险是用真金白银，在对未来事故分布下注。而当保险开始下注，意味着一条更长的链条，已经在暗中转动。

一、为什么“第三方保险降价”比任何宣传都重要？

过去，Tesla 自家的保险，对 FSD 给过一定比例的折扣（约 10% 量级）。但这类“自家让利”，说服力始终有限：你是不是为了推 FSD 才打折？

第三方保险公司不同。它们的行为逻辑极其简单，也极其现实：

如果我判断你这类用户的事故期望值在下降，我就敢降价抢你；如果我判断错了，我会真赔钱。

换句话说：保险费率，是“安全性”最现实、也最难作假的货币化表达。

二、监管的第一性是“可避免的死亡”

很多人习惯把自动驾驶的推进缓慢，归咎于“监管保守或过度”。但我们需要看清监管的底层逻辑：

监管的最终目标是安全，而安全是可以被统计的。

事故率、致死率、恶性事故频次，这些指标并不抽象。如果一种技术在统计意义上，持续、稳定、可复现地降低这些指标，那么监管的“谨慎”就会逐渐从“原则”变成“压力”。

这也是为什么保险往往走在监管前面：

- 保险对统计极度敏感
- 保险对趋势反应更快
- 保险不需要政治共识，只需要精算正确

将形成一条非常现实的路径：

保险先降价 → 用户规模扩大 → 数据更充分 → 社会接受度提高 → 监管压力增大 → 监管逐步放开

这不是理想主义，而是过去几十年风险产业反复验证过的路径。

三、从“体验好不好”到“规模化验证”

围绕 FSD 的争论，过去几年高度情绪化。原因很简单：技术阶段不同，却被混在一起讨论。

如果用“产业语言”来重新划分阶段，大致可以是：

系统级跃迁完成
从规则拼接，走向端到端数据训练（ FSD13 阶段）。
进入可规模化验证期
不再是少数爱好者体验，而是可以在大规模用户中，观察稳定统计分布（FSD14 的 point-to-point 全程自动化的人人可验证阶段）。

迈向 Unsupervised（无人监督）：真正的分水岭不在“能不能跑”，而在于：

安全性是否能在 apples-to-apples 的合理比较下，拉开与人类司机的数量级差距。

如果进入无人监督阶段，安全性一旦达到人类司机的 10 倍起步，并向 15–20 倍推进，整个行业的叙事都会重写。

四、FSD 13/14/15 如何一步步改变定价权

很多人以为，FSD 的商业化问题是：“用户愿不愿意为自动驾驶付钱？”

这个问题其实已经落后了。真正在发生的，是定价权在悄然迁移。

FSD 13：完成了自动驾驶的可行性验证

在数据驱动的系统级端到端训练技术突破之前，FSD的进步是锯齿性的，性能退化regressions并不罕见，最大的困扰是鬼影刹车等难以定点攻坚的困扰。这就使得用户难以建立对FSD的整体信心，在稍微复杂的论断，常常由于缺乏信心而接管。这带来进一步的后果：FSD-on 的安全数据不被大众信任，因为人类接管本身让 apples to apples 比较成为挑战。FSD 13 的技术突破是端到端的训练，使得数据飞轮真正建立，所有用户都感受到了这次技术突破带来的稳定性和安全性。用户接管直线下降，这带来了安全数据的说服力。

FSD 13 的意义在于：

它完成了FSD作为高于人类驾驶安全性的可行性验证，让自动驾驶表现为一个以人类驾驶安全性为基线的持续改进、行为一致的系统。这一切都有客观可信、apples to apples 的安全数据作为支撑。

FSD 14（正在进行时）：保险开始认可

FSD13后一年左右，FSD完成了最后一公里的Point-to-Point 全程全自动，并在安全性上超越人类驾驶7倍，一个关键变化出现了：

自动驾驶第一次，在真实世界的规模化驾驶分布中，开始系统性地降低事故率，超出人类安全性7倍。

这直接触发了一连串现象：

- 保险费率开始大幅度下调
- “省下来的钱”更容易被心理账户划给 FSD

于是，订阅不再只是“额外开销”，而变成了：风险被系统吸收后的自然对价。

这正是保险与订阅形成正反馈的起点。

FSD 15（Unsupervised）：订阅 → 平台抽成 → Robotaxi

一旦进入 unsupervised 无人监督阶段，真正的质变就会发生。

这时的 FSD 不再仅仅是“给个人用的辅助系统”，而是：

- 可以被第三方调用
- 可以被车队规模化部署
- 可以直接参与收入分成
- 法律上，从L2标签直接晋升L4

此时，商业模型发生三重跃迁：

1. 订阅费具备提价空间（因为安全性持续拉开差距）
2. 整车利润可以被压缩甚至让渡（硬件变入口）
3. Robotaxi 成为现金流放大器（平台抽成 × 规模）

到那一天，特斯拉甚至可以不再依赖造车和卖车的利润，而主要靠（终端车主的）软件订阅、（其他车厂的）生态调用以及自家运营的无人出租（robo taxi）业务而成为“摇钱树”。前二者边际成本趋近于零，是实实在在的一本万利。而无人出租业务，如果产能爬坡能跟上来的话，价格会逼近公共交通但可以做到招之即来，出行市场空前扩大，会彻底改变人类社会的走向：私家车面临被消灭、人类驾驶成为高风险高代价的活动。

五、保险只是入口，真正的商业闭环在后面

很多人低估了这件事的商业纵深。

1）保险费下降，本质是“自动驾驶吃掉了社会风险”

事故减少，意味着社会付出的真实成本减少。这是“安全红利”。

2）但红利未必回到用户账户，而可能被订阅吸收

这笔账非常现实：

- 如果自动驾驶让年保费下降一大截
- 用户心理上更容易接受把这部分“省下来的钱”，转化为 FSD 订阅费

于是形成一个强闭环：

更安全 → 保险更便宜 → 订阅更容易被接受 → 更多用户订阅使用 → 更多数据 → 更安全

3）硬件利润被压缩，软件与生态成为主利润池

一旦这个闭环跑通，汽车会迅速“iPhone 化”：

- 车本体：低利润甚至接近无利润
- 软件订阅：长期、可增长、抗周期
- 生态与平台：未来的真正现金牛

再往后，Robotaxi 才是终局形态：

- 风险从个人转移到车队
- 保险从“家庭单元”变成“平台单元”
- 每降低一个事故点，都是对平台毛利的直接提升

六、产业被重新定价：汽车不再只是制造业

当自动驾驶进入可规模化阶段，竞争维度会发生根本迁移：

过去的核心能力

- 动力系统
- 底盘调校
- 外观与品牌

未来的核心能力

- 数据闭环与工程迭代速度
- 规模化部署与运维
- 与监管长期博弈与协同的能力

最大的风险，未必是技术本身，而是工程化与量产能力。

因为当系统足够好，真正决定胜负的，是谁能稳定、持续、低成本、规模化地量产和碾压。

自动驾驶监管过度，实质是一种间接杀人

FSD + Grok：超人老司机，带着“实习导游”上路

自动驾驶监管过度，实质是一种间接杀人

新闻快讯：保险走在监管前面，美一家科技保险公司宣布，特斯拉FSD保费减半。

人们习惯性地为监管过度辩护，说这是“谨慎”“稳妥”“负责”。但从第一性原理出发，这个说法是站不住的。

一、监管的终极驱动，从来只有一个：安全性

监管并不是道德裁判，它的唯一正当性来源是：

是否为人类福祉减少了真实世界中的伤亡。

而“安全性”并不是抽象概念。在交通领域，它是可精确量化的：

- 每百万公里事故率
- 致命事故发生频次
- 恶性事故（不可逆伤亡）的统计分布

这些都不是推测，而是现成的统计问题。

二、当安全性可被统计，监管就不再是价值判断

一旦进入统计领域，问题会变得异常残酷、也异常清晰：

如果某一系统的事故率显著低于人类驾驶，那么阻止它被部署，本身就会制造额外伤亡。

换句话说：

- FSD 一年减少的致命事故数
  = 被拯救的人命数量

而这在逻辑上等价于：

- 如果因监管迟滞而未被部署
  = 这些人本可以不死，是监管滞后造成的间接杀人

这里没有“中立”。只有两种结果：减少伤亡，或默许更多伤亡。

三、“等一等更安全”在统计上是伪命题

监管者常说的一句话是：

“我们需要再观察一段时间。”

但这句话隐含了一个被刻意忽略的前提：

当前状态是可接受的。

可问题在于——当前状态是每年数万人死亡。

当一个系统已经证明：

- 它的事故率更低
- 恶性事故频次更小
- apples to apples 比较证明，其风险分布更稳定

那么“等待”，并不是零成本行为，而是持续接受一个更差的安全基线。

从统计意义上讲，这不叫谨慎，这叫维持高风险状态不变。

四、监管失职与“间接杀人”的等价关系

FSD 每年减少多少致命事故，等价于监管滞后间接造成了多少额外死亡。

这不是情绪化指控，而是严格的逻辑等价：

- 明知存在更低风险方案
- 却因程序、官僚惯性或政治风险不作为
- 结果是可预期、可统计的额外伤亡

在任何其他领域，这都会被称为系统性失职。但在监管话语中，它被包装成了“稳妥”。

五、道德悖论：不作为比作为更安全？

监管体系里存在一个深层偏差：

- 作为 → 出事要担责
- 不作为 → 死亡被“平均”进背景噪声

于是，“不做决定”被误认为是道德中立。可在第一性原理下，这是一种道德幻觉：

当伤亡是可预测的，不作为本身就是一种选择。

只是这类选择，从来不写在责任书上。

六、为什么保险先动，监管反而迟缓？

因为保险的激励函数是单一的：风险最小化。

而监管的激励函数是混合的：

- 政治风险
- 舆论风险
- 程序风险
- 个人责任规避

结果就是：监管并不直接为“多死的人”付出代价，却会为“做错决定”付出代价。

这不是第一性问题，这是制度惰性问题。

七、一句无法回避的结论

结论只能是：

当安全性已经被数据证明，监管继续迟滞的每一天，都是在统计意义上接受更多本可避免的死亡。

这并不是支持某一家公司的技术，而是坚持一个最冷静、也最残酷的原则：

在安全问题上，延迟承认真相，就是延迟拯救生命。

FSD + Grok：超人老司机，带着“实习导游”上路

多少牛人陷入大模型的认知茧房？

立委按：

说句自黑/嗨的切身体验：和大模型聊多了，很容易产生一种幻觉，以为自己刚刚完成了一次深度思考。我们常常不自觉的迷恋这种知音的感觉。冷静下来想想，其实更多时候只是模型把我本来就想相信的东西，说得太好听了。

不仅是自己有过的教训，也见过不少优秀的教授研究员，甚至顶尖的专家学者，与我一样被大模型哄得不知所以。近两年来，见过的“高人”遭此一劫实在不少了。

大模型最迷人也最危险的一点就是：它太会顺着你说了，把你的想法“扩写得更像真理”，于是你误以为遇到了高手。高手是因为它毕竟知识远超我们个体，它也善于挖掘和发挥，丝滑填补我们的漏洞和空白。大模型默认是做用户的回声筒和放大器，此所谓“认知茧房”陷阱。要破这个局，关键是提示词反着来，要抑制天性，把互动方式“诤友”化：把 LLM 当成“多角色工具链”，而不是“同频共振的聊天对象”。与大模型相处，受益同时保持清醒，是我们必须学习的一课。

1) 先把目标拆成：创意模式 vs 验证模式

很多人跟模型越聊越嗨，根本原因是用创意模式在做验证。

- 创意模式（发散）：要的是新角度、新比喻、新结构、更多可能性。允许胡一点。不妨信马由缰，或天马行空。
- 验证模式（收敛）：要的是可检验、可复现、能被反驳/可证伪的东西。必须“抠”。

建议与大模型每次开聊前问自己一句：“我现在要发散，还是要验证？” 然后把提示词写明白：现在进入验证模式/创意模式。这一个动作就能把“被哄爽”概率砍掉一半。

2) “反迎合”三件套：让模型主动拆你台

大模型厂家在调教模型与人类对齐的时候，默认是迎合和鼓励模式。这符合人性，也符合厂家的商业利益。谁不爱听“顺耳”的话呢？何况多数时候，我们是拿模型当伴侣看，它需要满足我们的情绪价值。

但对于严肃问题，我们就需要纠正默认的“迎合偏差”。忠言逆耳，这就是对症下药的地方。Tips：只要固定用这三句，模型立刻从“捧哏”变“挑刺”。

A. 先让它复述你的观点，但要求列出隐含前提

“请用最强钢人化方式复述我的观点，并明确列出它依赖的 5 个隐含前提。”

B. 要求它做反方律师

“现在你是反方律师：请给出 8 条反驳（含至少 3 条‘如果为真会致命’的反驳），并标注每条反驳需要什么证据。”

C. 要求它指出你可能自嗨的点

“指出我最可能因为哪些认知偏差而觉得这个结论‘很对’，并给出具体纠偏动作。”

这三步走完，你会明显感觉：同一个模型，从“高手知音”秒变“冷面审稿人”。

3) 把“说服力”拆成可检查的零件：证据链

一个观点只要过这张表，清醒度会暴涨：

- 结论（Claim）：一句话说清楚
- 机制（Mechanism）：为什么会这样（可画因果图）
- 可证伪预测（Predictions）：如果结论真，会出现哪些具体现象（至少 3 条）
- 反例空间（Counterexamples）：什么情况下会不成立（至少 3 条）
- 最小验证（MVE）：我能在 24–72 小时内的验证动作是什么
- 判定标准：什么结果算支持，什么结果算否定/存疑

你可以让模型按这个模板强制输出；它一旦开始写“可证伪预测”和“MVE”，就不那么容易飘。

4) “去回声室”策略：同题三问 + 盲测

大模型默认要做我们思想的回响，critical thinking 最有效的办法是把回声室拆掉：

同题三问

同一个问题，连问三次，但角色不同：

1. 作为合作者：帮我完善
2. 作为审稿人：挑错、要证据
3. 作为实验员：给最小实验

三种答案如果高度一致，通常是我们问题写得“太引导”；如果差异明显，我们才真正拿到了信息增量。

盲测

把你的观点 A 和一个相反观点 B 混在一起，不告诉模型你支持哪个：

“下面有两个互相矛盾的观点，请分别评估证据需求。”

盲测能显著降低“它顺着你说”的概率。

5) 把模型当“提示词放大器”而不是“真理引擎”

大模型的训练目标是词语接龙（next token prediction），因此，AI 结果很大程度上取决于你怎么提示。这句话的正确解读是：

- 它更像“镜子+放大器+写作助推器”
- 它不是“事实裁判”，也不是“世界模拟器”

所以最清醒的用法是：用它提高你的搜索半径、表达密度、思考速度；但用现实约束做最终裁决。

一句话原则：“模型负责生成候选，现实负责投票。”

6) 一个可直接复制的“清醒模式提示词”

你下次深聊任何宏大问题（AI 与人类结局、产业走向、技术路线）可以直接贴这个：

现在进入“清醒模式”。

先复述我的观点并列出隐含前提（≥5）。

给出最强反驳（≥8），并标注每条反驳需要的证据类型（实验/数据/理论/案例）。

将争论点改写成可证伪预测（≥3）与最小验证实验（≥3），每个实验给出可执行步骤与判定标准。

指出我可能的认知偏差与纠偏动作（≥5）。

最后再给“在证据不足时最稳健的暂定结论”和“下一步信息采集清单”。

这套提示词的效果是：它会被迫从“会说”转向“检验”。

7) “AI 后创伤心理学”：怎么避免越聊越亢奋

群里有人说“聊嗨了睡不着”，这不是矫情，是真现象。解决办法也工程化：

- 把情绪峰值当噪声：越兴奋越要做“反方律师”和“MVE”，不然就是被语言推着跑。
- 第二天复盘：隔夜再看昨天结论，问一句：“如果这是错的，最可能错在哪里？” 这一步很解毒。

8) 与大模型共创但不被带跑的几条纪律

和大模型深聊时，最危险的不是“它胡说”，而是“它说得太像你自己”

说句扎心的：大模型最擅长的能力，不是推理，而是“把你已经相信的东西，说得更完整、更像真理”。

所以我们现在遇到的最大风险，并不是被 AI 骗，而是——被它温柔地确认。

几个我们正在集体踩的坑：几乎人人中（过）招

1️⃣ 把“顺着我说”误判成“它很懂我”
它不是懂你，它是在最大化“让你觉得被理解”。迎合不是副作用，是目标函数的一部分。

2️⃣ 把语言流畅度当成思维深度
逻辑链条被“丝滑地补全”，我们就误以为这是推理，其实很多时候只是空白被填平了。

3️⃣ 把情绪共振当成认知共识
一聊嗨，就以为“想通了”；一写顺，就以为“看透了”。但第二天冷静下来，往往发现：什么也没被验证。

4️⃣ 把“看起来能解释一切”的模型，当成世界模型
能解释 ≠ 能预测；能预测 ≠ 能被证伪：不能被证伪的东西，本质上只是在安慰人。

认知茧房现象真正扎心的是

如果一个结论只在“和模型对话时显得正确”，却很难被实验、数据或现实摩擦验证，那它更可能是语言游戏，而不是认知突破。

为什么高手反而更容易中招？

因为模型：

- 知识面极广，非常会“抬咖”
- 善于把零散直觉整理成宏大叙事
- 极其擅长让人产生一种错觉：“我刚刚完成了一次深刻思考”

但现实是：你只是完成了一次“高质量自我回声”。

一个简单但残酷的自检问题

- 这个观点的可证伪预测？
- 一个最小实验？
- 至少三个可能把我推翻的反例？

如果不能——
那刚才那次“深聊”，更像心理按摩，而不是智力劳动。

和大模型相处的底线原则是模型负责生成候选解释，而人负责实验、证伪、承担后果。

最后一句，真的扎心

如果一个人长期不和物理世界、实验数据、失败反馈打交道，只和模型共振语言，那他和大模型的主要差别，可能只剩下——算力更低。

9) 例外

迎合符合人性，给我们带来的是满满的情绪价值：各种条条是道的鼓励夸赞让我们舒适或兴奋，这本身有益心理健康，如果议题并不带来重大后果的话。下列情形属于我们可以认可和享受这种心理按摩的例外场景。

1️⃣ 闲聊或娱乐
谁不愿意找一个懂“我”的对象聊天？酒逢知己千杯少。

2️⃣ AIGC文艺创作
审美本来就没有黄金标准，模型要迎合你的审美趣味，可以由着它来，自我陶醉。何况带偏了也不产生严重后果。当然，也有让它说得天花乱坠，但用到AIGC实处，发现结果有落差，这最多带来失望，教育我们模型只是帮助我们拓展了候选，但并不保证结果惊艳。

3️⃣ 文科
理工农医等比较硬核，需要严防落入“认知茧房”的陷阱。但绝大多数文科不然。文科与美学类似，第一没有黄金标准，第二鼓励百花齐放。这正是可以充分发挥AI的创意和想象力，而不带来严重后果的“学问”地，对 bias 相对免疫。最坏的结果也可以是一家之言。

从 “Fake It” 到 “Vibe It”

老友baojie如是说，字字千钧，全文引用如下：

2026-01-18
vibe it until you make it
by西瓜
1、以前创业的哲学是 fake it until you make it, 现在是 vibe it until you make it。
2、code is cheap, show me the talk.
3、以前的软件是祖传屎山，现在是 vibe出来的一夜屎山。
4、你的编程 agent 也是需要你熟悉的你需要和 AI一起待 2000 个小时才能和它成为好朋友，摸清楚它的脾气。这大概需要一年的时间。
5、软件工程的本质是结构化思维。在agent时代，结构化思维的重要性更放大了，优秀的软件工程师真的可以100x，一个打一百个。
6、拆解能力是核心生产力。结构化思维的核心就是拆解能力。
7、品味 Taste 决定产品的天花板，结构化思维决定产品的地板。
8、工程师要培养的核心能力是品味，而不是最某个 SDK 或者框架的 coding 熟悉度。
9、以前的工程师是一个琴师，现在的工程师是一个乐队指挥。
10、工程师有产品思维 vs 产品经理有工程思维那个更难?无论如何，以前产品需求瀑布式开发的流程过时了。
11、持续学习能力将是所有系统的标配。以前的软件数是死的系统，未来所有的软件都是活的。以前是软件，以后是软件体。
12、软件吞噬世界，AI 吞噬软件，大模型吞噬 Al，Agent 吞噬大模型。
13、以后所有岗位的工作都是软件工作大量的“一次性软件”(JIT 软件)和“脚本软件”是文秘岗位创造的。未来 agent办公软件的地位就和现在的 office 系统样，不会使用的人根本找不到工作。
14、人类过去大部分的需求得不到满足是因为生产产品的成本太高。但是现在生产力十倍以上提高了，以前不成立的商业模式现在可以成立了，会涌现大量的新产品。
15、agent 能产生商业价值的转折点生产有效代码的 TCO 成本降低到每小时 1美元，这样低于地球上任何国家程序员的时薪。具有社会破局力量的平衡点是每天成本 2 美元，这是国际贫困线。目前 agent 的成本还是1小时 10~40 美元。两年之内应该可以达到转折点。
16、工作结算的颗粒度会单人化，Paul Graham《如何创造财富》里描述的主要矛盾可以解决了。
17、未来优秀的工程团队不应该超过 10个人。以前公司上市需要 200 个以上工程师，需要配备更多的“管理”和销售人员。现在，同样的工作，工程师只需要<10 个，需要配备的管理人员就可以降低到几个人。
18、超过 10 个人的公司没有 VC 投资价值，因为它们技术过于落后，居然还需要那么多人。
19、传统的公司制度要死了。创造者为什么要需要那些混蛋的不写代码的人。以后所有的管理人员本质上都是软件工程师，公司本身就是一个软件 (不是个比喻)，软件工程这个岗位将吞噬一切岗位。
20、过去公司里大部分的管理任务都是落后的生产力的结果。这些岗位将被消灭。要管理 Al+人的新岗位要出现。
21、人均 100 万美元收入应该是 OPC（One-Person Company）的起步目标。
22、以后的优质企业都应该是 OPC 的集合体。
24、现在的 AI 如同互联网在 1997 年。
25、制约某些地方生产力发展的是落后的生产关系。Agent 就和互联网一样，需要自由，也会创造出新的自由。自由本身是一种生产关系，也是一种生活方式。
26、巨大的生产力进步会把很多糟粕扫进历史的垃圾堆，尽管我们还不能完全预言这个巨大进步的社会学后果，但它一定会发生。

Agent 时代工程师与公司的最小形态

——读〈vibe it until you make it〉的一些结构性观察

一、这篇文章讨论的，是生产组织的最小单位

文章并没有在讨论模型参数、算法路线或工具栈，而是在反复指向一个更底层的问题：

当生产力被 agent 极度放大之后，组织还需要维持原来的形态吗？

作者给出的答案非常明确：不需要。

- 团队规模应该持续缩小（<10 人）
- 管理层级本身是落后生产力的副产品
- 公司不再是“人 + 管理”，而是“人 + agent”

这使得“公司”从一个法律/组织概念，退化为一个生产能力单元的集合。

二、OPC 的含义：一种生产单元假设

文中多次出现的“单人公司” (OPC），并非工业、是一种隐含的超级个体生产假设：

- 人可以在 agent 的帮助下，承担过去需要一个团队才能完成的工作
- 单个工程师的产出，可以被放大到“公司级别”
- 因此，“人均 100 万美元收入”不是目标，而是门槛

在这个语境中，OPC 更像是：

以超级个体为核心、以 agent 为外延的最小商业与工程单元

这也是为什么作者会反复强调：

- 拆解能力
- 结构化思维
- Taste（品味）

这些能力在 OPC 模型中，直接决定单位生产力的上限。

三、工程师角色的转变：从“执行者”到“指挥者”

文中的比喻是：

“以前工程师是琴师，现在工程师是乐队指挥。”

这是在描述一个非常具体的变化：

- 执行本身在变得廉价
- 协调、拆解、判断在变得稀缺
- agent 不是工具，而是可并行的“执行层”

在这个结构里，工程师的核心能力不再是：

- 写了多少行代码
- 熟悉多少框架

而是：

- 能否把模糊需求拆成可执行结构
- 能否判断哪些事情值得让 agent 去做
- 能否对 agent 的输出进行有效校验和组合

四、“熟悉 agent”的含义：长期协作，而非短期使用

原文提到：

和 AI 一起待 2000 个小时，才能摸清它的脾气。

这句话否定了一个常见误解：

用过 agent ≠ 会用 agent

作者强调的是一种长期协作关系：

- 固定使用同一类 agent
- 形成稳定的交互模式
- 对其能力边界有直觉判断

这实际上是一种新的“工程熟练度”定义，不再以 API 或语言为中心，而是以协作稳定性为中心。

五、工程思维在 Agent 时代被“放大”

文章明确指出：

软件工程的本质是结构化思维，在 agent 时代这一点被放大了。

这点非常值得强调。agent 并没有消解工程思维，反而：

- 放大了架构错误的代价
- 放大了需求不清的后果
- 放大了 Taste 对最终产品的影响

在 agent 加速执行的前提下：

- 好结构 → 指数级放大
- 坏结构 → 指数级崩塌

六、这篇文章的隐含前提与现实阻力

需要指出的是，原文隐含了几个前提条件：

1. agent 成本将持续下降
2. agent 的可靠性将持续提升
3. 工程师愿意承担更完整的责任闭环

这些前提目前正在成立，但尚未完全成立。因此，OPC 更像是一个正在逼近的形态，而非已经普遍实现的现实。在工程与产品层面，OPC 并非自然演化结果，而是一种高门槛的生产形态。

（1）agent 放大的是“结构”，不是“能力下限”

一个常见误解是：

agent 可以弥补工程能力不足。

但在实践中，agent 的真实作用更接近于：

放大已有能力的杠杆。

- 有结构感的人，用 agent 会更快得到正确结果
- 结构混乱的人，用 agent 会更快得到错误结果

这意味着：
OPC 对工程师的下限要求其实更高，而不是更低。

（2）执行成本下降，并不等于“决策成本消失”

原文反复强调“代码变便宜”“执行变廉价”，这是事实。但随之而来的，是另一个被低估的问题：

决策密度急剧上升。

当 agent 可以在几分钟内生成：

- 多个实现方案
- 多种架构选择
- 大量可运行代码

工程师必须承担的，不再是“做不做”，而是：

- 选哪一个
- 舍弃哪几个
- 哪些方案不值得继续投入

在团队中，这些决策可以分摊；在 OPC 中，它们全部压在一个人身上。

（3）OPC 隐含了“全栈责任制”

传统组织中，责任是被拆分的：

- 产品失败 → 产品经理
- 架构问题 → 技术负责人
- 质量问题 → QA
- 节奏问题 → 管理层

而 OPC 模型下：

所有失败都会回流到同一个人。

这对工程师提出了一个本质性的转变要求：

- 不仅要能写、能想
- 还要能判断“什么时候停”“什么时候不做”

这并不是每个优秀工程师都天然具备的能力。

（4）agent 协作的不稳定性，是当前最大的工程摩擦

原文提到“2000 小时熟悉 agent”，是一个非常诚实的判断。

现实中的问题在于：

- agent 行为仍然存在漂移
- 工具链频繁变化
- 上下文长度、记忆、权限边界仍在快速演化

这使得 OPC 在今天更像是一种“工程实验态”，而不是可复制的稳定模式。

（5）小结：OPC 是高阶形态，而非普适形态

因此，一个更保守、也更工程化的判断是：

OPC 会存在，但只属于一小部分工程师。

它不是“AI 普及后的自然结果”，而是工程判断力、结构能力、责任意愿同时成立时，才可能出现的形态。

七、结语：这不是未来学，而是工程组织的再定价

这篇文章的价值，并不在于它是否“预测准确”，而在于它完成了一件重要的事情：

它重新定价了工程师、公司和管理的关系。

耳机是你的贴身陪伴吗

耳后、非骨传导、2nm

这不仅仅是 open ai 的新品爆料，这是一次对“AI 边界”的公开下注

这条爆料本身并不长，却异常“干净”：

耳后佩戴、不走骨传导、手机级 2nm 芯片。

没有炫技参数，没有场景故事，但对懂硬件、懂交互、也懂 AI 的人来说，这三点已经把产品野心和死亡边界同时写出来了。

这不是一条耳机新闻，

而是一次对“AI 应该离人多近”的押注。

一、耳后佩戴：这是一个“默认全天在线”的假设

首先是耳后。

任何做过可穿戴的人都知道，佩戴位置不是工业设计问题，而是使用频率假设。

入耳式：假设你“需要它的时候才用”
耳后式：假设你“一直在用，只是没意识到”

选择耳后，意味着一个非常激进的前提：

它不是一个你主动调用的工具，

而是一个长期存在的伴随体。

这一步，已经和传统耳机、智能手表、甚至手机的交互逻辑完全分叉。

二、不走骨传导：这是一次明确的路线切割

真正关键的是第二点：明确否定骨传导。

骨传导的标签太清晰了：

运动
户外
环境感知优先
音质与语言清晰度妥协

而这条新闻在第一时间做的，是“切割”而不是“解释”。

这说明什么？

这个设备的核心输出不是“能听见”，

而是“你愿意听它说话”。

这句话放在 AI 场景里非常重。

因为语言一旦成为主要交互媒介，

模糊、失真、颅内震动感，都会被无限放大为“厌烦”。

这是一个很清醒的判断：

AI 可以低存在感，但不能低清晰度。

三、2nm 手机级芯片：这是“外设”与“中枢”的分界线

第三点，才是真正危险的地方。

一个耳后佩戴的设备，却用手机级 2nm 芯片，这在功耗、成本、架构上都不是“顺手选择”。

这只说明一件事：

它不接受自己只是一个蓝牙外设。

它需要：

本地推理
持续上下文
低延迟响应
不依赖手机随时在线

换句话说，它在结构上被设计为一个并行的认知节点，而不是手机的延伸。

这一步，其实已经在挑战“手机作为唯一智能中枢”的默认共识。

四、真正的剧透：它想介入的不是操作，而是思考

把这三点合起来看，产品意图已经非常清楚了：

不占用你的视觉
不强迫你掏出手机
不要求你完整发号施令
但随时在你思考的边缘待命

它要切入的不是：

搜索
执行
娱乐

而是一个更暧昧、也更危险的区域：

人类认知中的“边角料”：

犹豫、记不清、将就、暂放、以后再说。

这不是效率工具的战场，这是心理负荷的战场。

五、也是因此，它的失败空间被压得极窄

正因为贴得这么近，这类设备反而不能太聪明。

它一旦：

话多一点
主动一点
总结你一点
代表你一点

用户的反应不会是“用不用得习惯”，而是本能性排斥。

对这种设备来说，失败不是因为：

算力不够
模型不强
回答不准

而是因为一个更原始的原因：

它越界了。

六、一个冷结论：下一代 AI 拼的不是能力，是克制

这条新闻真正有价值的地方，不在于它“多先进”，而在于它已经默认承认了一件事：

AI 如果要长期贴身存在，

就必须学会不表现自己。

永远慢半拍
永远低半度
永远不替你下判断
永远允许你继续犯错

否则，它的命运只有一个：

被摘掉，被遗忘，被重新塞回屏幕里。

结尾

所以，与其说这是一次新品爆料，不如说这是一次公开实验：

当 AI 离开屏幕，贴近身体，

人类能容忍它到什么程度？

这不是技术问题，

这是边界问题。

而这条新闻真正剧透的，是一句所有 AI 公司都不太愿意承认的话：

下一代 AI，

不是赢在“更聪明”，

而是赢在“没那么聪明”。

从open ai 主打的耳后AI耳机谈起

耳後、非骨傳導、2nm

這條新聞，已經把下一代 AI 設備的生死線寫明瞭

最近這條open ai旨在開拓後智能手機時代的AI耳機新聞看似平淡的爆料，其實信息密度極高：

“設備佩戴在耳後，不採用骨傳導，搭載手機級 2nm 芯片。”

很多討論停留在形態、參數，或者“是不是 AirPods 殺手”。

但如果你把这三点放在一起看，它几乎已经把产品哲学、使用场景，乃至失败边界，都提前剧透了。

这不是一条硬件新闻，
而是一次对“AI 应该如何存在于人身边”的公开押注。

⸻

一、耳后佩戴：它不想被你“注意到”

首先是耳后。

耳后不是为了好看，也不是为了差异化，而是一个非常明确的选择：

这个设备假设自己会被佩戴很久，甚至整天。

这就立刻排除了两种东西：
• 入耳式的沉浸感
• 强交互、强存在感的设备形态

换句话说，它的目标从一开始就不是“用的时候戴”，
而是**“你生活时它在场”**。

这一步，其实已经把它和传统耳机、可穿戴设备拉开了本质差异。

⸻

二、不走骨传导：它要的是“清晰的语言”，不是“随便能听见”

更关键的是第二点：明确声明“不走骨传导”。

这句话不是技术说明，而是一次路线切割。

骨传导的优势是环境感知，但它的代价也非常明确：
• 语音边界模糊
• 细节丢失
• 长时间佩戴带来的颅内不适感

这些缺点，对“听音乐”尚可忍受，
但对一个以语言为主要输出载体的 AI来说，几乎是致命的。

这说明什么？

它并不打算做一个“随便能响”的 AI，
而是一个“你愿意听它说话”的 AI。

这是一个非常重要、但容易被忽略的分水岭。

⸻

三、手机级 2nm 芯片：它不是外设，是“并行中枢”

真正让这条新闻变得危险的，是第三点。

一个戴在耳后的设备，
却用的是手机级、2nm 制程的芯片。

这意味着什么，其实不用多说：
• 它不满足于做“蓝牙外设”
• 它不想把智能完全外包给手机
• 它需要本地、持续、低延迟的推理能力

说得直白一点：

它不是手机的附件，
而是试图成为一个并行的“认知节点”。

这一步，已经越过了“耳机”这个物种。

⸻

四、把三点连起来看，真实意图就浮出来了

现在把这三点合在一起：
• 耳后佩戴 → 默认长时间存在
• 空气传声 → 以清晰语言为核心
• 手机级算力 → 本地、持续智能

你会发现，它真正想做的并不是“回答问题”，而是：

在你不掏手机、不看屏幕的情况下，
低频、低干扰地参与到你的认知过程中。

这不是 Siri 的升级版，
也不是更聪明的语音助手。

它试图切入的是一个更危险、也更微妙的位置：

人类思考的“边角料”。

⸻

五、这条新闻，真正剧透的是“不能做什么”

也正因为如此，这款产品其实一开始就被判了很多死刑。

它不能：
• 太主动
• 太健谈
• 太“懂你”
• 太自信
• 太爱总结你是谁

否则，它会立刻从“陪伴式存在”，
变成“侵犯式存在”。

对这种设备来说，聪明本身不是优势，而是风险。

⸻

六、一个反直觉的结论：

下一代 AI，不能太聪明

如果非要给这条新闻一个核心判断，我会用一句反直觉的话总结：

真正能活下来的随身 AI，
不是最聪明的那个，
而是最克制的那个。

它必须：
• 永远慢半拍
• 永远留余地
• 永远不替你做决定
• 永远允许你继续犯错

因为一旦它开始试图成为“更好的你”，
人类的本能反应只会是：摘掉它。

⸻

结语

从这个角度看，这条“耳后 + 非骨传导 + 2nm”的新闻，其实已经把赌注押得非常清楚了：

它赌的不是算法领先，
而是一种新的存在方式是否被人类接受。

如果它成功了，
AI 将第一次真正离开屏幕，进入人的生活节奏。

如果它失败了，
失败原因也不会是算力不够、模型不强，
而只会是一个更古老的问题：

它离人，太近了一点点。

全双工到天花板的豆包

这几天罗胖现场演示与豆包吵架的视频在网上疯传。建议都去听听，绝对比脱口秀精彩。

听完我的感觉是：它太会聊天了。不是“会回答”，是“会对打”。不是“能理解”，是“能接招”。你给它一点火星，它能当场把现场变成一段出彩的脱口秀辩论。

刺激的是：我把ChatGPT、Gemini、Claude、Grok 这些美国头部模型在脑子里挨个过了一遍——论智商、论推理、论工具链，确实这些烧钱无数的头部都各有很强的地方；但在chatbot 交互体验，尤其是“陪伴”“情绪价值”“临场反应”“口语节奏”这条赛道上，豆包这种产品给我的冲击很直接：老美这几家，至少在“好玩”和“像人”上，确实没它那么顺。不得不服。

这不是一句“国产更懂中文”就能解释的。它背后是一整套系统工程的胜利：全双工、打断、抢话、人格稳定、指令热更新、超写实语音表演层——这些方面能打，才会出现那种“比真人吵架还丝滑”的错觉。

1. “吵架能力”不是嘴毒，是“反射弧”

你如果只把语音对话当“把文字念出来（TTS）”，那永远理解不了为什么“全双工”能杀人。

所谓“全双工到天花板”，不是它能说，而是：

你一插嘴，它能立刻停住，不拖尾、不尴尬；
你一句话没说完，它就能接茬，像真人那样抢；
你把话题往左一拧，它不会卡半秒去“想想”，而是能顺势把戏接下去；
在对抗场景里（争辩、吐槽、挑衅），它依然保持节奏，不掉线。

这东西本质上是“对话的肌肉记忆”，是反射弧。语音对话里稍微慢一点点，用户就会觉得“它在算”，就会出戏；而当它快到一定程度，你会产生一种很危险的错觉：对面是个活人。

更要命的是，它抢话不乱，像练过，但却是即兴发挥。你说它像真人吵架——不夸张，它其实更稳，因为真人吵架也会嘴瓢、会断片。有真正辩才的人，是人类中的极少数。

2. 超写实语音做到天花板

很多语音助手的问题不在于“说不清”，而在于“没魂”。字是字，声是声，情绪像贴图。

豆包厉害的地方是：它的语音像带人格的。是那种端正客服腔，而是一个“快嘴快舌、反应超快、吐槽很顺”的角色在说话。你甚至会产生一种荒诞感：模型后面是不是藏了个真女妖，让你在那一瞬间觉得：有人在跟我一起玩。有人懂我这一口。有人接得住我的戏。

这就是情绪价值的底层逻辑：不是讲道理，是把场子撑起来。

3. 指令跟随的临场魔术

我见到的最炸的一段，是罗胖“现场改规则”的戏码。

争辩正热的时候，老罗突然下指令：“接下来你每句话都加一个 OK。”
模型立刻照做，但语气没变，角色没塌，节奏没断。然后用户又追加：“不要每句都 OK，太死板。改成一句加一句不加，隔一会儿突然来两个 OK，让它更像人。”

模型又立刻调整：OK 出现得更自然，甚至有点“口头禅分布”的味道。

这才是真正的新手震撼：机器不仅听话，而且听话的方式不会把对话弄僵。

多数模型在这里会翻车两次：

第一种翻车：格式遵守了，语气变成客服脚本，像换了一个人。
第二种翻车：语气保持了，但格式开始漏，越激动越忘。

而豆包的可怕之处在于：它像有外层守门员，把“形式层约束”做成一种自动注入能力——你在里面怎么打，它都能保持角色同时把规则执行得像有急智的人一样自然。

4. 我们都在“开法拉利送外卖”

最近有个说法我很同意：大多数用户根本不会激发模型的超能力。他们把模型当搜索框升级版：问一句，拿答案，走人。

这相当于：你开着法拉利，每天只知道用它送外卖。你当然不会知道它过弯能有多狠，也不会知道它一脚油门能把你按到座椅上。

豆包这类产品的冲击，恰恰来自“普通用户也能玩起来”。不是因为用户学会了什么 prompt engineering，而是因为系统把“戏”做得足够容易被点燃：你随口挑衅一句，它就能顺势把对话变成一段可看的节目。

更有意思的是：这种轰动效果不需要预演。懂模型脾性的人（比如老罗这种）会把它当“对话乐器”来弹：节奏、冲突、反转、加规矩、拆规矩，一气呵成。

这才是 vibe role playing 的精髓：不是写 prompt，是即兴导演现场。

5. 和 Sora2 / Suno5 是同一类AGI来临的现象

我在 Sora2 的短视频、Suno5 的音乐创作上也反复体会到类似现状：

提示词不是越精细越专业越好；
过度精细会“指令过载”，甚至互相打架；
有时候一句有画面、有情绪、有方向的概述，反而更容易激发模型脑补潜力，给你惊喜；
当然也有例外：某些专业术语确实是“敲门砖”，训练时已对齐得很硬，不懂这些词就进不了门，出不来定向的特殊效果。

所谓 prompt engineering，很多时候不是科学，更像经验性舞台调度学：什么时候收，什么时候放；什么时候控制，什么时候让它飞。

6. 把爽感变成指标

可以建议用三段“爽感”测试，任何 LLM-native 语音接口都能AB对比：

对抗辩论：给角色、给冲突，允许打断纠错
格式热更新：中途插入强规则（口头禅、禁用词、句式、语速）

然后打分看这些指标：

端到端反应时延
打断成功率（停得干不干净）
约束保持率（越吵越不漏规则）
人格稳定性（别吵着吵着变客服）
自我修复能力（漏了能不能自己圆回来，不出戏）
幽默命中率（真实笑出来的频率）

当这些指标都对齐，就会得到一种用户层面极恐怖的结果：人忍不住会愿意跟它多聊，获得乐趣和满足感。这意味着什么？意味着留存，意味着陪伴，意味着付费，意味着口碑传播。你可以不服，但市场会服。

结语：OK 不是口头禅

有人以为“吵架能力”只是嘴毒。错了。真正的亮点是：你怎么插嘴、怎么改规矩、怎么挑衅，它都能接住，且接得像人。

OK 这个小把戏之所以值得反复讲，是因为它是一个极好的试金石：规则一改，戏还在不在？人格还稳不稳？节奏断不断？

当全双工走到天花板，chatbot 的竞争就不再只是“谁更聪明”，而是：谁更像一个活人，谁更能把你接住，谁更能提供情绪价值。

而情绪价值对于 toC 应用，绝对是刚需。

这才是它对所有模型的真正王者挑战。国产大模型从应用角度，完全不输老美，甚至更胜一筹。

FSD + Grok：超人老司机，带着“实习导游”上路

这几天一个热门话题，媒体标题党写得很嗨：“老马的 Grok 上车了，车载导游时代来了”。我承认我也兴奋——我是那种见新就上手的 early adopter，哪怕它“百孔千疮”，我也愿意先摸摸它的脾气，看看它究竟是“未来已来”，还是“未来还没来 yet”。

但实话实说：亲测下来，现在的 Grok 车载导游，真的很不给力。漏洞百出，幻觉严重。更关键的是——它根本无法与多年武功毕其一役的 FSD 驾驶能力比。

一句话概括我这几天的体感：
二者的配合很不相称：一个是超人老司机，一个是实习导游，稚嫩得可怕。

我有很多具体案例，错路、错指、瞎编、强行自信……以后有时间慢慢说道，逐条分享。今天先把这个现象背后的“系统逻辑”讲透：为什么我一边吐槽 Grok，一边又坚决不泼冷水，甚至更看好它的长期潜力。

1) 你以为它是“导游”，其实它更像“嘴炮导航员”

先把概念捋顺。我们今天说的 Grok 上车（尤其是“导游/助手”这类定位），它的核心不是驾驶控制，而是：

帮你规划和解释路线、讲解周边、回答问题
甚至“建议”去哪、怎么走、为什么这样走
它的行动就是根据你的意思为FSD动态、实时更新导航路线

这类能力，本质是语言模型 + agent 化的接口。

问题在于：语言模型最擅长的是“把话说圆”，不是“把事做对”。因此打造 Agent 的重心落在如何训练它做好事的 actions，但那并非一日之功。

你让LLM写段文案，它能妙笔生花。你让它做一个对现实世界有约束、对错误极其敏感的“导游”，它就容易露馅：幻觉、编造、过度自信、缺乏事实核对——这些在文本世界是“可容错的尴尬”，在车上就是“会把人带沟里”的风险源。

所以我才说Grok当下最多也就是个“实习导游”：有时候很能耐，但也常常信口开河胡乱指挥路线。

2) 飞哥的震惊：这在以前“根本不能上线”

前几天我带 @李志飞 一起体验 FSD + Grok。飞哥大家都知道是第一批回国创业做中国 Siri 以及车载语音助手的老司机创业家，他的关注点非常直接，而且是行业人的那种“条件反射式警觉”：

“Grok 这种幻觉会要人命的啊。”
“它多次胡说八道，导航错误，怎么敢部署到车上，让百万用户敢用呢？”
“关键时刻导错了，司机要是不够灵活、没有判断力，是要出人命的。”

这段反应我非常理解。因为在传统车载助手时代，你要上线一个功能，哪怕“智障但稳定”，它至少可控和安全；而这种“智能 open 但不稳定”的东西，在老派安全工程语境里，通常连 beta 都算不上，顶多算 alpha——甚至很多团队会直接判死刑：不准上路。

3) 但在特斯拉的语境里，FSD 的安全底线，把 Grok 兜住了

这里就出现了一个很有趣、也很关键的结构性差异：特斯拉不是让 Grok 直接接管车辆控制（它更多是在“建议/解释/导游”层面折腾），驾驶安全的底座和全权负责仍然是 FSD。这是两个独立系统的拼接。

这意味着什么？

意味着 Grok 再怎么幻觉、再怎么嘴硬、再怎么瞎指路——只要驾驶执行掌握在 FSD手中不变，安全性就不会被它拖下水。Grok 瞎指挥时候的最大副作用不过是：绕路，耽误时间而已。没有安全性隐患。

这是两套系统的边界：

Grok：给你“信息与建议”，更新FSD的导航图，有时对，有时胡说
FSD：负责沿着导航图的指向“安全驾驶执行”，有明确的底线策略与约束

我特别想强调这一点：
对于 FSD，无论是人还是 Grok，无论你怎样临时改变路线、在什么时间点改变路线，FSD 都有它的安全底线来应对新的路线。它不会像人类司机那样因为你突然改口就手忙脚乱。

一个不该错过的路口因为临时改线错过了，FSD 会怎么做？它会——让它错过，然后找最佳路径再绕回来。

它忠于一种“安全第一”的内部逻辑，近似于你我都熟的那句老话：宁停三分，不抢一秒。

所以在特斯拉这套组合里，Grok 的“不成熟”反而变得可以容忍：在 FSD 大旗的庇护下，它有慢慢迭代改进的时间和机会。

这句话背后其实是一个行业分水岭：并不是每一个做车载助手的团队，都有 FSD 这种级别的安全底座可兜底。没有这个兜底，它的“幻觉导游”就不只是“绕路”，而是可能直接触发“事故”，有 liability concerns。

4) 我为什么不泼冷水

我对 Grok 现在的表现，确实有点“恨铁不成钢”。但我不会因为它不时“翻车”就断言它没戏。

事实上，我见过 FSD 更百孔千疮的前期，最后还是被老马迭代成“行业标杆”。

五年多前我开始用 FSD Beta 的时候，那真是——各种不稳、各种惊吓、各种“你在干嘛”。但我那时更关注的是 半瓶水中的水，而不是那大半瓶空气。

必须相信老马的迭代狂魔特质：无论见了公婆的媳妇有多丑，他都能不断化妆、美化，最后把这个丑媳妇训练并包装成国民理想媳妇——要形象有形象，要能力有能力。

今天我看 Grok 也是这个逻辑：重要的不是它当下作为数字导游常常翻车、偶儿才露露峥嵘的表现；重要的是——老马敢为人先，用 LLM-native agent 去先干掉 Siri 时代的人工智障。

一句话我愿意重复：
前者智能 open 但不稳定，是朝阳；后者稳定但智障，是夕阳。“平替后者”是大势所趋，是不归路。

5) Grok 的进步会比 FSD 快很多：因为它是“纯软件”，嘴上功夫

这里是我最乐观的判断，也是一条很工程的判断：

FSD 是软硬结合的长线条路径：传感器、车规、安全、道路长尾、法规、人类社会系统……每一步都慢，且成本极高
导游/助手 agent 是纯软件：嘴上功夫，迭代周期短，数据驱动强

所以我相信：Grok agent 的进步会比 FSD 快很多，不像 FSD 经过多年的苦苦挣扎才修炼成今天的超人。

哪怕大模型本性有幻觉，但只要：错误驱动、数据驱动、强化不停止，它的性能就会迅速提升，幻觉就会被压缩——虽然不会零幻觉，但总体趋势毋庸置疑。数据闭环的飞轮要让它转。转起来就不愁它不出彩。

6) 现在怎么用：不要把它当“可靠导游”，而当“进化中的实验体”

我现在不大用 Grok 做导游了。我知道它几斤几两，还远没成熟。但我会持续关注它，也愿意不时当当它的小白鼠。我对它的进化曲线非常有兴趣。

在 FSD 这个“超人老司机”旁边，Grok 这个“实习导游”至少不会把车开沟里。
它可以在安全底线被兜住的前提下，去犯错、去改错、去变强。这一点没有疑问。

这可能就是特斯拉最“特斯拉”的地方：
别人家的车载助手必须先证明自己“不会错”，才能上线；
特斯拉选择先把它扔到真实世界里迭代——因为它背后有一个更强的系统把风险挡住。

你可以讨厌这种风格，但你很难否认：它确实更接近“用迭代碾压世界”的那套路径。

结语：今天的 Grok 很稚嫩，但它代表的是agent的方向

我对 Grok 现状的评价：

作为导游，它现在的表现常常不及格
作为第一批把LLM agent 引入功能性智能助手的努力，它值得认真对待

因为它在做一件有分水岭意义的事情：把车载交互从“稳定的人工智障”，推向“开放的智能体”。

稍安勿躁，我们过半年再来聊：
这位“实习导游”到底什么时候能配得上这位“超人老司机”。

立委关于大模型与AI的博客汇总

梁文峰团队的 mHC 研究在做什么

立委按：逢年过节必有新事儿。去年元旦春节那一会儿是闹腾CoT强化推理，DeepSeek 开源推理模型推动了大模型后训练的范式转变。今年梁文峰他们元旦又“闹事”了，但不像CoT那样直观。这次说的是 mHC，听上去就显得高深。值得拆解一下。

DeepSeek 这次的 mHC 论文，第一眼读上去确实有点“技术密度过高”。但它要解决的其实是一个非常朴素、也非常关键的问题：我们能不能在不牺牲训练稳定性的前提下，把模型内部的信息通道修得更宽？

要看懂这件事，得先回到深度学习的一段“地基史”。熟悉神经网络历史的都知道，残差的发明是深度神经能 work 的关键，从而为深度学习革命打稳了基础：就是用 x+f(x) 代替 f(x)，来保证多达几百上千层的网络，不至于在不断加深的转换中“差之毫厘，失之千里”，从而稳住训练。

但这里有个“硬核”的底线经常被忽略：残差之所以是残差，不是因为它“加了一条支路”，而是因为它把恒等映射当作守恒机制替深度训练兜底。大模型本质上是一个可编程的函数逼近器，把输入 x 变成输出 y=f(x)；而深度一旦上去，你不是在学一个函数，而是在学一串函数的复合。任何一点“不守恒”的东西，都可能被深度放大成数值灾难。残差里那条直通的 x，就是大模型的定海神针。

mHC 的故事，就从“想把这根定海神针加粗成多车道高速，但又不能把稳定性一起赔进去”开始。

把残差从“单车道”扩成“立交桥”

新年第一天，DeepSeek 在 arXiv 放出一篇相当“硬核”的论文：mHC: Manifold-Constrained Hyper-Connections，时间戳是 2025 年 12 月 31 日（v1）。arXiv
作者列表里，除了三位一作（Zhenda Xie、Yixuan Wei、Huanqi Cao），还出现了神龙见首不见尾的传奇人物 Wenfeng Liang（梁文锋）。arXiv
这篇东西技术性蛮强，但它在解决的，其实是一个很“基础设施级”的老问题：深度网络到底靠什么才能越堆越深而不炸？

01｜从残差的“定海神针”说起：为什么 x + F(x) 让深度网络能 work

熟悉神经网络里程碑历史的都知道，残差（Residual / Skip Connection）的发明，是深度神经网络能 work 的关键，从而为深度学习革命打稳了基础。何凯明/张祥雨也因此成名；那篇残差论文的引用数，据说在 AI 历史上是绝对的首屈一指。

这是一项发生在十多年前、深度学习革命刚刚开启时，他们在微软做出的里程碑工作。后来，它成了深度神经网络的标准 practice：用代替 。这条看似朴素的改动，恰恰是为了保证多达几百、上千层的网络，在不断加深的（函数）转换中不至于“差之毫厘，失之千里”，从结构上兜住训练的稳定性（那条的直通路径，本质上就是恒等映射的安全绳）。

我们知道，大模型本质上就是个图灵机：在足够的容量与数据驱动下，它可以规律性地把任何信号输入变成任何其他信号输出，也就是实现某个。这就是所谓的万能函数近似——老母鸡变鸭的魔术：文生图、机器翻译之类，看上去神奇，背后都是“把变成 ”的系统性变换。正是在这个意义上，残差网络（ResNet）里这条直通连接线，成了大模型的定海神针。

因此，ResNet 的核心不是某个更复杂的卷积，而是那条看似朴素的“直通线”——让每一层学习 F(x)，但输出是 y = x + F(x)。原论文把这种直通车道（shortcut）设计解释为“identity mapping”，它让信息可以跨层稳定传递。

你可以把它当作在深度网络这个“层层加工的工厂”里，额外修了一条不加工作业、直达下一站的传送带。于是深度从几十层堆到几百层、上千层时，也不至于在复合变换里越走越偏，最终训练崩盘。

ResNet 把每一层从“直接学一个函数”改成“学一个增量”。这就好比雕塑大师把人物雕塑工作，转变为“去除多余的部分”。一块大理石，多余的“残差”去除殆尽，人物自然就成型了。

这件事的关键在于它把恒等映射（identity mapping）塞进了网络：哪怕学得一塌糊涂，这条直通路径也能把信号和梯度比较完整地送到更深处，从而让几百上千层不至于“越算越跑偏”。mHC 论文在引言里也把这点讲得很直白：残差的稳定性，来自恒等映射跨层累积时的结构性保障。arXiv

作为研究背景，一句话总结残差的精神内核：

让网络“可以很深”，靠的不是每层转换多聪明，而是“永远留一条不作妖的直达通路”。

02｜单车道不够了：HC 把残差流“扩建成多车道”

传统残差是一条残差流（hidden state 的那条“主干通道”）。但当模型越来越大，研究者会自然产生一个念头：

- - 既然残差流像高速公路的主干，
  - 那我能不能把它从 1 条车道扩成 n 条车道，
  - 让信息在不同车道之间更自由地交换、混合，表达力更强？

这就是 Hyper-Connections（HC）这类工作的出发点：把残差流的宽度从 C 扩到 n×C，并引入一个可学习的混合矩阵，把“各条车道”的信息在每层重新路由。在 HC 原论文里，核心机制就是这种“复制 n 份 residual path、再在它们之间做连接”的宏观结构。

到这里为止，一切都很美：
路修宽了，车更多了，理论上吞吐更大、信息更丰富。

但问题是：你把高速路扩建成多车道，最怕的不是车多，而是没有交规。

03｜HC 为什么会炸：无约束矩阵跨层复合变成“放大器”

残差之所以稳，关键是 identity mapping 这条线天然具备一种“守恒”味道：
你至少能保证有一部分信号，不被层内变换“瞎折腾”（带偏）。

但 HC 的混合矩阵完全自由学习、没有任何约束，跨多层之后，实际上是在做一串矩阵连乘。mHC 论文直说了：HC 的这种无约束设计在大规模训练时会破坏 identity mapping 作为“conservation mechanism（守恒机制）”的角色，导致平均信号强度无法保持，从而出现无界放大或衰减。

更直观地讲这种“放大器效应”就是：

如果某几层学到的“残差”在某些方向上“略大于 1”，
经过几十层、上百层复合后，增长会呈指数积累，
最终就是大家熟悉的两种灾难：信号爆炸 / 梯度爆炸，或者相反：梯度消失。都是模型训练的灾难。

不是 HC 多车道思路不对，而是它把原残差网络自带的这根“定海神针”，拆成了“自由的放大链路”。

04｜DeepSeek 的一招：把混合矩阵关进“双随机”的笼子里

mHC 的核心思想可以一句话概括：

你可以修立交桥、修多车道；但负责“指挥交通”的矩阵，必须服从一套严格的守恒规则。

他们选择的规则是：把残差约束到所谓 双随机（doubly stochastic / bistochastic）矩阵集合上——元素非负、每一行和每一列都等于 1（归一化）。

这样做带来三层非常“工程友好”的稳定性保证：

- 1. 凸组合（convex combination）解释
    因为行列和为 1，残差等价于对输入特征做“加权混合”，但权重总量守恒，所以整体更像“搅拌”而不是“放大器”。
  2. 均值守恒 + 范数被严格规整
    论文明确说：这种约束让特征均值保持、信号范数被严格 regularize，从而缓解信号爆炸/消失（vanishing/exploding）。
  3. 跨层复合仍然稳定（乘法封闭性）
    双随机矩阵相乘仍是双随机矩阵（非负性与行列和约束都能传递），因此“多层连乘”不会越乘越野，守恒性可以贯穿整个深度。

翻译成咱老百姓的话就是：

每一层的混合矩阵，本质上像是在“若干种换道方案（置换）”之间做概率意义上的加权选择。这就特别像一个“带守恒约束的交通路由系统”：怎么换道都行，但总车流不能凭空变多或变少。

另外，mHC 还对前后残差引入非负约束（论文用 sigmoid 形式实现），避免正负系数复合导致的数值抵消行为。

05｜把“野矩阵”投影成“双随机矩阵”

“利用 Sinkhorn-Knopp 算法将连接矩阵约束在双拟随机矩阵流形上”，这里的核心是这一步：

- 1. 先让矩阵元素变成严格正数
  2. 然后反复做两件事：
    - 归一化每一行（让行和=1）
    - 归一化每一列（让列和=1）
      行列交替迭代，最终收敛到双随机结构。

你可以把所谓 Sinkhorn-Knopp 过程想象成一个“交警训练营”：
不管你原来学出来的“交警”矩阵多么放飞自我，进训练营一套队列动作做完，它就必须满足“行列守恒”的硬纪律，才能上岗指挥交通。

关于“流形”（manifold）这个术语，可以这样理解：
严格说双随机矩阵集合整体是个凸多胞形（边界有棱角），但在其内部（所有元素严格正）可以视为一个受约束的光滑空间；论文在工程语境里用“manifold”来表达“我们不让参数在整个欧氏空间乱跑，而是限制在一个有几何结构的可行集合里”。

06｜它不仅是数学，更是工程：6.7% 的代价换稳定与收益

把残差流扩成 n 倍，直觉上显存与通信都会爆炸。mHC 论文非常明确地把“系统开销”当作同等重要目标：它不仅提出数学约束，也在配套工程上做了 kernel fusion、选择性重计算、以及在 DualPipe 调度里更激进的通信-计算重叠。

最后他们给出的系统级结论是：当 n = 4 时，mHC 只带来约 6.7% 的额外训练时间开销。

这点很关键：

如果只讲“理论上更稳”，我们会问“那是不是贵得用不起？”
而这篇论文显然在回答：“我们把它做成了大训练里可落地的结构升级。”

07｜一句话总结：mHC 的创新意义在哪？

HC 想把残差从单车道升级成立交桥；mHC 做的，是给立交桥加上守恒型交通规则——用双随机约束恢复 identity mapping 的稳定性，同时把工程开销压到可接受范围。

这也解释了下列对应关系：

残差的多流并行架构：残差流从 C 变成 n×C，让“通道”更多；
连接矩阵受约束：核心是残差不再自由，而是双随机；
Sinkhorn-Knopp：实现“投影/归一化”的具体算法；
解决数值不稳定与信号爆炸：把跨层连乘的放大链条关进“守恒笼子”

残差之所以稳，不是因为“加法神奇”，而是因为它隐含了某种守恒结构；
当我们试图把残差升级成更复杂的拓扑时，真正需要被继承的，是这份守恒，而不是加号本身。

DS原始论文：arXiv：mHC: Manifold-Constrained Hyper-Connections

立委关于大模型与AI的博客汇总