《立委关于大模型与AI的博客汇总》

立委按：一辈子从事NLP/AI工作，已经习惯于在自己的博客频道持续写笔记，记下一路走来的观察和体会。所写貌似科普，但实际上不是为了迎合大众或普惠天下，根本动因还是为自己留下足迹，其次才是与亲友、同人、后学分享。大模型爆发是个分水岭。爆发前的博客集中在NLP的方方面面，大多是符号逻辑路线在自然语言文法方面的挣扎与进展。爆发后也没闲着，在这个有如寒武纪生物大爆发一样的让人眼花缭乱的世界，兴奋与刺激大于焦虑和恐怖，于是一路紧随，只问耕耘。现不揣拙陋，结集于此，定时更新，留下这个时代一位老兵的视界。

多年来，一直在探索如何在技术术语与老百姓“人话”之间做丝滑无缝的平衡艺术：既想让一般大学生大体都能看懂个大概，又不想失去技术严谨性。老少咸宜的本意不是老少都能看到完全一样的内容，那是不可能的，每个对象的教育和知识背景都不同。作者所要做的是，尽可能让不同背景的人都能看到自己能看懂，并且感觉有收益的那部分。内容正确之余，关键在可读，所以才有种种的比喻和修辞。但比喻总容易跛脚，所以就穿插技术术语及其数学解释来锚定科学内容的正确性主轴，就好像“残差”主干道一样。最终有没有硬伤，有些话题还是有担心，不过，科普博客的好处是，可以随时迭代更新。发现不足或错误，随时可改。虽然做了努力，有些硬核科研还是不容易真正做到科普。算是知其不可为而为之的一种爱好吧。

【立委NLP频道】

When Agents Become the Default Gateway, Will the Operating System Be Rewritten?

When Agents Become the Default Gateway, Does the App Store Model Collapse?

The Great Software Shake-Up of the Agent Era — Starting with OpenClaw

Some Basic Agentic AI terminology

OpenClaw as a case study of the coming Agentic AI era

Agent 时代的临界点：谈谈 OpenClaw 的安全隐患

Agent 时代的一些术语澄清

当 Agent 成为默认入口，App Store 模式是否崩塌？

当 Agent 成为默认入口，操作系统会不会被重写？

Agent 时代的软件产业大洗牌：从 OpenClaw谈起

2026年智能体范式大爆发：从认知幻象到工业化协同

腾讯科技春节访谈，Agent 这一年：沸沸扬扬之后

多模态大模型输入信号的离散化

The Removal of Autopilot: A Misjudgment of Trust, Pricing Power, and Timing

Autopilot 被剥离: 一次关于信任与定价权的误判

自动驾驶已经解决了，但我们还没准备好告别驾驶

How FSD Quietly Took Control of Pricing Power

If Robotaxi Fails, This Is Where It Will Fail

FSD 会拯救“最不被保险欢迎的人”

保险降价，是自动驾驶第一次“自证盈利模型”

如果 FSD 真的会失败，特斯拉最可能栽在哪里？

Insurance Voted First Why FSD 13 / 14 / 15 May Reprice the Entire Mobility Industry

从 FSD 13 到 Unsupervised（F15）：自动驾驶如何穿透保险、监管与商业模式

自动驾驶监管过度，实质是一种间接杀人

多少牛人陷入大模型的认知茧房？

从 “Fake It” 到 “Vibe It”

耳机是你的贴身陪伴吗

从open ai 主打的耳后AI耳机谈起

全双工到天花板的豆包

FSD + Grok：超人老司机，带着“实习导游”上路

梁文峰团队的 mHC 研究在做什么

从“眼球 + SaaS”到“大模型商业”

2025 AGI 编年史：从范式革命到商业黎明

AI Reflections on 2025

2025 年 AI 感怀

正常的模型反哺不会导致模型坍塌

多模态进化论：从“看图说话”到“原生直觉”

大模型训练的数据“炼金术”

再论大模型压缩的“有损”与“无损”

大模型是无损压缩还是有损压缩，李飞飞与伊利亚谁是对的？

视频语义检索怎么回事

GPT非监督学习到底怎么就学会了各种监督任务呢？

The Chain Rule: The Mathematical Guarantee Behind Backpropagation

Backpropagation: The Key to Deep Neural Networks

链式法则：反向传播能work的数学保证

反向传播：深层神经网络的钥匙

CNN与RNN——让机器学会看与听

自学习是思想革命，Transformer是工程火箭

从高级语言的基本逻辑装置到图灵机的编译

尼克讲座第二弹：语言=思维=智能=计算=图灵机？

小科普：图灵机是怎么工作的？

Multimodal tokens and the Case for Unified Modeling

谈谈大一统模型的万象token与统一建模的背后

Neural Codec: Key Audio Techniques in the LLM Era

Breakthroughs in Speech Technology in the Era of Large Models: Ultra-Realism and Full Duplex

大模型时代的语音技术突破：超写实和全双工

说说神经 codec，大模型时代的音频技术要点

跨模态连接器范式：谷歌模型Flamingo回顾

图文对齐的关键一跃：CLIP 回顾

Attention Collapse: The Misunderstood Truth About “Rank”

注意力塌缩：关于“秩”的误会与真相

超长上下文，是能力突破，还是数字游戏？

BERT 双向 vs. GPT 单向与“低秩之虑”

自监督学习的两大模型，为什么GPT跑赢了BERT成为王者？

Is the World Material or Informational?

“宇宙操作系统”：世界是怎么搭建的？

AI 的威胁：不是恶意，而是作用链

一个日常生活真实需求的 Deep Research 案例

老友访谈：AI对工作市场的影响

从 Suno 看 AIGC 艺术民主化大潮

狼来了，狼来了，“奇点”狼这次是真要来了吗？

notebookLM赋能：隐藏推理，大模型推理模型的新动向

Is Thinking Equal to Language?

思维等于语言吗??

Demystifying the misconception of "Lossless Compression as Intelligence"

破除“无损压缩即智能”的迷思

GPT and the Art of Compression

Efficiency vs. Reliability: The Compression Tightrope

Arithmetic Coding for GPT’s Compression Engine

Navigating the Probability Universe with GPT

Is GPT Compression Lossless or Lossy? The Truth Revealed

GPT as a Cosmic Librarian: Unlocking Lossless Compression

与尼克等老友唠大模型压缩理论

GPT作为序列数据的无损压缩器

要区分GPT训练中的压缩，与拿GPT当压缩器工具

信息论科普：GPT对给定序列无损压缩的最终区间

GPT无损压缩小问答（3）：算术编码

信息论科普：香农极限（Shannon Limit）

GPT无损压缩小问答（2）：为什么说GPT是无损压缩？

GPT无损压缩小问答（1）：高压缩率导致系统脆弱

像素值是“连续变量”，还是工程上的伪装？

Yann LeCun 所鼓吹的「世界模型」与GPT+Diffusion有什么不同

详述AI科学家張祥雨的大模型访谈

LLM的后训练强化学习是怎么工作的

大模型科普：探秘莎翁风格的诞生之旅（无代码版）

揭秘GPT内核之四

从零实现莎士比亚风 GPT科普解说

从0实现并理解GPT

解读EMPO全程无监督推理新范式

立委科普：揭秘AI创作视频的两种“神功”

非量化自回归视频生成模型NOVA的技术路线

生成式AI的两条视频生成路线（文献综述）

MCP：从“伪繁荣”到可落地的进化路线

中文分词的前世今生

大模型如何解锁AI各种任务成为通用引擎的？

Grok: 大力出奇迹的背后

Grok：超大数据的大模型为何能收敛？

《“蜜蜂巢”里的子弹：JFK档案解密后》

2025年肯尼迪遇刺档案解密揭示的惊人真相

2025年肯尼迪遇刺案档案解密

Gemini Deep Research：用“Logits Lens”洞察神经网络的奥秘

Sonnet3.7: 推理大模型的挑战与前景（图文版）

数学圆舞曲：欧拉恒等式（配乐诗朗诵）

检索增强（RAG）与窗口数据的互补性 (图文版）

检索增强（RAG）与窗口数据的互补性

关于颈椎病，大模型医疗建议靠谱吗？

人类 vs 恐龙：一场关于“不作不死”的滑稽短剧

deep research: 最新颈椎病手术指征与治疗概览

Xiao Hong Red：肖弘其人

万字长文解析 LLM-native Agent 及其混合计算方式

o3 deep research: LLM 驱动的 Agent 综述

Agent：数字代理的崛起与未来

Agent元年：从聊天机器人到数字员工的当代进化史

生成式AI学习中容易混淆的几个术语

思维链是大模型的符号神助攻

再谈自然模态数据是高维空间的低维流形

深度学习的局限性研究综述

o3 deep research: 深度学习局限性研究报告

深度学习的基石：多层感知机

o3 Deep Research: DeepSeek R1 多阶段训练流程问答解析

RPA 赛道与大模型Copilots早期创业者的困局

Transformer 和注意力机制简介

立委科普：如何理解自注意力机制中的QKV分工？

语言学家应该很容易理解自注意力机制

《立委科普：自注意力机制解说》

DeepSeek 笔记：推理新范式 query+cot+answer 支持新的 scaling law 吗？

DeepSeek 笔记：R1 部署阶段的推理机制

从R1幻觉谈起，大模型幻觉是缺陷还是创意火花？

推理强化学习是端到端的监督，推理过程的非监督

DeepSeek 风暴下看看它的论文

大模型风云诡谲的下半场：scaling 失效？

给奶奶讲一下AI最新物种“大模型代理”

左脚踩右脚可以飞吗，谈交替使用监督微调和强化学习的后训练

DeepSeek爆火真相：不靠“人盯”，让AI自己学会慢思考

人类反馈是超级智能的桎梏吗？

马毅教授的演讲，值得一听

马毅教授称，已经揭开完全揭开神经网络的面纱

NLP老司机的AIGC旅程

创业邦深圳会议演讲笔记：推动AIGC商业落地，出门问问的「产模结合」实践

立委论LLM：什么是AI刚需

辣妈3笔记以及辣妈MV与辣妈3.1传奇

符号主义被打入冷宫太久了，难道神经是AI的终结者吗？

DeepSeek R1：《少年DS之烦恼》

告诉李雪琴一个激发写段子灵感的秘诀：找deepseek R1

大模型三阶段的 scaling laws 接力赛

视觉模型生成的极限对齐

解耦才能解套：再谈视频中的人物一致性问题

挥刀董事会，OpenAI 如何解决致命难题

英伟达GTC的一小步，AI进化史的一大步

为什么说 Sora 是世界的模拟器？

立委两分钟：大模型到底有没有逻辑推理能力？

介绍尼克的最新演讲，探寻大模型的理论基础与渊源（中文版，英文字幕）

《AI潮流：开发者提示工程公开课中的二原则》

《飞哥说AI》深度系列

2023/12/09: 李维高佳：OpenAI狂飙生态？领域壁垒仍是大山

2023/12/09: 李志飞高佳李维：关于 Google Gemini 的八点启示

2024/02/19: 李志飞李维高佳：为什么说 Sora 是世界的模拟器？

2024/02/29: 李志飞李维高佳：万字长文解构中国如何复刻 Sora：模型架构、参数规模、数据规模、训练成本

2024/03/05: 李志飞李维：Claude 3 追平或超越 GPT-4，能归纳15万单词

2024/04/01: 李维王艺高佳：Suno 将如何进化？

2024/04/12: 高佳李维王艺「产模结合」也许是AI公司更好的出路？

2024/06/04: 李维高佳：KAN会引起大模型的范式转变吗？

2024/07/18：李维高佳：“安全智能”的背后，Ilya 究竟看到了什么？

2023-2024关于大模型及AIGC的演讲/采访

2023-03-05：源码资本AIGC“尖峰系列”，李维博士：人类语言“通天塔”建成，ChatGPT的辉煌与挑战

2023/05/09: 腾讯科技，对话产业专家：“百模大战”愈演愈烈，地球上算力不够支撑10亿人使用

2023/07/16: 轩辕之学讲座，特邀讲座《大模型的历史、现状和挑战》

2023/06/28: 中国证券报报道 360 GPT 联盟特邀演讲：李维：避免大模型行业同质化竞争深耕领域阶段有很多“细活”可做

2023/07/21: ArchSummit 全球架构师峰会主题演讲《从架构师视角谈如何迎接/拥抱大模型及其新生态》（https://blog.csdn.net/EDDYCJY/article/details/131929057）

2023/07/28: Chinajoy，中国音像与数字出版协会和上海汉威信恒展览有限公司主办，特邀演讲《AIGC时代，数字人引领内容创作新范式》

2023/08/06: 亚马逊云科技和真格基金主办的闭 “机遇与挑战——生成式AI的发展趋势和落地应用”，主题演讲《AI大模型落地的前景和痛点》

2023/08/23: 江苏师范大学主办 “大语言模型离人类语言有多远”学术研讨会特邀演讲《大模型的本性及其落地痛点》

2023/10/20: 第十一届科博会，特邀主题演讲《AI和大模型趋势》

2024年3月18：英伟达 GTC2024全球开发者大会与英伟达中国团队合作，讲演《重塑数字人互动潜能》

2024/04/22: 第十四届北京国际电影节光影未来，演讲《捕捉未来的魔术师》

2024/04/22 九派财经专访出门问问副总裁李维：两年内大模型的商业化爆发一定会发生

2023/11/11: 香蕉论坛，“百“模”大战对智能座舱发展意义与实践”，2023/12/05 汽车商业评论，《李维：大模型技术的过去、现在与未来》

2023/12/05 汽车商业评论，《李维：大模型技术的过去、现在与未来》

2024/04/22：九派财经专访出门问问副总裁李维：两年内大模型的商业化爆发一定会发生

2024/05/24: 九派财经专访出门问问副总裁李维：找产品方向是更大痛点，跑通场景是第一位

《AI浪潮博客目录：白模大战早期》

《AI浪潮：不识数的 ChatGPT》

《AI浪潮：打造中国的 ChatGPT，挑战与机会并存》

《AI浪潮：chatGPT 搞定了人类语言》

《AI浪潮：chatGPT 能写出段子吗》

《AI浪潮：chatGPT 的里程碑意义》

《AI浪潮：chatGPT 写的情书能有真情吗》

《AI浪潮：LLM 凭什么能“涌现”超级能力？》

《AI浪潮：漫谈LLM与领域对齐》

《AI浪潮：神迹与笑话齐飞，chatGPT 也是大观了》

《AI浪潮：chatGPT 帮你写应用文》

《AI浪潮：人工智能当代简史》

《AI浪潮：chatGPT 辅导精读学术论文的实验》

《AI浪潮：因为见从而信，见证奇迹的时刻》

《AI浪潮：zero shot 抽取、摘要、吟诗、阅读理解》

《AI浪潮：玩不死的 chatGPT》

《AI浪潮：关于chatGPT 的思维链能力》

《AI浪潮：n-shot 是训练还是指令》

随笔：AGI 迷思与反思

AIGC 潮流扑面而来，是顺应还是（无谓）抵抗呢？

漫谈AI 模型生成图像

图灵测试其实已经过时了

RPA 是任务执行器还是数字员工？

《深层解析符号模型与深度学习预训练模型》（修订文字版）

NLP 新纪元来临了吗？

推荐Chris Manning 论大模型，并附上相关讨论

《我看好超大生成模型的创造前途》

立委随笔：机器翻译，从学者到学员

《AI 随笔：观老教授Walid的神经网络批判有感》

《李白梁严127：神经的要害在数据瓶颈与定点纠错盲区》

《李白126：神经 attention 机制搞定代词指代的案例》

泥沙龙笔记：从乔姆斯基大战谷歌Norvig说起

《AI潮流：与 ChatGPT4 聊“买房送老公”背后的语言学》

《AI潮流：跟Andrew学如何调用 ChatGPT 做自己的服务前台》

【AI 浪潮：超级词匠 ChatGPT4 的百变文风】

【AI 浪潮：数据中心的大模型时代】

【AI 浪潮：大模型推理的细节编造是 feature，不是 bug】

两分钟谈谈：Moravec悖论

两分钟谈一下啊：模型训练的内推与外推

两分钟短评：大模型开始进入平台期吗？

悲观主义的视角，人类的宿命

以前的杂记，关于AGI、马斯克、奥特曼和OpenAI

语言是大一统模型里的核心和主线

AIGC时代，关于鲁迅大脑的复活

小雅系列：短视频文案

大模型短视频系列：大模型压缩与白马非马

AIGC 作品

【唐诗300首 AIGC 配乐：白居易琵琶行】

【唐诗300首 AIGC 配乐：李商隐无题】

【唐诗300首 AIGC 配乐：杜甫春望】

AIGC Suno：英烈颂

AI创作花絮: 《影月无痕》

大模型的落地现状和前景

大模型漫谈系列n

图片一键生成短视屏，奇妙元是时间的摄像机

奇妙元体验AIGC奇妙：《岁月如歌：神秘园》

立委微信视频号

大模型科普系列1
系列2 知识蒸馏
 系列3 自回归和扩散模型
 系列4 视频生成
 https://weixin.qq.com/sph/A523fBxLQ
https://weixin.qq.com/sph/Aw5lAfSoV
https://weixin.qq.com/sph/Af5j09VbP
https://weixin.qq.com/sph/AsK0Dk54l
https://weixin.qq.com/sph/AIanE0ocM
https://weixin.qq.com/sph/AbxoSWedA
https://weixin.qq.com/sph/AA6fqzTkO

English

How GPT Works: A Shakespearean Text Generator

MCP: From Flashy Boom to Real Usability — A Technical Deep Dive

03 deep research： Challenges and Prospects of Advanced Reasoning LLMs

Does the New Reasoning Paradigm (Query+CoT+Answer) Support a New Scaling Law?

Technical Deep Dive: Understanding DeepSeek R1's Reasoning Mechanism in Production

DeepSeek's R1 Paper: A Storm in AI LLM Circle

The Turbulent Second Chapter of Large Language Models: Has Scaling Stalled?

DeepSeek_R1 paper

Probabilistic Transformer: A Probabilistic Dependency Model for Contextual Word Representation

Introduction to Transformer and Its Attention Mechanism

Has Symbolism Been Sidelined for Too Long? Could Neural LLM terminate AI?

What did Ilya see? -- secret behind success of LLMs

Suno AIGC：Ode to Madam Hu

Nick tracing the AI history for theoretical foundation and sources （English）

Unified Models Surpass Single-modal Models (Gemini Notes 2/8)

Cross-modal Knowledge Transfer of Large Models Proven (Gemini Notes 1/8)

Decoding the New EMPO Reasoning Paradigm

A Comparative Review of Autoregressive and Diffusion Models for Video Generation

Unveiling the Two "Superpowers" Behind AI Video Creation

Decoding LLM-native Agents: Bridging Compilation and Interpretation in AI

The Three-Stage Scaling Laws Large Language Models

Technical Deep Dive: Understanding DeepSeek R1's Reasoning Mechanism in Production

Professor Ma's long paper out

Professor Ma Claims to Have Fully Unveiled the Mysteries of Neural Networks

Decoupling to Resolve: Issue of Character Consistency in Video Generation

Llama 3 Notes and Llama MV with Llama 3.1 Legend

The ChatGPT Tsunami and Its Impact on IT Landscape and New Ecosystem

《科学网》博客

从0实现并理解GPT 2025-06-04

大模型科普：探秘莎翁风格的诞生之旅（无代码版） 2025-06-03

LLM的后训练强化学习是怎么工作的 2025-06-02

EMPO强化学习项目复现Claude4学习总结 2025-05-27

解读EMPO全程无监督推理新范式 2025-05-27

Decoding the New EMPO Reasoning Paradigm 2025-05-27

Q&A on NLP: Chapter I Natural Language and Linguistic Form 2025-05-22

MeanFlow: AI图像生成的降维打击 2025-05-22

Review of Autoregressive and Diffusion Models for Video Gene 2025-05-03

Unveiling the Two "Superpowers" Behind AI Video Creation 2025-05-02

生成式AI的两条视频生成路线 2025-05-02

非量化自回归视频生成模型NOVA的技术路线 2025-05-02

立委科普：揭秘AI创作视频的两种“神功” 2025-05-02

Silicon Valley Night: A Foxy Encounter 2025-04-23

《硅谷夜记：艳遇》 2025-04-23

中文分词的前世今生 2025-03-30

大模型如何解锁AI各种任务成为通用引擎的？

Grok：大模型为什么要超大数据？（4o配图）

Grok: 大力出奇迹的背后

2025年肯尼迪遇刺案档案解密（审核未通过）

2025年肯尼迪遇刺档案解密揭示的惊人真相（审核未通过）

《“蜜蜂巢”里的子弹：JFK档案解密后》

Grok：超大数据的大模型为何能收敛？

Gemini Deep Research：用“Logits Lens”洞察神经网络的奥秘

检索增强（RAG）与窗口数据的互补性 (图文版）

03 deep research： Challenges and Prospects of Advanced Reaso

Sonnet3.7: 推理大模型的挑战与前景（图文版）

数学圆舞曲：欧拉恒等式（配乐诗朗诵）

人类 vs 恐龙：一场关于“不作不死”的滑稽短剧

deep research: 最新颈椎病手术指征与治疗概览

关于颈椎病，大模型医疗建议靠谱吗？

给奶奶讲一下AI最新物种“大模型代理”

Decoding LLM-native Agents: Bridging Compilation and Interpr

The Agent Era: The Contemporary Evolution from Chatbots to D

o3 deep research: 智能体的应用和演进

万字长文解析 LLM-native Agent 及其混合计算方式

Xiao Hong Red：肖弘其人

Agent元年：从聊天机器人到数字员工的当代进化史

Agent：数字代理的崛起与未来

o3 deep research: LLM 驱动的 Agent 综述

【外一篇：推理范式演进中的概念】

生成式AI学习中容易混淆的几个术语

思维链是大模型的符号神助攻

再谈自然模态数据是高维空间的低维流形

The Three-Stage Scaling Laws Large Language Models

大模型三阶段的 scaling laws 接力赛

Fundamental Limitations of Deep Learning: Origins in Data-Driven...

深度学习的局限性研究综述

o3 deep research: 深度学习局限性研究报告

左脚踩右脚可以飞吗，谈交替使用监督微调和强化学习的后训练

o3 Deep Research: DeepSeek R1 多阶段训练流程问答解析

Dilemma of RPA and Early-Stage LLM Co-pilot Entrepreneurs

RPA 赛道与大模型Co-pilots早期创业者的困局

Linguists Should Find Self-Attention Intuitively Familiar

语言学家应该很容易理解自注意力机制

符号主义被打入冷宫太久了，难道神经是AI的终结者吗？

Has Symbolism Been Sidelined for Too Long?

如何理解自注意力机制中的QKV分工？

Transformer 和注意力机制简介

DeepSeek: Learning to Think Slowly Without Human Supervision

DeepSeek爆火真相：不靠“人盯”，让AI自己学会慢思考

Reasoning Paradigm (Query+CoT+Answer) Support scaling law?

Understanding DeepSeek R1\'s Reasoning

DeepSeek 笔记：R1 部署阶段的推理机制

DeepSeek 笔记：推理新范式 query+cot+answer 支持新的 scaling law 吗？

Hallucinations in AI: Bug or Feature? A Deep Dive into DeepSeek

从R1幻觉谈起，大模型幻觉是缺陷还是创意火花？

推理强化模型中思维链的本质

R1: 《立委列传》

王菲春晚《世界赠予我的》歌词，亮点与短板

推理强化学习是端到端的监督，推理过程的非监督

RL: Supervised Outcomes, Unsupervised Processes

DeepSeek R1：《少年DS之烦恼》

告诉李雪琴一个激发写段子灵感的秘诀：找deepseek R1

DeepSeek 风暴下看看它的论文

DeepSeek's R1 Paper: A Storm in AI LLM Circle

The Turbulent Second Chapter of Large Language Models

大模型风云诡谲的下半场：scaling 失效？

Professor Ma\'s long paper out

马毅教授的演讲，值得一听

NLP老司机的AIGC旅程

解耦才能解套：再谈视频中的人物一致性问题

马毅教授称，已经揭开完全揭开神经网络的面纱

人形机器人大热，但看不到商业闭环

推动AIGC商业落地，出门问问的「产模结合」实践

转述老领导的硅谷风投现状和展望的分享

视觉模型生成的极限对齐

立委论LLM：什么是AI刚需

立委论LLM：视频生成的人物一致性问题

《AIGC图生视频：牵手》

《朝华之十九：牵手》

UBI 势在必行

姑蘇胡氏哀辭（AI作词作曲）

短视频：大模型奥秘

大模型的理论奥秘

Nick traching the AI history for LLM theoretical foundation

大模型以来，觉得可以留个记录

《谈两种复杂度》短视频科普

《介绍监督学习的数学原理》短视频科普

《谈谈端到端和大模型》短视频

古典诗词AI配乐集锦

【唐诗300首 AIGC 配乐：白居易琵琶行】

两分钟短评：大模型开始进入平台期吗

悲观主义的视角，人类的宿命

两分钟谈：模型训练的内插、外插

两分钟谈谈：Moravec悖论

就《Suno: 望震》与音乐大家的对话

Suno：《宋輝：人生笑话》-- 献给插队一代人（审核未通过）

Tanya's Childhood 2: American nursery rhymes

写在巴别塔建成周年纪念日

李名杰：医学论文集（41）：老爸的故事（代后记）

李名杰：医学论文集（40）：纪念专辑 - 影集3

李名杰：医学论文集（39）：纪念专辑 - 影集2

李名杰：医学论文集（38）：纪念专辑 - 影集1

Debriefing report My career as surgeon The Tireless Father (Preface) COLLECTED WORKS IN COMMEMORATION OF MINGJIE LI’S CAREER 大模型短视频系列：大模型压缩与白马非马

AI创作花絮: 《月影双剑》

数字人形象设计：为什么选她？

大模型的落地现状和前景

大模型漫谈系列n

喜欢刀郎，也喜欢那英

奇妙元体验AIGC奇妙：《岁月如歌：神秘园》

《AI浪潮：辛顿的 AI 威胁论与马斯克如出一辙》

《AI潮流：跟Andrew学如何调用 ChatGPT 做自己的服务前台》

《AI潮流：与 ChatGPT4 聊“买房送老公”背后的语言学》

《AI潮流：开发者提示工程公开课中的二原则》

【AI 浪潮：超级词匠 ChatGPT4 的百变文风】

【AI 浪潮：自主性是人类智能的最后堡垒吗】

【AI 浪潮：GPT-4 的上下文逻辑与常识还是不够稳固】

【AI 浪潮：数据中心的大模型时代】

快讯：腾讯科技AI未来指北系列今天直播间与鲁总唠一唠大模型（LLM）

【劳碌命论LLM：大模型推理的细节编造是 feature，不是 bug】

AIGC“尖峰系列”丨李维博士：ChatGPT海啸狂飙，谁将被取代？

ChatGPT Tsunami and Its Impact on IT Landscape and Ecosystem

AIGC“尖峰系列”丨李维博士：人类语言“通天塔”建成，ChatGPT的辉煌与挑战

[转载]与ChatGPT相关……码脑 | 张宏江、李维等顶级大咖齐聚，AIGC系列分享

《AI浪潮博客目录》

《AI浪潮：不识数的 ChatGPT》

《AI浪潮：打造中国的 ChatGPT，挑战与机会并存》（审核未通过）

《AI浪潮：chatGPT 搞定了人类语言》

《AI浪潮：chatGPT 写的情书能有真情吗》

《AI浪潮：chatGPT 能写出段子吗》

《AI浪潮：chatGPT 的里程碑意义》

《AI浪潮：LLM 凭什么能“涌现”超级能力？》

《AI浪潮：漫谈LLM与领域对齐》

《AI浪潮：神迹与笑话齐飞，chatGPT 也是大观了》

《AI浪潮：chatGPT 帮你写应用文》

《AI浪潮：人工智能当代简史》

《AI浪潮：chatGPT 辅导精读学术论文的实验》

《AI浪潮：因为见从而信，见证奇迹的时刻》

《AI浪潮：玩不死的 chatGPT (之一)》

《AI浪潮：玩不死的 chatGPT (之二)》

《AI浪潮：关于chatGPT 的思维链能力》

AGI 迷思与反思

《AI浪潮：n-shot 是训练还是指令》

AIGC 潮流扑面而来，是顺应还是（无谓）抵抗呢？

美术新时代，视频展示

漫谈AI 模型生成图像

【缅怀刘倬先生特别系列】

送别恩师刘倬先生

一代宗师刘倬先生千古！（1933-2022）

《李白宋梁130：从短语结构的词序基础约束到大模型向量空间的天马行空》

AI 正在不声不响渗透我们的生活

RPA 是任务执行器还是数字员工？

图灵测试其实已经过时了

《立委科普：自注意力机制解说》

《深层解析符号模型与深度学习预训练模型》（修订文字版）

NLP 新纪元来临了吗？

【随感：大数据时代的信息茧房和“自洗脑”】

推荐Chris Manning 论大模型，并附上相关讨论

《我看好超大生成模型的创造前途》

我的前老板的企业家创业访谈

[转载]编译 Gary Marcus 最新著述：《深度学习正在撞南墙》

老司机谈NLP半自动驾驶，欢迎光临。

立委随笔：机器翻译，从学者到学员

立委随笔：上网课也可以上瘾吗？

立委NLP频道（前大模型时代其他系列）

李维郭进《自然语言处理答问》，商务 2020

《李白对话录》

【置顶：立委NLP博文一览】(前大模型时代符号逻辑)

立委微博的存在

立委NLP《关于系列》

《朝华午拾》电子版

《李家大院》电子版

《李老夫子遗墨》电子版

《小城青葱岁月》电子版

《江城记事》电子版

【李名杰从医67年论文专辑】（电子版）

【李名杰从医67年论文专辑（英语电子版）】

发布者

立委

立委博士，多模态大模型应用咨询师。出门问问大模型团队前工程副总裁，聚焦大模型及其AIGC应用。Netbase前首席科学家10年，期间指挥研发了18种语言的理解和应用系统，鲁棒、线速，scale up to 社会媒体大数据，语义落地到舆情挖掘产品，成为美国NLP工业落地的领跑者。Cymfony前研发副总八年，曾荣获第一届问答系统第一名（TREC-8 QA Track），并赢得17个小企业创新研究的信息抽取项目（PI for 17 SBIRs）。查看立委的所有文章

发表回复

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理。