置顶:《立委关于大模型与AI的科学网博客汇总》

Autopilot 被剥离: 一次关于信任与定价权的误判

2026-1-28 10:33

自动驾驶已经解决了,但我们还没准备好告别驾驶

2026-1-28 10:06

How FSD Quietly Took Control of Pricing Power

2026-1-26 19:36

If Robotaxi Fails, This Is Where It Will Fail

2026-1-26 19:33

保险降价,是自动驾驶第一次“自证盈利模型”

2026-1-26 15:18

FSD 会拯救“最不被保险欢迎的人”

2026-1-26 15:13

如果 FSD 真的会失败,特斯拉最可能栽在哪里?

2026-1-26 05:59

Insurance Voted First Why FSD 13 / 14 / 15 May Reprice the E

2026-1-26 05:58

从 FSD 13 到 Unsupervised(F15):自动驾驶如何穿透保险、监管与商业模式

2026-1-26 05:18

多少牛人陷入大模型的认知茧房?

2026-1-23 14:51

从open ai 主打的 耳后AI耳机谈起

2026-1-23 14:47

耳机是你的贴身陪伴吗

2026-1-23 11:39

从 “Fake It” 到 “Vibe It”

2026-1-23 11:37

全双工到天花板的豆包

2026-1-3 22:40

FSD + Grok:超人老司机,带着“实习导游”上路

2026-1-3 11:02

梁文峰团队的 mHC 研究在做什么

2026-1-2 18:22

AI 编年史:公元 2025

2026-1-2 18:20

从“眼球 + SaaS”到“大模型商业”

2026-1-2 18:16

AI Reflections on 2025

多模态进化论:从“看图说话”到“原生直觉”

2025-12-18 12:49

正常的模型反哺不会导致模型坍塌

2025-12-18 12:45

2025 年 AI 感怀

2025-12-18 12:43

大模型训练的数据“炼金术”

热度 1 2025-12-16 01:06

再论大模型压缩的“有损”与“无损”

2025-11-24 14:30

大模型是无损压缩还是有损压缩,李飞飞与伊利亚谁是对的?

2025-11-24 11:47

GPT非监督学习到底怎么就学会了各种监督任务呢?

2025-11-10 15:27

自学习是思想革命,Transformer是工程火箭

2025-11-8 08:27

CNN与RNN——让机器学会看与听

2025-11-8 08:26

Backpropagation: The Key to Deep Neural Networks

2025-11-8 08:25

The Chain Rule: The Mathematical Guarantee Behind Backpropag

2025-11-8 08:24

链式法则:反向传播能work的数学保证

2025-11-8 08:23

反向传播:深层神经网络的钥匙

2025-11-8 08:22

从高级语言的基本逻辑装置到图灵机的编译

2025-9-19 10:16

小科普:图灵机是怎么工作的?

2025-9-19 10:13

尼克讲座第二弹:语言=思维=智能=计算=图灵机?

2025-9-19 10:10

Breakthroughs in Speech Technology in the Era of Large Model

2025-9-14 11:07

Neural Codec: Key Audio Techniques in the LLM Era

2025-9-14 11:06

 大模型时代的语音技术突破:超写实和全双工

2025-9-13 01:37

说说神经 codec,大模型时代的音频技术要点

2025-9-12 17:25

跨模态连接器范式:谷歌模型Flamingo回顾

2025-9-3 09:39

图文对齐的关键一跃:CLIP 回顾

2025-9-3 09:37

 注意力塌缩:关于“秩”的误会与真相

2025-8-30 12:03

BERT 双向 vs. GPT 单向与“低秩之虑”

2025-8-28 10:22

自监督学习的两大模型,为什么GPT跑赢了BERT成为王者?

2025-8-23 14:02

Is the World Material or Informational?

2025-8-19 11:33

AI 的威胁:不是恶意,而是作用链

2025-8-18 18:13

一个日常生活真实需求的 Deep Research 案例

2025-8-9 04:19

老友访谈:AI对工作市场的影响 (审核未通过)

2025-8-4 12:43

从 Suno 看 AIGC 艺术民主化大潮

2025-8-3 02:03

狼来了,狼来了,“奇点”狼这次是真要来了吗?

2025-8-1 12:48

notebookLM赋能:隐藏推理,大模型推理模型的新动向

2025-7-31 10:33

思维等于语言吗??

2025-7-25 12:53

Is Thinking Equal to Language?

2025-7-25 12:52

GPT作为序列数据的无损压缩器

2025-7-8 14:04

与尼克等老友唠大模型压缩理论

2025-7-8 14:02

破除“无损压缩即智能”的迷思

2025-7-8 14:00

Demystifying the misconception of "Lossless Compression as I

2025-7-8 13:58

要区分GPT训练中的压缩,与拿GPT当压缩器工具

2025-7-7 03:21

信息论科普:GPT对给定序列无损压缩的最终区间

2025-7-7 03:19

信息论科普:香农极限(Shannon Limit)

2025-7-7 03:17

 

GPT无损压缩小问答(3):算术编码

2025-7-7 03:16

 

GPT无损压缩小问答(2):为什么说GPT是无损压缩?

2025-7-7 03:14

 

GPT无损压缩小问答(1): 高压缩率导致系统脆弱

2025-7-7 03:13

 

Yann LeCun 所鼓吹的「世界模型」与GPT+Diffusion有什么不同

2025-6-22 02:08

 

像素值是“连续变量”,还是工程上的伪装?

2025-6-22 02:01

 

从0实现并理解GPT

2025-6-4 00:43

 

大模型科普:探秘莎翁风格的诞生之旅(无代码版)

2025-6-3 15:32

 

LLM的后训练强化学习是怎么工作的

2025-6-2 10:26

从0实现并理解GPT (审核未通过)

2025-6-1 03:08

从零实现莎士比亚风 GPT科普解说 (审核未通过)

2025-6-1 03:07

 

大模型科普:探秘莎翁风格的诞生之旅(无代码版) (审核未通过)

2025-6-1 03:05

 

解读EMPO全程无监督推理新范式

2025-5-27 14:08

 

Decoding the New EMPO Reasoning Paradigm

2025-5-27 14:07

T

MeanFlow: AI图像生成的降维打击

2025-5-22 19:15

 

Review of Autoregressive and Diffusion Models for Video Gene

2025-5-3 04:02

Unveiling the Two "Superpowers" Behind AI Video Creation

2025-5-2 12:49

 

非量化自回归视频生成模型NOVA的技术路线

2025-5-2 11:11

 

立委科普:揭秘AI创作视频的两种“神功”

2025-5-2 11:09

中文分词的前世今生

热度 2 2025-3-30 12:57

 大模型如何解锁AI各种任务成为通用引擎的?

热度 2 2025-3-29 12:36

Grok:大模型为什么要超大数据?(4o配图)

2025-3-28 06:14

 

Grok: 大力出奇迹的背后

2025-3-28 06:10

 

 

《“蜜蜂巢”里的子弹:JFK档案解密后》

2025-3-27 06:37

Grok:超大数据的大模型为何能收敛?

热度 1 2025-3-27 06:34

Gemini Deep Research:用“Logits Lens”洞察神经网络的奥秘

2025-3-23 14:22

 

检索增强(RAG)与窗口数据的互补性 (图文版)

热度 1 2025-3-20 18:09

 

03 deep research: Challenges and Prospects of Advanced Reaso

2025-3-20 18:04

 

Sonnet3.7: 推理大模型的挑战与前景(图文版)

2025-3-20 17:57

 

数学圆舞曲:欧拉恒等式(配乐诗朗诵)

2025-3-20 03:27

 

人类 vs 恐龙:一场关于“不作不死”的滑稽短剧

热度 1 2025-3-18 12:17

 

deep research: 最新颈椎病手术指征与治疗概览

2025-3-18 12:12

 

关于颈椎病,大模型医疗建议靠谱吗?

热度 1 2025-3-18 12:05

给奶奶讲一下AI最新物种“大模型代理”

2025-3-14 15:34

-

Decoding LLM-native Agents: Bridging Compilation and Interpr

2025-3-13 02:42

The Agent Era: The Contemporary Evolution from Chatbots to D

2025-3-13 02:38

o3 deep research: 智能体的应用和演进

2025-3-10 18:21

 

万字长文解析 LLM-native Agent 及其混合计算方式

2025-3-10 07:13

Xiao Hong Red:肖弘其人

2025-3-10 07:05

 

Agent元年:从聊天机器人到数字员工的当代进化史

热度 1 2025-3-9 00:00

 

Agent:数字代理的崛起与未来

热度 1 2025-3-8 23:56

 

 o3 deep research: LLM 驱动的 Agent 综述

热度 1 2025-3-8 23:49

 

【外一篇:推理范式演进中的概念】

 

生成式AI学习中容易混淆的几个术语

 

 

2025-3-5 17:06

 再谈自然模态数据是高维空间的低维流形

2025-3-4 09:12

The Three-Stage Scaling Laws Large Language Models

2025-3-3 15:06

大模型三阶段的 scaling laws 接力赛

2025-3-3 10:59

Fundamental Limitations of Deep Learning: Origins in Data-Dr

2025-3-3 04:29

深度学习的局限性研究综述

热度 1 2025-3-3 02:31

o3 deep research: 深度学习局限性研究报告

热度 1 2025-3-3 02:26

左脚踩右脚可以飞吗,谈交替使用监督微调和强化学习的后训练

2025-2-28 05:22

o3 Deep Research: DeepSeek R1 多阶段训练流程问答解析

2025-2-28 04:27

 RPA 赛道与大模型Co-pilots早期创业者的困局

2025-2-27 12:31

Linguists Should Find Self-Attention Intuitively Familiar

2025-2-25 02:14

语言学家应该很容易理解自注意力机制

热度 1 2025-2-24 17:49

符号主义被打入冷宫太久了,难道神经是AI的终结者吗?

2025-2-24 02:00

Has Symbolism Been Sidelined for Too Long?

2025-2-24 01:59

如何理解自注意力机制中的QKV分工?

2025-2-21 05:31

Transformer 和注意力机制简介

2025-2-21 05:25

DeepSeek: Learning to Think Slowly Without Human Supervision

2025-2-16 01:03

 DeepSeek爆火真相:不靠“人盯”, 让AI自己学会慢思考

热度 2 2025-2-15 11:01

Reasoning Paradigm (Query+CoT+Answer) Support scaling law?

2025-2-14 23:29

Understanding DeepSeek R1\'s Reasoning

2025-2-14 14:10

DeepSeek 笔记:R1 部署阶段的推理机制

2025-2-14 08:52

DeepSeek 笔记:推理新范式 query+cot+answer 支持新的 scaling law 吗?

2025-2-14 08:49

 

Hallucinations in AI: Bug or Feature? A Deep Dive into DeepS

2025-2-10 03:05

 从R1幻觉谈起,大模型幻觉是缺陷还是创意火花?

2025-2-10 02:17

 

 推理强化模型中思维链的本质

热度 2 2025-2-8 04:11

 

R1: 《立委列传》

2025-2-6 03:14

 推理强化学习是端到端的监督,推理过程的非监督

热度 1 2025-2-1 14:00

 

RL: Supervised Outcomes, Unsupervised Processes

2025-2-1 13:58

 

DeepSeek R1:《少年DS之烦恼》

2025-1-31 03:04

告诉李雪琴一个激发写段子灵感的秘诀:找deepseek R1

2025-1-30 23:12

DeepSeek 风暴下看看它的论文

2025-1-27 23:58

DeepSeek\'s R1 Paper: A Storm in AI LLM Circle

2025-1-27 23:56

The Turbulent Second Chapter of Large Language Models

2024-9-9 05:31

大模型风云诡谲的下半场:scaling 失效?

2024-9-8 08:25

Professor Ma\'s long paper out

2024-9-6 00:35

马毅教授的演讲,值得一听

2024-9-5 22:09

NLP老司机的AIGC旅程

2024-9-4 22:40

解耦才能解套:再谈视频中的人物一致性问题

2024-9-2 18:27

马毅教授称,已经揭开完全揭开神经网络的面纱

2024-9-1 17:45

人形机器人大热,但看不到商业闭环

2024-9-1 07:14

推动AIGC商业落地,出门问问的「产模结合」实践

2024-8-31 07:17

转述老领导的硅谷风投现状和展望的分享

2024-8-31 05:54

视觉模型生成的极限对齐

2024-8-28 08:15

立委论LLM:什么是AI刚需

2024-8-28 07:46

立委论LLM:视频生成的人物一致性问题

2024-8-28 07:13

UBI 势在必行

2024-7-5 07:43

姑蘇胡氏哀辭(AI作词作曲)

2024-7-1 14:33

短视频:大模型奥秘

2024-6-28 15:41

大模型的理论奥秘

2024-6-26 19:28

Nick traching the AI history for LLM theoretical foundation

2024-6-26 17:07

大模型以来,觉得可以留个记录

2024-6-23 15:37

《谈两种复杂度》短视频科普

2024-6-20 09:26

《介绍监督学习的数学原理》短视频科普

2024-6-20 05:07

《谈谈端到端和大模型》短视频

2024-6-17 00:53

古典诗词AI配乐集锦

2024-6-5 10:08

【唐诗300首 AIGC 配乐: 白居易 琵琶行】

2024-6-2 07:35

两分钟短评:大模型开始进入平台期吗

2024-5-20 18:11

悲观主义的视角,人类的宿命

2024-5-20 18:10

两分钟谈:模型训练的内插、外插

2024-5-20 18:07

两分钟谈谈:Moravec悖论

2024-5-20 18:05

就《Suno: 望震》与音乐大家的对话

2024-4-5 19:14

 

Suno:《宋輝:人生笑话》-- 献给插队一代人 (审核未通过)

2024-4-5 19:12

大模型短视频系列:大模型压缩与白马非马

2023-8-18 19:41

AI创作花絮: 《月影双剑》

热度 1 2023-8-17 18:26

数字人形象设计:为什么选她?

2023-8-14 15:34

大模型的落地现状和前景

2023-8-11 17:34

大模型漫谈系列n

2023-8-9 10:53

奇妙元体验AIGC奇妙:《岁月如歌:神秘园》

2023-7-11 05:54

《AI浪潮: 辛顿的 AI 威胁论与马斯克如出一辙》

热度 1 2023-5-7 23:54

《AI潮流:跟Andrew学如何调用 ChatGPT 做自己的服务前台》

2023-5-5 08:45

《AI潮流:与 ChatGPT4 聊“买房送老公”背后的语言学》

2023-5-5 08:45

《AI潮流:开发者提示工程公开课中的二原则》

2023-5-5 08:44

【AI 浪潮:超级词匠 ChatGPT4 的百变文风】

2023-5-1 22:25

【AI 浪潮:自主性是人类智能的最后堡垒吗】

2023-4-30 18:47

【AI 浪潮:GPT-4 的上下文逻辑与常识还是不够稳固】

2023-4-30 18:46

【AI 浪潮:数据中心的大模型时代】

2023-4-30 18:44

快讯:腾讯科技AI未来指北系列 今天直播间与鲁总唠一唠大模型(LLM)

2023-4-23 07:32

【劳碌命论LLM:大模型推理的细节编造是 feature,不是 bug】

2023-4-23 07:24

ChatGPT Tsunami and Its Impact on IT Landscape and Ecosystem

2023-3-8 08:27

AIGC“尖峰系列”丨李维博士:人类语言“通天塔”建成,ChatGPT的辉煌与挑战

2023-3-6 21:06

《AI浪潮:chatGPT 搞定了人类语言》

2023-2-13 01:11

发布者

立委

立委博士,多模态大模型应用咨询师。出门问问大模型团队前工程副总裁,聚焦大模型及其AIGC应用。Netbase前首席科学家10年,期间指挥研发了18种语言的理解和应用系统,鲁棒、线速,scale up to 社会媒体大数据,语义落地到舆情挖掘产品,成为美国NLP工业落地的领跑者。Cymfony前研发副总八年,曾荣获第一届问答系统第一名(TREC-8 QA Track),并赢得17个小企业创新研究的信息抽取项目(PI for 17 SBIRs)。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理