立委关于大模型与AI的博客汇总

立委NLP频道

详述AI科学家張祥雨的大模型访谈

LLM的后训练强化学习是怎么工作的

大模型科普:探秘莎翁风格的诞生之旅(无代码版)

揭秘GPT内核之四

从零实现莎士比亚风 GPT科普解说

从0实现并理解GPT

解读EMPO全程无监督推理新范式

立委科普:揭秘AI创作视频的两种“神功”

非量化自回归视频生成模型NOVA的技术路线

生成式AI的两条视频生成路线(文献综述)

MCP:从“伪繁荣”到可落地的进化路线

中文分词的前世今生

大模型如何解锁AI各种任务成为通用引擎的?

Grok: 大力出奇迹的背后(1)

Grok:超大数据的大模型为何能收敛?

《“蜜蜂巢”里的子弹:JFK档案解密后》

2025年肯尼迪遇刺档案解密揭示的惊人真相

2025年肯尼迪遇刺案档案解密

Gemini Deep Research:用“Logits Lens”洞察神经网络的奥秘

Sonnet3.7: 推理大模型的挑战与前景(图文版)

数学圆舞曲:欧拉恒等式(配乐诗朗诵)

检索增强(RAG)与窗口数据的互补性 (图文版)

检索增强(RAG)与窗口数据的互补性

关于颈椎病,大模型医疗建议靠谱吗?

人类 vs 恐龙:一场关于“不作不死”的滑稽短剧

deep research: 最新颈椎病手术指征与治疗概览

Xiao Hong Red:肖弘其人

万字长文解析 LLM-native Agent 及其混合计算方式

o3 deep research: LLM 驱动的 Agent 综述

Agent:数字代理的崛起与未来

Agent元年:从聊天机器人到数字员工的当代进化史

生成式AI学习中容易混淆的几个术语

思维链是大模型的符号神助攻

再谈自然模态数据是高维空间的低维流形

深度学习的局限性研究综述

o3 deep research: 深度学习局限性研究报告

深度学习的基石:多层感知机

o3 Deep Research: DeepSeek R1 多阶段训练流程问答解析

RPA 赛道与大模型Copilots早期创业者的困局

Transformer 和注意力机制简介

立委科普:如何理解自注意力机制中的QKV分工?

语言学家应该很容易理解自注意力机制

《立委科普:自注意力机制解说》

DeepSeek 笔记:推理新范式 query+cot+answer 支持新的 scaling law 吗?

DeepSeek 笔记:R1 部署阶段的推理机制

从R1幻觉谈起,大模型幻觉是缺陷还是创意火花?

推理强化学习是端到端的监督,推理过程的非监督

DeepSeek 风暴下看看它的论文

大模型风云诡谲的下半场:scaling 失效?

给奶奶讲一下AI最新物种“大模型代理”

左脚踩右脚可以飞吗,谈交替使用监督微调和强化学习的后训练

DeepSeek爆火真相:不靠“人盯”, 让AI自己学会慢思考

人类反馈是超级智能的桎梏吗?

马毅教授的演讲,值得一听

马毅教授称,已经揭开完全揭开神经网络的面纱

NLP老司机的AIGC旅程

创业邦深圳会议演讲笔记:推动AIGC商业落地,出门问问的「产模结合」实践

立委论LLM:什么是AI刚需

辣妈3笔记 以及辣妈MV与辣妈3.1传奇

符号主义被打入冷宫太久了,难道神经是AI的终结者吗?

DeepSeek R1:《少年DS之烦恼》

告诉李雪琴一个激发写段子灵感的秘诀:找deepseek R1

大模型三阶段的 scaling laws 接力赛

视觉模型生成的极限对齐

解耦才能解套:再谈视频中的人物一致性问题

Ilya Sutskever:你会 bet against AI 吗?

挥刀董事会,OpenAI 如何解决致命难题

英伟达GTC的一小步,AI进化史的一大步

为什么说 Sora 是世界的模拟器?

立委两分钟:大模型到底有没有逻辑推理能力?

介绍尼克的最新演讲,探寻大模型的理论基础与渊源(中文版,英文字幕)

Andrew Ng: 提示工程的课程

提示工程课程公开课

《飞哥说AI》深度系列

2023/12/09: 李维 高佳:OpenAI狂飙生态? 领域壁垒仍是大山

2023/12/09: 李志飞 高佳 李维:关于 Google Gemini 的八点启示

2024/02/19: 李志飞 李维 高佳:为什么说 Sora 是世界的模拟器?

2024/02/29: 李志飞 李维 高佳:万字长文解构中国如何复刻 Sora:模型架构、参数规模、数据规模、训练成本

2024/03/05: 李志飞 李维:Claude 3 追平或超越 GPT-4,能归纳15万单词

2024/04/01: 李维 王艺 高佳:Suno 将如何进化?

2024/04/12: 高佳 李维 王艺「产模结合」也许是AI公司更好的出路?

2024/06/04: 李维 高佳:KAN会引起大模型的范式转变吗?

2024/07/18:李维 高佳:“安全智能”的背后,Ilya 究竟看到了什么?

2023-2024关于大模型及AIGC的演讲/采访

2023-03-05:源码资本AIGC“尖峰系列”丨李维博士:人类语言“通天塔”建成,ChatGPT的辉煌与挑战

2023/05/09: 腾讯科技,对话产业专家:“百模大战”愈演愈烈,地球上算力不够支撑10亿人使用

2023/07/16: 轩辕之学讲座,特邀讲座《大模型的历史、现状和挑战

2023/06/28: 中国证券报报道 360 GPT 联盟特邀演讲:李维:避免大模型行业同质化竞争 深耕领域阶段有很多“细活”可做

2023/07/21: ArchSummit 全球架构师峰会主题演讲《从架构师视角谈如何迎接/拥抱大模型及其新生态》(https://blog.csdn.net/EDDYCJY/article/details/131929057

2023/07/28: Chinajoy,中国音像与数字出版协会和上海汉威信恒展览有限公司主办,特邀演讲《AIGC时代,数字人引领内容创作新范式

2023/08/06: 亚马逊云科技和真格基金主办的闭 “机遇与挑战——生成式AI的发展趋势和落地应用”,主题演讲《AI大模型落地的前景和痛点》

2023/08/23: 江苏师范大学主办 “大语言模型离人类语言有多远”学术研讨会特邀演讲《大模型的本性及其落地痛点》

2023/10/20: 第十一届科博会,特邀主题演讲《AI和大模型趋势》

2024年3月18:英伟达 GTC2024全球开发者大会 与英伟达中国团队合作,讲演《重塑数字人互动潜能》

2024/04/22: 第十四届北京国际电影节光影未来,演讲《捕捉未来的魔术师》

2024/04/22 九派财经专访出门问问副总裁李维:两年内大模型的商业化爆发一定会发生

2023/11/11: 香蕉论坛,“百“模”大战对智能座舱发展意义与实践”,2023/12/05 汽车商业评论,《​李维:大模型技术的过去、现在与未来

2023/12/05 汽车商业评论,《​李维:大模型技术的过去、现在与未来

2024/04/22:九派财经专访出门问问副总裁李维:两年内大模型的商业化爆发一定会发生

2024/05/24: 九派财经专访出门问问副总裁李维:找产品方向是更大痛点,跑通场景是第一位

《AI浪潮博客目录:白模大战早期》

《AI浪潮:不识数的 ChatGPT》

《AI浪潮:打造中国的 ChatGPT,挑战与机会并存》

《AI浪潮:chatGPT 搞定了人类语言》

《AI浪潮:chatGPT 能写出段子吗》

《AI浪潮:chatGPT 的里程碑意义》

《AI浪潮:chatGPT 写的情书能有真情吗》

《AI浪潮:LLM 凭什么能“涌现”超级能力?》

《AI浪潮:漫谈LLM与领域对齐》

《AI浪潮:神迹与笑话齐飞,chatGPT 也是大观了》

《AI浪潮:chatGPT 帮你写应用文》

《AI浪潮:人工智能当代简史》

《AI浪潮:chatGPT 辅导精读学术论文的实验》

《AI浪潮:因为见从而信,见证奇迹的时刻》

《AI浪潮:zero shot 抽取、摘要、吟诗、阅读理解》

《AI浪潮:玩不死的 chatGPT》

《AI浪潮:关于chatGPT 的 思维链能力 》

《AI浪潮:n-shot 是训练还是指令》

随笔:AGI 迷思与反思

AIGC 潮流扑面而来,是顺应还是(无谓)抵抗呢?

漫谈AI 模型生成图像

图灵测试其实已经过时了

RPA 是任务执行器还是数字员工?

《深层解析符号模型与深度学习预训练模型》(修订文字版)

NLP 新纪元来临了吗?

推荐Chris Manning 论大模型,并附上相关讨论

《我看好超大生成模型的创造前途》

立委随笔:机器翻译,从学者到学员

《AI潮流:与 ChatGPT4 聊“买房送老公”背后的语言学》

《AI潮流:跟Andrew学如何调用 ChatGPT 做自己的服务前台》

【AI 浪潮:超级词匠 ChatGPT4 的百变文风】

【AI 浪潮:数据中心的大模型时代】

【AI 浪潮:大模型推理的细节编造是 feature,不是 bug】

两分钟谈谈:Moravec悖论

两分钟谈一下啊:模型训练的内推与外推

两分钟短评:大模型开始进入平台期吗?

悲观主义的视角,人类的宿命

以前的杂记,关于AGI、马斯克、奥特曼和OpenAI

语言是大一统模型里的核心和主线

AIGC时代,关于鲁迅大脑的复活

小雅系列:短视频文案

大模型短视频系列:大模型压缩与白马非马

AIGC 作品

【唐诗300首 AIGC 配乐: 白居易 琵琶行】

【唐诗300首 AIGC 配乐: 李商隐 无题】

【唐诗300首 AIGC 配乐: 杜甫 春望】

AIGC Suno:英烈颂

AI创作花絮: 《影月无痕》

大模型的落地现状和前景

大模型漫谈系列n

图片一键生成短视屏,奇妙元是时间的摄像机

奇妙元体验AIGC奇妙:《岁月如歌:神秘园》

English

《科学网》博客

从0实现并理解GPT 2025-06-04
大模型科普:探秘莎翁风格的诞生之旅(无代码版) 2025-06-03
LLM的后训练强化学习是怎么工作的 2025-06-02
EMPO强化学习项目复现Claude4学习总结 2025-05-27
解读EMPO全程无监督推理新范式 2025-05-27
Decoding the New EMPO Reasoning Paradigm 2025-05-27
Q&A on NLP: Chapter I Natural Language and Linguistic Form 2025-05-22
MeanFlow: AI图像生成的降维打击 2025-05-22
Review of Autoregressive and Diffusion Models for Video Gene 2025-05-03
Unveiling the Two "Superpowers" Behind AI Video Creation 2025-05-02
生成式AI的两条视频生成路线 2025-05-02
非量化自回归视频生成模型NOVA的技术路线 2025-05-02
立委科普:揭秘AI创作视频的两种“神功” 2025-05-02
Silicon Valley Night: A Foxy Encounter 2025-04-23
《硅谷夜记:艳遇》 2025-04-23
中文分词的前世今生 2025-03-30
大模型如何解锁AI各种任务成为通用引擎的?
Grok:大模型为什么要超大数据?(4o配图)
Grok: 大力出奇迹的背后
2025年肯尼迪遇刺案档案解密 (审核未通过)
2025年肯尼迪遇刺档案解密揭示的惊人真相 (审核未通过)
《“蜜蜂巢”里的子弹:JFK档案解密后》
Grok:超大数据的大模型为何能收敛?
Gemini Deep Research:用“Logits Lens”洞察神经网络的奥秘
检索增强(RAG)与窗口数据的互补性 (图文版)
03 deep research: Challenges and Prospects of Advanced Reaso
Sonnet3.7: 推理大模型的挑战与前景(图文版)
数学圆舞曲:欧拉恒等式(配乐诗朗诵)
人类 vs 恐龙:一场关于“不作不死”的滑稽短剧
deep research: 最新颈椎病手术指征与治疗概览
关于颈椎病,大模型医疗建议靠谱吗?
给奶奶讲一下AI最新物种“大模型代理”
Decoding LLM-native Agents: Bridging Compilation and Interpr
The Agent Era: The Contemporary Evolution from Chatbots to D
o3 deep research: 智能体的应用和演进
万字长文解析 LLM-native Agent 及其混合计算方式
Xiao Hong Red:肖弘其人
Agent元年:从聊天机器人到数字员工的当代进化史
Agent:数字代理的崛起与未来
o3 deep research: LLM 驱动的 Agent 综述
【外一篇:推理范式演进中的概念】
生成式AI学习中容易混淆的几个术语
思维链是大模型的符号神助攻
再谈自然模态数据是高维空间的低维流形
The Three-Stage Scaling Laws Large Language Models
大模型三阶段的 scaling laws 接力赛
Fundamental Limitations of Deep Learning: Origins in Data-Driven...
深度学习的局限性研究综述
o3 deep research: 深度学习局限性研究报告
左脚踩右脚可以飞吗,谈交替使用监督微调和强化学习的后训练
o3 Deep Research: DeepSeek R1 多阶段训练流程问答解析
Dilemma of RPA and Early-Stage LLM Co-pilot Entrepreneurs
RPA 赛道与大模型Co-pilots早期创业者的困局
Linguists Should Find Self-Attention Intuitively Familiar
语言学家应该很容易理解自注意力机制
符号主义被打入冷宫太久了,难道神经是AI的终结者吗?
Has Symbolism Been Sidelined for Too Long?
如何理解自注意力机制中的QKV分工?
Transformer 和注意力机制简介
DeepSeek: Learning to Think Slowly Without Human Supervision
DeepSeek爆火真相:不靠“人盯”, 让AI自己学会慢思考
Reasoning Paradigm (Query+CoT+Answer) Support scaling law?
Understanding DeepSeek R1\'s Reasoning
DeepSeek 笔记:R1 部署阶段的推理机制
DeepSeek 笔记:推理新范式 query+cot+answer 支持新的 scaling law 吗?
Hallucinations in AI: Bug or Feature? A Deep Dive into DeepSeek
从R1幻觉谈起,大模型幻觉是缺陷还是创意火花?
推理强化模型中思维链的本质
R1: 《立委列传》
王菲春晚《世界赠予我的》歌词,亮点与短板
推理强化学习是端到端的监督,推理过程的非监督
RL: Supervised Outcomes, Unsupervised Processes
DeepSeek R1:《少年DS之烦恼》
告诉李雪琴一个激发写段子灵感的秘诀:找deepseek R1
DeepSeek 风暴下看看它的论文
DeepSeek's R1 Paper: A Storm in AI LLM Circle
The Turbulent Second Chapter of Large Language Models
大模型风云诡谲的下半场:scaling 失效?
Professor Ma\'s long paper out
马毅教授的演讲,值得一听
NLP老司机的AIGC旅程
解耦才能解套:再谈视频中的人物一致性问题
马毅教授称,已经揭开完全揭开神经网络的面纱
人形机器人大热,但看不到商业闭环
推动AIGC商业落地,出门问问的「产模结合」实践
转述老领导的硅谷风投现状和展望的分享
视觉模型生成的极限对齐
立委论LLM:什么是AI刚需
立委论LLM:视频生成的人物一致性问题
《AIGC图生视频:牵手》
《朝华之十九:牵手》
UBI 势在必行
姑蘇胡氏哀辭(AI作词作曲)
短视频:大模型奥秘
大模型的理论奥秘
Nick traching the AI history for LLM theoretical foundation
大模型以来,觉得可以留个记录
《谈两种复杂度》短视频科普
《介绍监督学习的数学原理》短视频科普
《谈谈端到端和大模型》短视频
古典诗词AI配乐集锦
【唐诗300首 AIGC 配乐: 白居易 琵琶行】
两分钟短评:大模型开始进入平台期吗
悲观主义的视角,人类的宿命
两分钟谈:模型训练的内插、外插
两分钟谈谈:Moravec悖论
就《Suno: 望震》与音乐大家的对话
Suno:《宋輝:人生笑话》-- 献给插队一代人 (审核未通过)
Tanya's Childhood 2: American nursery rhymes
写在巴别塔建成周年纪念日
李名杰:医学论文集(41):老爸的故事(代后记)
李名杰:医学论文集(40):纪念专辑 - 影集3
李名杰:医学论文集(39):纪念专辑 - 影集2
李名杰:医学论文集(38):纪念专辑 - 影集1
Debriefing report
My career as surgeon
The Tireless Father (Preface)
COLLECTED WORKS IN COMMEMORATION OF MINGJIE LI’S CAREER
大模型短视频系列:大模型压缩与白马非马
AI创作花絮: 《月影双剑》
数字人形象设计:为什么选她?
大模型的落地现状和前景
大模型漫谈系列n
喜欢刀郎,也喜欢那英
奇妙元体验AIGC奇妙:《岁月如歌:神秘园》
《AI浪潮: 辛顿的 AI 威胁论与马斯克如出一辙》
《AI潮流:跟Andrew学如何调用 ChatGPT 做自己的服务前台》
《AI潮流:与 ChatGPT4 聊“买房送老公”背后的语言学》
《AI潮流:开发者提示工程公开课中的二原则》
【AI 浪潮:超级词匠 ChatGPT4 的百变文风】
【AI 浪潮:自主性是人类智能的最后堡垒吗】
【AI 浪潮:GPT-4 的上下文逻辑与常识还是不够稳固】
【AI 浪潮:数据中心的大模型时代】
快讯:腾讯科技AI未来指北系列 今天直播间与鲁总唠一唠大模型(LLM)
【劳碌命论LLM:大模型推理的细节编造是 feature,不是 bug】
AIGC“尖峰系列”丨李维博士:ChatGPT海啸狂飙,谁将被取代?
ChatGPT Tsunami and Its Impact on IT Landscape and Ecosystem
AIGC“尖峰系列”丨李维博士:人类语言“通天塔”建成,ChatGPT的辉煌与挑战
[转载]与ChatGPT相关……码脑 | 张宏江、李维等顶级大咖齐聚,AIGC系列分享
《AI浪潮博客目录》
《AI浪潮:不识数的 ChatGPT》
《AI浪潮:打造中国的 ChatGPT,挑战与机会并存》 (审核未通过)
《AI浪潮:chatGPT 搞定了人类语言》
《AI浪潮:chatGPT 写的情书能有真情吗》
《AI浪潮:chatGPT 能写出段子吗》
《AI浪潮:chatGPT 的里程碑意义》
《AI浪潮:LLM 凭什么能“涌现”超级能力?》
《AI浪潮:漫谈LLM与领域对齐》
《AI浪潮:神迹与笑话齐飞,chatGPT 也是大观了》
《AI浪潮:chatGPT 帮你写应用文》
《AI浪潮:人工智能当代简史》
《AI浪潮:chatGPT 辅导精读学术论文的实验》
《AI浪潮:因为见从而信,见证奇迹的时刻》
《AI浪潮:玩不死的 chatGPT (之一)》
《AI浪潮:玩不死的 chatGPT (之二)》
《AI浪潮:关于chatGPT 的 思维链能力 》
AGI 迷思与反思
《AI浪潮:n-shot 是训练还是指令》
AIGC 潮流扑面而来,是顺应还是(无谓)抵抗呢?
美术新时代,视频展示
漫谈AI 模型生成图像
【缅怀刘倬先生特别系列】
送别恩师刘倬先生
一代宗师 刘倬先生千古!(1933-2022)
《李白宋梁130:从短语结构的词序基础约束到大模型向量空间的天马行空》
AI 正在不声不响渗透我们的生活
RPA 是任务执行器还是数字员工?
图灵测试其实已经过时了
《立委科普:自注意力机制解说》
《深层解析符号模型与深度学习预训练模型》(修订文字版)
NLP 新纪元来临了吗?
【随感:大数据时代的信息茧房和“自洗脑”】
推荐Chris Manning 论大模型,并附上相关讨论
《我看好超大生成模型的创造前途》
我的前老板的企业家创业访谈
[转载]编译 Gary Marcus 最新著述:《深度学习正在撞南墙》
老司机谈NLP半自动驾驶,欢迎光临。
立委随笔:机器翻译,从学者到学员
立委随笔:上网课也可以上瘾吗?

立委NLP频道】前大模型时代其他系列

李维 郭进《自然语言处理答问》,商务 2020

《李白对话录》

《朝华午拾》电子版

《李家大院》电子版

《李老夫子遗墨》电子版

《小城青葱岁月》电子版

《江城记事》电子版

立委微博的存在

【李名杰从医67年论文专辑】(电子版)

【李名杰从医67年论文专辑(英语电子版)】

发布者

立委

立委博士,多模态大模型应用高级咨询。出门问问大模型团队前工程副总裁,聚焦大模型及其AIGC应用。Netbase前首席科学家10年,期间指挥研发了18种语言的理解和应用系统,鲁棒、线速,scale up to 社会媒体大数据,语义落地到舆情挖掘产品,成为美国NLP工业落地的领跑者。Cymfony前研发副总八年,曾荣获第一届问答系统第一名(TREC-8 QA Track),并赢得17个小企业创新研究的信息抽取项目(PI for 17 SBIRs)。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理