创业邦深圳会议演讲笔记:推动AIGC商业落地,出门问问的「产模结合」实践

8月22日,2024AGI商业趋势大会在深圳成功举办。活动由创业邦主办,南山区科技创新局、西丽湖国际科教城融合创新中心、深圳市“模力营”AI生态社区为支持单位,揽胜运动为大会指定用车,搜狐为战略合作媒体。

本届大会以“AI塑造未来市场”为主题,邀请人工智能领域的行业专家、上市公司、独角兽企业、创新企业、投资机构代表,分享研讨最新的技术、创投、治理热点话题,并围绕产品商业化、人工智能+行业解决方案进行深度交流,共同探寻更广泛的产业合作与创新机遇。

会上,出门问问副总裁李维在主题为“盈利为王,AIGC从技术创新走向商业落地”的演讲中精彩观点如下:

  1. 大模型的出现,就像翻越了语言的大山,统一了这些不同的赛道,建立起了一种类似圣经中巴别塔的通用语言能力。
  2. 历史上,技术革新往往遵循一条被称为“technology adoption curve”的路径:一开始,人们对于重大创新和突破趋之若鹜,但当这些创新在商业化、盈利和实际应用方面遇到瓶颈时,就会出现一段回落期。
  3. 在通用人工智能时代,一个模型可以处理各种任务,这使得许多细分领域的创新空间被压缩。以前,每个细分赛道都有机会诞生超级应用,但现在这种可能性大大降低了。

以下为演讲内容,由创业邦整理:

很高兴有机会跟大家分享我们在AIGC赛道上的一些工作。我叫李维,是出门问问的VP。我今天演讲的题目叫“盈利为王,AIGC从技术创新走向商业落地”。

实际上这个题目挺难的,原因在于AI和大模型非常热闹,但是真正走向商业落地的寥若晨星。所谓“AI一日人间一年”,大模型的发展虽然很快,但从总的趋势上来看,AI实则进入了一段下行期。历史上,技术革新往往遵循一条被称为“technology adoption curve”的路径:一开始,人们对于重大创新和突破趋之若鹜,但当这些创新在商业化、盈利和实际应用方面遇到瓶颈时,就会出现一段回落期。我们现在正处于这一回落下行期,但尚未触底。

这一趋势也映射到AI投资上,今年对于大模型公司来说,融资变得极具挑战性。主要原因是大模型非常烧钱,算力消耗往往远超人力成本。然而,只投入不产出的模式是不可持续的。尽管大模型拥有巨大的潜力,但要实现盈利并不像看起来那么简单。

大家都在谈,上一次技术革命是移动互联网,虽然它的技术含量可能不如大模型带给人的震撼,但它确实催生了一系列超级应用,很好地满足了人们“吃穿住行、娱乐和通信”等基本生活需求。这些超级应用已经在上一代技术革命中达到了很高的水平,留给后来人创新提升的空间已经不多。想要通过大模型在这些领域实现进一步的突破,变得非常难。

ChatGPT的出现标志着通用人工智能的一次大爆发。在通用人工智能时代,一个模型可以处理各种任务,这使得许多细分领域的创新空间被压缩。以前,每个细分赛道都有机会诞生超级应用,但现在这种可能性大大降低了。

我举个例子,机器翻译并不是大模型时代的新现象,早在12年前神经网络革命开始时,机器翻译就是首批受到影响的领域。结果,像百度、谷歌这样的大公司都把机器翻译服务做成了免费产品。一旦一个领域变成了免费或白菜价,创业的空间就大大减少,甚至可能扼杀整个产业。类似的情况也出现在大模型普及之后,比如Jasper。在ChatGPT出现之前,大模型刚刚兴起,那时业内人都知道GPT3。Jasper利用大模型的能力,将其包装成可以帮助人们进行写作和生成各种文案的工具,吸引了一批客户。

随着ChatGPT等通用大模型的崛起,Jasper的优势逐渐消失,开始走向衰落。ChatGPT不仅仅是一个超级应用,它通过人机对话的方式,实际上已经成为一个“超级的超级应用”(super super-apps),它超越了传统的界限。通用大模型现在能够处理各种语言、知识,甚至多模态的内容,如语音、音乐、图像和视频。这种广泛的能力使得通用大模型在很多领域都占据了主导地位,挤压了相关赛道的生存空间。

如今,作为投资人或创业者,在寻找发展方向时,需要经常思考一个问题:我现在所在的领域或开发的App是否具有持久的竞争优势?虽然可能暂时吸引一些客户并满足部分需求,但如果我的项目挡在这个大模型自然扩散能力的路上,那么我最终很可能面临像Jasper那样的衰退命运。

通用大模型的能力如此之强,被寄予很高的期望,结果在真正落地应用的时候,才发现原来有很多限制条件在。一方面,上一代技术已经相当成熟,吃穿住行等低枝果实的超级应用已经做到极致;另一方面,大模型本身还在不断发展,其通用能力常常限制了落地赛道的发展空间。因此,大家普遍发现将大模型规模化落地应用是一件相当困难的事情。

我曾是大模型的热烈支持者,也是在中国最早“鼓吹”大模型的人之一。当时非常激动,因为在我一辈子的NLP职业生涯中,从未见过如此革命性的变化。

在NLP领域,过去我们有机器翻译、对话系统、问答系统等多个专业方向,甚至还有分词这样的细分技术。但大模型的出现,就像翻越了语言的大山,统一了这些不同的赛道,建立起了一种类似圣经中巴别塔的通用语言能力。大模型的出现,彻底改变了NLP行业的格局。但实际应用起来,我们发现它比我一年多前想象的要困难得多。例如,以NLP为方向的应用(如各种文案或翻译的 co-pilot)因为已经被头部大模型搞定,这个方向的创业产业就做死了。

现在,大家都在期待大模型原生的超级应用(LLM-native Super APPs),虽然呼声很高,行业内竞争激烈,但真正能够规模化落地的,目前还只有像ChatGPT、豆包、文心一言这样的通用类的toC应用。

简而言之,这种超级大模型正逐步深入社会的各个层面。然而,除了它之外,我们还没有看到其他大模型实现规模化落地的成功标杆案例,大家都在艰难跋涉,试图找到与通用大模型基本能力有差异化的突破口和切入点。

目前的情况是,无论是行业内外人士、投资者还是创业者,都对大模型的技术潜力广泛认可,这仍然是基本共识,但要找到它的market fit并实现规模化落地,可能需要至少两三年的时间探索:现在处于技术落地的难产期,也是突破期。

大模型虽然功能强大,但也存在一些严重的短板:第一,信息准确性问题:由于学习了大量信息,大模型可能在记忆不精确的细节时出现错误,导致其输出内容不准确,所谓“幻觉”。第二,可控性问题:与以往的符号逻辑AI不同,大模型包含百亿千亿参数,运作起来像一个巨大的黑箱,难以进行精确的调试和控制。第三,安全性问题:大模型可能存在安全隐患,公开上线需要谨慎。第四,算力成本问题:尽管随着技术进步,算力成本有望降低,但与上一代边际成本趋于零的许多应用相比,使用大模型的应用在算力成本上仍然相当高。推理时也常常遭遇高并发的瓶颈。普及到 toC的大众市场,巨大的推理成本直接影响盈利能力。

以上的分析回顾,听起来有些悲观。但长远一点来看,特别是在接下来的三到五年内,还是值得期待的,尤其是垂直赛道(尽管垂直领域尚未迎来大爆发,但许多人在积极探索)。今天上午座谈会的嘉宾们也在分享他们如何将大模型技术应用到自己的领域,都是从需求出发的第一线分享。这些努力最终将取得成效,预计在未来几年内,垂直领域将会迎来显著的发展和突破。

大模型的研发成本高昂,这对创业公司来说是个挑战,而且模型与产品之间的脱节也是一个主要问题。我们目前正在探讨如何将模型与产品有效结合,以克服这些困难。接下来,我将分享我们在这方面的探索和经验。

模型开发可以选择自主研发或使用第三方服务,这取决于产品的具体需求。目前市场上竞争激烈,第三方服务往往价格低廉,更具成本效益。但如果产品需要高并发处理能力或有特定的定制化需求,第三方服务可能无法满足,这时自主研发就显得重要。

这就需要探索如何将模型开发与产品需求紧密结合,以实现成本控制和产品定制的灵活性。这包括调整大模型以适应我们的产品需求,实现最优的产品模型结合。

然而,产模结合说起来容易做起来难。因为模型开发和产品开发是两个不同的领域,涉及的人员背景和思维方式各异。要让这两类人员有效协作,发挥出最大的协同效应,对许多公司来说都是一大挑战。

我们开发了自己的大模型,名为"序列猴子",基于此,我们推出了多模态AIGC产品,涵盖数字人、配音和短视频一键生成等功能。此外,我们还成功推出了出海产品"DupDub "。"魔音工坊"是我们在市场中占据主导地位的产品,尤其在抖音平台上,约70%的声音内容都使用了我们的技术。

我们的目标客户群体包括内容创作者(ToPC,to professional consumer)和小型至中型企业(ToSMB,to small medium businesses)。内容创作者愿意为方便他们工作的工具付费,而我们正是为他们提供这样的工具。对于ToB客户,我们专注于为中小企业提供较为标准化的解决方案,因为大型客户的定制化需求较为复杂,不易操作。目前,我们拥有86万付费用户,这证明了我们的服务已经成功落地并得到市场的认可。下面是我们产品的一些展示。

发布者

立委

立委博士,问问副总裁,聚焦大模型及其应用。Netbase前首席科学家10年,期间指挥研发了18种语言的理解和应用系统,鲁棒、线速,scale up to 社会媒体大数据,语义落地到舆情挖掘产品,成为美国NLP工业落地的领跑者。Cymfony前研发副总八年,曾荣获第一届问答系统第一名(TREC-8 QA Track),并赢得17个小企业创新研究的信息抽取项目(PI for 17 SBIRs)。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据