国产大模型独角兽,困在光环里

 人参与 | 时间:2024-12-01 12:46:48


智东西
作者 ZeR0
编辑 漠影

11月16日,国产月之暗面举办了一场临时组织的大模媒体沟通会,说是型独榆林市某某海绵制品客服中心特意选在Kimi开放一周年纪念日。

结果意料之外,角兽啪,困光发了款数学模型。环里

还跟OpenAI o1系列、国产GPT-4o、大模Anthropic Claude 3.5 Sonnet模型的型独测试分数做了对比。

这个举动搁在友商身上很正常,角兽但由月之暗面来做就有些稀奇了。困光因为这家大模型公司的环里作风一贯有些另类,不聊技术,国产只推拳头产品Kimi。大模

Kimi在今年年初的型独热度冲到一个高峰。铺天盖地的广告投放轰炸使这款智能助手产品声名鹊起。

快速攀升的Kimi用户数和影响力、“90后清华校友技术天才创业者”的创始人标签、阿里超10亿美元领投、Kimi概念股爆火……诸多光环叠加,将月之暗面捧成了一个新晋国产大模型“顶流”。

但很快其命运陡转,口碑逐渐下滑,质疑声扑面而至,这些光环也变成了缚住月之暗面的茧。

以前是好评如潮,但不知何时开始,月之暗面被冠以“大模型营销咖”的外号,模型乏善可陈,生态资源被大厂碾压,产品更新多为缝缝补补。

一些针对产品效果的负面评价也声量渐起:“动不动让换个话题”、“有时会瞎编”、“整理资料糙”、“听不懂需求”、“幻觉和错误严重”、“指出它错了还犟嘴”……这些大模型通病,在用户心里埋下失望的榆林市某某海绵制品客服中心种子。多位用户吐槽说,Kimi最近莫名地越用越差,感觉比以前变蠢了,甚至有人怀疑这是不是想逼用户付费。

这是大模型竞赛中的一个缩影:当发展速度跟不上讲故事的高度,当免费和低价策略挟住每一个参赛者,当Scaling Law信仰开始动摇,此时的转折,是新高潮前的过渡,还是凛冽寒冬的序曲?

大模型独角兽们,集体走到逆风时刻。

一、月之暗面的B面:特长被复刻、出海失利、被前资方“逼宫”

2023年10月,月之暗面发布支持输入20万汉字的智能助手产品Kimi。

彼时,这是全球市场上商用大模型服务中所能支持的最长上下文输入长度。在高曝光度加持下,Kimi凭借“最强长文本”特色,很快在AI聊天产品大战中杀出重围,收获增长和口碑。

凶猛的推广投放为Kimi争取到先发优势。今年年初阿里的大笔投资进一步增加了月之暗面的曝光度。在4月Kimi智能助手支持200万字上下文后,二级市场一度掀起Kimi概念股热潮。

红得发紫,是A面的月之暗面。

但在另一侧B面,这家明星国产大模型独角兽,已经频频陷入麻烦中。

难守的“特长”

Kimi爆火后,很快“长文本”成为大模型突破的共识方向。

竞争对手们纷纷高调跟上,3月22日,阿里通义千问开放1000万字长文本能力,360智脑宣布内测500万字长文本能力,百度宣布文心一言4月升级逾200万字的长文本能力。

之后,Kimi仍努力拉大优势,今年10月上线具备AI自主搜索能力的Kimi探索版,搜索量是普通版的10倍,一次搜索可以精读500个页面。

但Kimi的身份,已经从引领潮流者转向追随者,上周新推出的对标o1的数学推理模型,便是在走OpenAI打过样的路。

激进投放

Kimi在投流上的生猛,连大厂掌门人都侧目。

在百度2024年第三季度总监会上,百度创始人李彦宏谈道:“AGI是个长期探索的事情,文小言的推广没必要像豆包、Kimi那样激进。”

自发布以来,Kimi在字节旗下穿山甲、B站、小红书等渠道进行了大规模投流。一张网传图表显示,Kimi的季度投放金额豪横到上亿元,吊打多数竞品。Kimi还长期推行免费策略,直到今年5月才首次试水商业化,启用打赏模式。

这带来的回报是领先的用户增长和产品影响力。但无论是月活、活跃用户留存率还是免费App下载排名,Kimi都被字节豆包压了一头。

出海止步

今年年初,月之暗面在海外推出情感陪伴类AI对话产品Ohai和AI生成视频工具Noisee。

据创投日报援引知情人士消息,其出海项目在今年6月就已撤掉。前Noisee产品负责人明超平、前Ohai产品负责人已于近期离职创业。

上周六,杨植麟回应说月之暗面今年二三月份开始聚焦和缩减,主动做减法,更加聚焦业务,先聚焦,后全球化,要更有耐心。他说过去一年给其团队上的一课是,几个业务一起做,会活生生把自己变成大厂,没有任何优势。

套现疑云

除了产品竞争压力外,月之暗面也陷入一系列舆情风波中。

今年4月,杨植麟被传通过售出个人持股套现数千万美金,随后月之暗面进行辟谣,但其中牵扯出的“资本贵人襄助论”长期余温未了。

前金沙江创投管理合伙人张予彤是循环智能最早的天使投资人,与杨植麟是清华校友,4月份离开金沙江创投。有报道称,月之暗面获阿里领投的A+轮融资,正是归功于张予彤的牵头促成。

仲裁风波

11月11日,据《暗涌Waves》报道,月之暗面创始人杨植麟、联合创始人兼CTO张宇韬被循环智能7家投资方中的5家(金沙江创投、靖亚资本、博裕资本、华山资本、万物资本)申请仲裁。

这场利益纠葛牵扯到三位清华同窗杨植麟、张宇韬、陈麒聪在2016年创办的循环智能。循环智能主要做企业营销客服AI软件,在2018~2021年完成5次公开融资,此后再无新融资披露。

极大的落差,被业界推测是循环智能老投资方们发起仲裁的导火索。

杨植麟此前曾在采访中透露:“我们2023年2月开始集中做第一轮融资,如果delay(延迟)到4月,基本没机会了。”之后其动作相当麻利,3月创办月之暗面,8月推出Kimi,今年暴风吸金,获得腾讯、阿里、小红书、三七互娱、美团、小红书等名企投资,估值扶摇直上超过30亿美元,远高于循环智能用8年时间发展到的估值。

该仲裁事件的后续及影响,仍有待观望。

二、国产大模型独角兽的“四重困”

今年,国产大模型江湖格局生变,创业头部梯队从“四小龙”变为“六小虎”,即智谱AI、月之暗面、MiniMax、百川智能、零一万物、阶跃星辰。

智谱AI和MiniMax成立时间较早,另外四家则都是在2023年3~5月期间创办。

借势2021年大放水和生成式AI飞升的红利,过去两年,资本密集汇向这几家大模型初创公司,只用短短一两年就将它们拱到独角兽身价。

百川智能、智谱AI、月之暗面均跻身200亿元估值俱乐部。今年6月,阶跃星辰被传正在进行一轮估值20亿美元的新融资。

金沙江创投主管合伙人朱啸虎今年3月接受腾讯新闻《潜望》采访时的发言,道出了一些质疑者的心声:“这些公司,要场景没场景,要数据没数据,你说它有什么价值?而且一上来估值这么贵。”

资本的追捧,与其在商业市场上的实际表现,始终存在着隐性的不平衡。

以前“六小虎”各具特色:智谱AI是正统清华科研班底,最早探路大模型研发,在To G、To B布局上都摊得较广;MiniMax在多模态和出海产品上保持领先;月之暗面手握爆款产品Kimi,不怎么强调背后模型;百川智能由王小川领衔的前搜狗团队创办,一年发了十多款大模型,并在AI医疗方向发力;零一万物由李开复组局创办,热衷于打榜;阶跃星辰则由前微软全球副总裁姜大昕创办,快步形成“万亿参数MoE+多模态”矩阵。

但一些变化已经显现。

1、人才之困

AI大模型独角兽们陷入的争议,很容易让人联想到AI 1.0创业时代的“CV四小龙”,高人才密度、强技术实力未能转换成高回报的市场竞争力,迄今难逃亏损魔咒。在生成式AI巨浪兴起后,不少来自互联网大厂及商汤、旷视的技术、产品、工程人才转身遁入大模型公司。

大模型创企像个围城,外面的人想进来,里面的人又纷纷出走。这一年来,一大波骨干人才从“六小虎”出走,有的回流大厂,有的选择创业。

今年8月,前零一万物算法副总裁、模型预训练负责人黄文灏被曝已加入字节跳动;9月,MiniMax“星野”产品负责人张前川被曝改任产品顾问,不再参与MiniMax业务。零一万物联合创始人李先刚也被曝出已离职并重返老东家贝壳。

月之暗面则有多位前产品负责人在离职后选择创业。比如月之暗面前大模型产品负责人王冠在今年年初创立了AI视频方向的ONE2X,已完成天使轮融资;前Noisee产品负责人明超平正以5000万美元的估值为其新创业项目融资。

另据Z Potentials报道,零一万物联合创始人潘欣正式加入闪极,出任闪极科技合伙人。

人才有出,也有进。

今年8月,百川智能宣布中国人民大学高瓴人工智能学院、信息学院院长文继荣教授受聘担任百川智能“首席科学家”,月之暗面将微软亚洲研究院前首席研究经理谭旭招至麾下。

在团队扩张上,杨植麟称月之暗面在几个大模型创业公司中始终保持人数最少、卡和人的比例最高,认为团队扩得大对创新有致命伤害。

2、技术之困

上周大模型领域的一大热议话题是Scaling Law,这个大力出奇迹的暴力美学,碰壁了。

OpenAI、Anthropic、谷歌都被曝出新模型改进放缓,寻求转变路线。连已经离职创业的前OpenAI首席科学家Ilya Sutskever都跳出来一吐为快,说2010年代是Scaling的时代,但现在是时候重归奇迹和发现的时代了。

而模型提升见顶,意味着AI聊天产品的智力很难再出现质的飞跃。

不过多位业界大佬否认了“碰壁论”。OpenAI联合创始人兼CEO Sam Altman、微软AI主管Mustafa Suleyman、微软董事长兼CEO Satya Nadella、前谷歌CEO Eric Schmidt等都宣称Scaling Law依然有效、没有迹象显示放缓。

杨植麟对Scaling Law仍持乐观态度,认为用强化学习的方式,上限很高。他预测训练模型还有半代到一代的空间,这个空间可能会在明年释放出来,接下来重点会是强化学习,范式上会产生一些变化,通过不同方式去Scale。

在他看来,留存与技术成熟度呈正相关,把思考能力和交互做好后,留存会进一步上升。

3、产品之困

模型卷不动后,竞争焦点必然向产品转移。

To B方面,大模型独角兽同时面临同行的闭源模型和开源模型的竞争,低价策略仍是主旋律。

To C方面,市场尚未等来一个超级应用,AI产品同质化严重的情况一直存在,目标用户重叠度高,同类产品功能和体验互相借鉴模仿,产品转移成本低,又不像一些头部社交、电商平台用推荐机制拿捏住人性的弱点、形成上瘾机制,那么如何才能长久占领用户心智?

当前AI聊天类产品在便捷搜索和提高生产力方面有效发挥作用,但受众仍然有限。不断优化的产品功能和效果,仍未能消减很多用户对幻觉错误和沟通费劲等问题的埋怨。

大模型主要靠To B还是To C赚钱,不同观点都有拥趸者。摆在大模型创企们面前的,是涉及精简成本和聚焦核心业务的方向选择难题:如果盈亏主要依赖To C应用,那么投入高昂的训练成本是否值当?如果To B才是商业表现的征途,那么姗姗来迟的月之暗面是否已经输在起跑线?

对市场需求的精准把控很重要,但国内团队擅长“抄作业”。大厂可以轻轻松松推出爆款AI功能合集,而创企只能选准方向精兵作战。

现阶段,大厂靠传统优势依然胜出,语言类有字节豆包,视频生成类有快手可灵。

对于与豆包的竞争,杨植麟上周的回应是:不希望过多关注竞争,因为竞争并不产生价值。做正确的事情,而不是专门去做不一样的事。只要能有人实现AGI,都是非常好的结果。

月之暗面目前还是聚焦于Kimi产品和品牌,聚焦在团队认为上限最高的事情上,更关注如何迭代更好的技术和产品、产生用户价值,更聚焦在提升模型的思考推理能力。

据晚点10月份报道,月之暗面的多模态研究从去年10月开始,在研发视频模型,为确保产品更具差异性,对外发布计划仍在推迟。

4、财力之困

除去人力成本不谈,大模型创企还面临三大烧钱问题:训练贵、推理贵、获客贵。

大模型训练和推理已经不是稀奇事。据外媒披露,预计OpenAI今年创收35~45亿美元,亏损40~50亿美元;Anthropic今年收入有望达到10亿美元,亏损可能是OpenAI的一半。

为了降低大模型推理成本,杨植麟称kimi未来考虑限制次数,让用户自己做选择。

为了保住拉新和留存,投放在所难免。早期Kimi投流效果立竿见影,知名度快速攀升,B站和小红书布满了安利。随后一些AI产品争相效仿,带动用户转化成本上涨。在机场、地铁等场所,旅客对大模型产品的大屏广告逐渐习以为常。

至少截至今年,大模型还不是一门能赚钱的好生意,也尚未展现出长期商业盈利的潜力。

结语

很少有新生行业能像生成式AI这样,短短两年孕育出多家百亿级估值的明星企业,它们被迅速推上神坛,也承受着过高期待带来的困扰。

近期,产业对大模型似乎逐渐祛魅。人们不再容易因雄心勃勃的AGI技术信仰而陷入狂热,不再对百模大战保持耐心和好奇心,不再盲从大佬预言,不再轻信投资者夸大的创新者投资资本回报,也不再热议谁会成为“中国版OpenAI”。

对于大模型创企而言,两年的成长,还不足以解决概念丰满但产品骨感的问题,消除业界一个长期的疑虑:大厂资源雄厚,进可攻退可守,仅靠大模型营生的公司又如何自证造血能力?当听众不再相信故事,又凭什么支撑起百亿级的估值?

顶: 5768踩: 6