传神语联何恩培：依赖Scaling Law的大模型路线已遇瓶颈

综合 2024-12-01 13:02:32 85745

11月19日消息，传神近日，语联遇瓶传神语联推出“任度数推分离大模型”，何恩昭通市某某计算机维修网点模型采用双网络架构实现数推分离，培依把推理网络与数据学习网络分开。的大模

据介绍，型路线已可将其理解为两个协同联动的传神大脑：一个是客户数据学习网络大脑，专注于数据的语联遇瓶动态管理与迭代训练，为模型持续注入知识；一个是何恩推理网络大脑，作为经大量数据预训练的培依基础网络，有良好的的大模昭通市某某计算机维修网点推理和泛化能力。

随着AI技术进入规模化应用阶段，型路线已传统大模型的传神开发逐渐暴露出成本高昂、效率低下的语联遇瓶难题。尤其在参数规模不断扩大的何恩背景下，Scaling Law（规模定律）的局限性愈发显著。

传神语联创始人何恩培认为，仅依赖Scaling Law的大模型路线已遇瓶颈，要真正突破需依靠算法与架构。

双网络通过共享嵌入层和中间表示层协同工作，形成类似“主脑”与“辅脑”的高效配合模式，既支持独立训练，也支持联合推理。

这一双网络架构通过共享嵌入层和中间表示层，实现灵活独立训练与高效联合推理，提升模型性能的同时显著降低成本。

据悉，相比传统大模型，“任度双脑大模型”架构在多个关键领域实现突破：一是实时学习：数据学习网络支持上下文无限制输入，可动态处理海量数据，缩短训练时间至分钟级；二是数据隐私保护：客户数据本地完成训练，无需上传至云端；三是成本优化：减少模型参数规模，大幅降低算力需求与硬件投入成本。

何恩培坚信，“算法制胜”是具有中国特色的技术路径之一，在以大模型为代表的AI时代尤为重要。相信中国有很多像传神这样的团队在默默耕耘，正在以独特理念引领智能创新。（袁宁）

本文仅代表作者观点，不代表本站立场。
本文系作者授权发表，未经许可，不得转载。

秋天推荐吃莲藕，好吃又健康

李锦韬

接待游客511万人次！九寨沟景区提前2个月破历史纪录

以色列国防军设立新机构以便对伊朗再次采取行动

这种水果好处大大的

塑造终身学习国际平台：访新加坡管理学院全球教育校长魏国基教授

以军袭击加沙北部居民楼致84人死亡

内塔尼亚胡：必要时以色列可以打击伊朗任何地点