专家观点|端侧大模型距离我们还有多远?

专家观点|端侧大模型距离我们还有多远?

人工智能作为新一轮科技革命的核心驱动力,正在重塑全球竞争格局。近日,由北京市科学技术协会创新服务中心主办、北京网络信息安全技术创新产业联盟承办的“2025年科创中国·北京创新荟产学研合作研讨交流活动——全球视野下端侧大模型的应用与可持续发展”研讨会在北京召开,多位来自学术界、产业界的专家围绕端侧大模型的技术逻辑、应用场景与未来趋势展开探讨,一起来看他们的观点——

为什么端侧大模型是未来人工智能发展的重要方向?

清华大学计算机系长聘副教授刘知远回溯了技术演进的脉络。

“大模型是人工智能发展的新高地。”刘知远表示,从1950-1990年以知识库等符号系统存储专家知识的符号智能,到1990-2017年以任务专用小模型存储任务知识的专用智能,再到2018年以后采取通用大模型存储通用知识的通用智能,“大模型规模法则”清晰显现——模型参数训练规模越大,产生的智能能力越强。

但他指出,这一趋势也带来显著矛盾:模型越大,计算资源消耗与成本越高,难以普及。因此,“用更少参数实现同等智能水平”成为关键命题。

刘知远认为,芯片电路密度(摩尔定律)和模型能力密度(密度法则)持续增强,揭示了端侧智能的巨大潜力。未来,端侧智能可能会在汽车场景、手机场景、具身智能、AIPC及智能设备等领域有广阔前景。

北京智源人工智能研究院研究员王业全以《具身智能走向终端:模型、进展与展望》为题,梳理了机器人与人工智能的三次浪潮:

  • 20世纪60-80年代,工业机器人和人形机器人开始起步;
  • 20世纪90年代至2010年前后,工业机器人规模化应用。直到2022年前,人工智能与机器人总体上独立并行发展,属于“无智能”的机器人1.0阶段,机器人基于规则而运行。
  • 2022年以来,随着大模型的发展和特斯拉发布Optimus原型机,大模型与机器人开始深度融合、共同发展,标志着机器人2.0阶段的开始。

他进一步拆解当前具身智能的核心要素:一是机器人本体、二是运动控制、三是智能化。

机器人本体的驱动形式中,电动驱动是主流方案,好处是响应速度、控制精度和静音性较好,缺点是成本比较高。在运动控制的技术路线中,强化学习和模仿学习是主流,前者使机器人通过与环境的交互学习最优的行为策略,后者主要通过对专家策略进行模仿,组合使用两种算法可以结合两者优点。

对于智能化而言,端到端方案是主流技术路线之一。他表示,在自动驾驶领域,端到端的技术路线被视为通向高级别自动驾驶的关键。此外,大脑+小脑也是智能化技术路线中的重要组成部分,其本质是模仿人脑机制,大脑主要负责高级认知功能,包括思维、记忆、情感等,小脑主要负责运动控制方面的功能。

“如果把大模型比作大脑,大模型端侧智能体就是能思考、能行动、能交流的人。”中国人民大学预聘副教授林衍凯在《面向通用智能的大模型端侧智能体》分享中以此比喻点明智能体的核心价值。

他指出,当前手机端的大模型应用(如DeepSeek、豆包)本质是被动的问题回答者,用户提出需求后,它们主要提供建议(例如制定行程);而大模型端侧智能体则是任务的主动执行者,更像个人助手——用户仅需给出高层次目标(甚至无须明确指令),它便能联动生活场景中的智能化设备与服务(如自动设置闹钟、准备早餐、叫车、订机票酒店、安排接送等),全程主动推进任务完成。“两者最大的区别在于从‘被动建议’转变为‘主动执行’。”

但他坦言,端侧智能体落地还面临几大挑战,其一是缺乏标准化的组件和环境接入,导致“手工作坊”模式,无法实现高度泛化;其二是缺乏科学的大模型规律定律,导致能力无法科学演进;其三是缺乏主动性,导致停留在“被动工具”阶段。

他表示,端侧智能体正处于快速发展阶段,未来其初期落地场景大概率会聚焦于家居服务等相对可控的领域,“待技术与场景成熟后,再逐步向我们所期待的全任务型个人助手形态演进”。

“算力、算法、数据是人工智能发展的‘三驾马车’,其中数据既是模型的‘燃料’,更决定其能力上限。”

北京面壁智能科技有限责任公司大模型数据技术负责人汪昱东在《在数据上的对于端侧大模型发展的重要意义》中聚焦数据对端侧大模型的关键作用,提出高质量数据是大模型学习世界知识的“教材”,是决定大模型性能的关键性因素。但随着数据增量趋缓,关键问题已从“如何获取更多数据”转向“如何最大化压缩和提炼现有数据的价值密度”。

展望未来,汪昱东希望能够借助AI完成采集、清洗、标注与评估等环节的自动化与智能化升级,从而推动数据治理模式由“人力密集”向“智能闭环”转变;

通过数据治理与模型训练的深度融合与动态协同,实现数据供给与模型能力需求的精准匹配,最大化利用单位数据的知识贡献;

建立统一的数据治理标准和开放生态,促进不同组织之间的数据共享与相互操作,推动产业级协同。

OpenBMB大模型开源社区运营负责人井晨哲围绕《端侧大模型技术发展与应用前沿观察》进行分享,对端侧大模型的发展进行了梳理和展望。

他表示,从甲骨、马车到个人电脑、手机,硬件形态始终被当时最高效的信息处理和传递范式所定义,大模型带来的“自然语言/意图”交互是对“触控/图形”交互的根本性颠覆。按照这个趋势,由大模型原生驱动的新型智能终端必将逐步问世。

与云端大模型相比,端侧大模型的部署位置在终端设备本地,如手机、PC、车载系统等,持续使用成本低、黏性强,天然适配硬件产业的商业逻辑。他认为,端侧大模型及系统正在沿着“高效”的思路前进:

  • 在模型层,Google发布Gemma 3n及Gemini Robotics On-Device,Microsoft推出Phi-4-mini-flash-reasoning和Mu,阿里巴巴发布Qwen 3 系列大模型覆盖端侧模型谱系;
  • 在系统层,Apple 开放IOS Foundation Model Framework,Meta 推出端侧框架ExecuTorch 1.0,加速端侧智能落地。el Framework,Meta推出端侧框架ExecuTorch 1.0,加速端侧智能落地。

制作:北京市科协融媒体中心

相关链接

企业AI知识库搭建与运营培训课程
呼叫中心AI知识库培训课程
个人知识体系构建能力课程

知识管理、知识管理专家田志刚介绍

知识库知识管理系统

企业AI知识管理知识库软件系统清单
个人知识管理软件AI知识库系统清单

发表回复

*您的电子邮件地址不会被公开。必填项已标记为 。

*
*