北京大学彭玉佳、方方:人工智能大模型发展趋势

北京大学彭玉佳、方方:人工智能大模型发展趋势

当前,人工智能(AI)大模型技术已成为推动国家科技和经济高质量发展的新引擎,但其发展仍面临几个重大挑战,包括算力掣肘、推理幻觉和产业落地壁垒等挑战。

为充分发挥AI对我国科技和经济发展的赋能作用,需从模型架构创新、测试标准体系构建和产学研协同三方面突破,打造具有国际竞争力的AI创新高地。

推动模型架构创新,探索智能本质与高效实现路径

当今AI模型发展以Transformer架构及其变体为主导,以大参数量、大算力为基础,其训练成本正以惊人的速度增长,这种模式在长期运行中可能面临能耗与训练效率的挑战,同时高昂的成本也可能对规模化应用和推广造成一定制约。AI训练过程中,算力需求的持续膨胀已成为制约AI创新的一项关键因素。为推动我国AI研发实现跨越式发展,亟须在模型架构层面进行根本性创新。

从认知科学视角看,人脑在能耗极低的情况下实现了高效的智能处理。人脑通过分层处理、注意力机制和预测编码,以稀疏编码、模块化分工、抽象表征等方式实现高效运算。这些认知机制为突破算力瓶颈提供了重要思路:通过模拟大脑的预测加工系统,构建具有主动推理能力的生成模型;设计更高效的记忆架构,防止AI的“灾难化遗忘”;参照大脑皮层的层次化表征系统,构建具有多重抽象级别的计算框架。当前,大模型普遍存在的不可解释性问题,也凸显了单纯依赖数据驱动的局限性。基于对人类智能的探索,挖掘学习机制、功能模块分区,有望指导设计出能够更高效自适应环境、自主学习的AI训练范式。

为实现我国在AI研发上从“跟跑”到“并跑”乃至“领跑”的转变,几大研究方向值得重点布局:

一是开展基于脑科学与认知科学的智能本质研究,深入探索人类智能的内在机理及其对AI架构的启发;

二是推进受脑启发的AI算法研发,开发更高效轻量化的AI模型;

三是加强通用人工智能(AGI)理论创新,构建新一代AGI理论体系。

为推动上述方向,建议前瞻性布局新型计算芯片、认知神经网络、脑科学与类脑智能等前沿方向。支持科研机构开展跨学科交叉研究,探索更高效的模型架构和训练方法,推动AI发展模式从“算力驱动”向“效率优先”转型。通过降低算力门槛,可使广大中小企业以更低成本接入AI技术,形成新的产业增长点。同时,理论突破将带动芯片、算法、云计算等全产业链协同发展,进一步夯实数字经济发展基础。

构建测试标准体系,筑牢大模型发展根基

当前,AI大模型在各行业应用呈现蓬勃发展态势。然而,在模型实现流畅交互的同时,其固有的不可解释性、“幻觉”问题与潜在的安全隐患,也制约着其在关键领域的深度应用。比如,在医疗场景中,模型可能生成看似合理、实则错误的“幻觉”信息,即在医疗诊断时提供不准确的建议,带来误诊等后果。同时,大模型决策过程不透明、易受恶意攻击导致数据泄露等问题,也使得关乎国计民生的关键领域在引入大模型时不得不慎之又慎。此外,因大模型的智能尚未升维为通用的认知与适应能力,仍不能被广泛认可为AGI。

构建面向AGI的测试标准,必须克服传统测评方法的局限,借鉴发展心理学与心理测量,构建新一代测评体系:

在横向上,建立覆盖视觉、语言、认知推理、社会价值等多维度的综合任务集;在纵向上,设计受人类心智发展启发的“AI发展里程碑”测试,评估其能力是否遵循合理、稳健的演进路径。这尤其适用于评估AI的自我认知、情感依恋、道德判断等对安全至关重要的高阶能力,为AGI的发展提供更科学的指引。

标准化建设既能提升模型质量,对技术落地提出更高要求,又能为监管提供技术支撑,加速可信AI在关键领域的部署应用。同时,完善的标准体系将增强市场信心,吸引更多社会资本投入AI产业,推动形成规模化应用场景,有望带动相关服务业和制造业升级发展。为此,要加快建立覆盖测试方法、标准体系、流程评估和伦理规范的全链条标准体系。构建针对AI理解能力、安全性能,以及通用性的评测框架,针对重点风险领域设计场景化测试基准,通过可解释性评估等手段量化模型的安全和可靠性。同时,积极推进测试标准与国际接轨,支持第三方机构参与认证评估,为行业提供科学可靠的评判依据。

深化产学研协同,打通创新应用“最后一公里”

全面推动人工智能与经济社会各行业各领域的广泛深度融合,进一步深化产学研协同创新,加速AI技术的规模化落地,应着力做好以下工作。

第一,建立跨学科人才培养机制。

跨学科视角对于AI发展至关重要,要培养既懂人工智能又懂人类智能的复合型人才和团队,建立跨学科研发平台,为两者的深度融合研发提供人才支撑。

第二,建立需求导向的研发机制。

组建国家级AI产业创新联盟,推广“政府—高校—企业—产业园区”协同模式。在真实应用场景中形成持续优化的反馈机制,降低科研和企业技术验证门槛,形成“创新—应用—反馈—迭代”的闭环系统。同时,完善知识产权分配和激励机制,充分调动科研人员参与成果转化的积极性。

第三,构建开放共享的AI产业生态。

建设高质量共享数据集和公共测试平台,促进大中小企业融通发展。

综上,通过人类智能启发的理论架构创新、测试标准引领和跨学科深度融合的产学研协同,有望解决算力、安全、落地等当前AI发展的关键瓶颈,探索出一条独具中国特色发展路径,推动我国在全球数字经济竞争中占据有利位置,为加快建设创新型国家提供有力支撑。

(作者:彭玉佳、方方,分别系北京大学首都发展研究院研究员,北京大学副校长、心理与认知科学学院教授)

来源:金台资讯 原标题:人工智能大模型发展趋势

相关链接

企业AI知识库搭建与运营培训课程
呼叫中心AI知识库培训课程
个人知识体系构建能力课程

知识管理、知识管理专家田志刚介绍

知识库知识管理系统

企业AI知识管理知识库软件系统清单
个人知识管理软件AI知识库系统清单

发表回复

*您的电子邮件地址不会被公开。必填项已标记为 。

*
*