方滨兴院士:为大模型加装“保险箍”,筑牢网络安全防线

方滨兴院士:为大模型加装“保险箍”,筑牢网络安全防线

9月15日,2025年广东省网络安全宣传周开幕式在珠海启幕。中国工程院院士方滨兴以《大模型保险箍:大模型护栏的一种模式》为题发表主旨演讲,深入剖析当前大模型面临的安全合规风险与挑战,着重强调构建大模型安全护栏的必要性,并详细分享了其团队研发的大模型安全合规“保险箍”模式的实践进展与持续研发动态。

何为大模型护栏?

方滨兴院士解释道,当用户向大模型提出问题后,护栏会对大模型生成的答案进行严格审核,“我们将护栏视作一道‘卸压阀’,核心作用是确保大模型输出内容完全符合伦理道德与法律规范。”

其团队研发的大模型“保险箍”,正是大模型护栏的具体实践成果。

该“保险箍”不仅能在输入端主动拦截风险——对涉及恶意诱导、可能生成违法不良信息的问题直接拒绝回应,还结合广东地区粤语使用特点,实现了对普通话、粤语双语言问题的快速分类与敏感词精准过滤。

针对大模型安全防护的长远建设,方滨兴院士提出关键建议:

应构建通用化护卫模式,将大模型安全能力纳入国家级基础设施服务范畴,由专业平台统一提供支撑。这种模式通过集约化建设安全基座,既能避免企业在安全领域的重复投入,显著降低全社会网络安全建设成本,更能有效应对大模型应用可能引发的系统性安全风险。

文|记者 黎秋玲 来源:金羊网

相关链接

企业AI知识库搭建与运营培训课程
呼叫中心AI知识库培训课程
个人知识体系构建能力课程

知识库知识管理系统

企业AI知识管理知识库软件系统清单
个人知识管理软件AI知识库系统清单

发表回复

*您的电子邮件地址不会被公开。必填项已标记为 。

*
*