方滨兴院士：为大模型加装“保险箍”，筑牢网络安全防线

9月15日，2025年广东省网络安全宣传周开幕式在珠海启幕。中国工程院院士方滨兴以《大模型保险箍：大模型护栏的一种模式》为题发表主旨演讲，深入剖析当前大模型面临的安全合规风险与挑战，着重强调构建大模型安全护栏的必要性，并详细分享了其团队研发的大模型安全合规“保险箍”模式的实践进展与持续研发动态。

何为大模型护栏？

方滨兴院士解释道，当用户向大模型提出问题后，护栏会对大模型生成的答案进行严格审核，“我们将护栏视作一道‘卸压阀’，核心作用是确保大模型输出内容完全符合伦理道德与法律规范。”

其团队研发的大模型“保险箍”，正是大模型护栏的具体实践成果。

该“保险箍”不仅能在输入端主动拦截风险——对涉及恶意诱导、可能生成违法不良信息的问题直接拒绝回应，还结合广东地区粤语使用特点，实现了对普通话、粤语双语言问题的快速分类与敏感词精准过滤。

针对大模型安全防护的长远建设，方滨兴院士提出关键建议：

应构建通用化护卫模式，将大模型安全能力纳入国家级基础设施服务范畴，由专业平台统一提供支撑。这种模式通过集约化建设安全基座，既能避免企业在安全领域的重复投入，显著降低全社会网络安全建设成本，更能有效应对大模型应用可能引发的系统性安全风险。

文｜记者黎秋玲来源：金羊网

相关链接