AI安然守护计划启动AIIA安然治理委员会宣告三类模型安然评测

作者 | 喷鼻香草编辑 | 李水青

智东西7月24日宣布，今日，中国人工智能家当发展同盟（AIIA）安全管理委员会举办告终果发布会。
会上，中国信息通信研究院人工智能研究所安全与元宇宙部主任石霖，解读了成立半年来委员会形成的组织架构，安全、管理两大事情组的事情情形，并启动了AI安全守护操持，发布了三大类别的安全评测结果。

AIIA安全管理委员会成立于2023年12月尾，经由半年运营，现有管理组、安全组两个事情组，近百家单位加入，主任单位由中国信通院牵头，副主任单位包括多家有名企业和高校。

个中，管理组事情环绕AI管理框架、合规管理、赋能管理展开，安全组紧张开展大模型安全、合规等研究及基准测试。

今年6月，中国信通院依托该委员会发起“人工智能安全守护操持”，包括建立威胁信息共享机制、开展AIGC真实内容来源可信事情、建立AI保险机制等。

一、成立半年近百家单位加入，形成安全、管理两大事情组

AIIA安全管理委员会成立于2023年12月尾，经由半年的运营，组织架构现有管理组、安全组两个事情组，同时卖力运营安全对齐伙伴操持、可信人脸运用守护操持、内容科技家当推进方阵等。

▲AIIA安全管理委员会整体情形

目前，AIIA安全管理委员会已有近百家单位加入，由主任单位、副主任单位、专家委和办公室，以及环绕业务方向设置的事情组和伙伴操持组成。

个中，主任单位由中国信通院牵头，副主任单位包括vivo、百度、腾讯、360、华为、中国移动、阿里、浙江大学以及蚂蚁集团。

专家委卖力对AIIA安全管理委员会的总体事情进行把关，两个事情组及伙伴操持则卖力开展AI干系研究，推动家当链各方的AI安全管理事情。

据石霖先容，管理组目前的事情进展环绕三个方面展开，包括AI管理框架、AI合规管理以及AI赋能管理。

▲管理组事情进展

详细来说，管理事情组聚焦AI整体管理框架研究和起草事情，与国际对标，如针对ISO/IEC 42001等进行研讨比拟，输入国际精良风险管理履历。

同时，管理组环绕人脸识别等范例运用开展事情，支撑地方网信主管部门针对文旅行业开展合规实践，形成人脸识别干系管理研究报告。

此外，环绕AI赋能管理，管理组开展法律大模型干系技能标准规范研讨事情，干系规范正式定稿。

安全组则紧张根据大模型安全、合规等热点方向，开展安全基准测试，推动多项AI原平生安规范的编写和技能互换。

▲安全组事情进展

目前，安全组环绕大模型的安全合规和技能研究开展文档编写等，已经开展了两个批次的AI安全Benchmark测试事情，个中二季度融入了更多常见攻击方法，包括勾引攻击、提示词注入攻击、内容泛化攻击等，能更全面直不雅观反响国内外闭源模型的安全情形。

环绕AI原平生安、AI赋能安全等，安全组在今年上半年先后召开了线上/线下共20多场互换研讨，开展了标准制订、测试评估等事情，包括大模型安全、AI网络安全大模型规范、AIGC检测规范等。

二、启动AI安全守护操持，三大安全测评结果发布

石霖谈道，在两大事情组的实践当中委员会创造，单独的事情组各自环绕安全或管理，从规则或技能角度开展事情，在这个过程中技能和规则须要领悟。
因此，建立跨组安全防护能力至关主要。

今年6月，中国信通院依托AIIA发起“人工智能安全守护操持”，即AI Guard，目标是联合多方力量提升我国AI技能水平和管理能力，促进家当康健有序发展。

▲人工智能安全守护操持

首先，该操持将建立AI威胁信息共享机制，从AI芯片等根本举动步伐，到数据、算法、运用等方面的漏洞，通过委员会层面的互助共治及时预警，提升安全戒备能力，从而应对AI安全威胁除等问题。

其次，该操持将开展AIGC真实内容来源可信事情，通过建立统一内容标准平台，打造内容可溯源的能力。
目前紧张针对图片、音频和视频等多模态内容，采取隐式水印方法建立互认机制。
文本内容上的实现仍有一定技能难度，后续将持续有针对性地打破。

此外，操持将通过AI保险机制，为干系职员和单位给予救援，供应赔偿兜底策略。

末了，石霖发布了大模型安全风险戒备能力评测、多模态图文大模型内容安全戒备能力评测、人脸识别安全专项评测以及代码大模型安全风险风险戒备能力评测结果，vivo、蚂蚁、阿里云、百度、科大讯飞、商汤等作为代表得到了证书。

▲大模型安全风险戒备能力评测、多模态图文大模型内容安全戒备能力评测结果

▲人脸识别安全专项评测结果

▲代码大模型安全风险风险戒备能力评测结果

结语：推动AI向安全可靠可控方向发展

大模型发展迅速，但AI安全问题的严重性和紧迫性不容忽略，安全寻衅已从技能本身的传统安全问题向多方面扩展，各国和地区基本形本钱土框架。
例如，美国推出风险管理框架，欧盟构建风险分级管理方案，新加坡推出管理模型框架并提出9个维度，日本发布指南制订行为准则等。

而在海内，AIIA安全管理委员会正在积极推动精准化管理前沿技能管理工具的构建，目前已环绕管理框架、风险管理、卫平生安、安全运用取得一定成果。
未来在各单位的共同努力下，期待我国能形成完全的安全风险机制，确保AI向安全可靠可控方向发展。

每期AI知识网