在人工智能逐步落地应用,大规模预训练模型(以下简称大模型)发展势头强劲的总体背景下,数据安全风险也日益凸显:传统大模型训练的数据集通常存在数据未经过治理组织、数据使用缺少合规审查和安全保护等不足,或造成用户隐私和企业商业数据泄露、违反法律法规相关要求、侵权等数据安全、数据合规安全及产权保护等诸多问题。
大模型应用过程中的数据提供方、模型提供方、模型使用方在模型的生成、使用与运营阶段面临着多种数据安全风险:例如数据的提供方可能涉及知识侵权、个人信息违规收集、购得数据未取得原始授权等问题;再例如各行业应用大模型满足其业务场景需要(比如:智能风控、对话问答、智能营销、舆情分析、智能外呼)。模型使用的过程涉及对输入内容进行处理、分析,可能面临被攻击导致敏感信息泄露、生成内容违规等风险问题。
在此背景下,为进一步防范大模型在生成、使用、运营阶段面临的数据安全风险,明确数据安全保护措施,着力解决大模型数据安全风险问题,有效提升大模型数据安全能力,现依托中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)WG5大数据安全工作组开展《大模型数据安全风险评估规范》标准编制工作,公开征集《大模型数据安全风险评估规范》标准编写单位和专家,经审核通过后方可参与。
针对标准内容编写、贯彻落地贡献突出的单位和专家,还将作为核心编制单位、专家写入标准。
本标准致力于研究大模型数据安全风险问题、痛点,了解各行业大模型应用实践现状,明确数据安全保护措施,着力解决大模型数据安全风险问题,有效提升大模型数据安全能力。
目前已收到平安银行、华为、腾讯、联通数科、浪潮科技、浪潮信息、浙江大学等知名企业、高校专家的参编申请,请有意向参与的单位及专家在2023年11月8日前将如下信息反馈至以下邮箱:
邮箱:gongshiran@caict.ac.cn
信息:
单位 |
姓名 |
职务 |
手机 |
邮箱 |
联系人:
龚老师15645106927 gongshiran@caict.ac.cn
张老师 15501008926 zhangyue3@caict.ac.cn


