大数跨境
0
0

观点分享:数据跨境流动的规则与适用 人工智能数据合规痛点与解决思路

观点分享:数据跨境流动的规则与适用 人工智能数据合规痛点与解决思路 Owen跨境
2025-11-11
25
导读:柳峰,北京大学上海临港国际科技创新中心数据跨境流通技术研究中心主任、特聘研究员;李兰兰,广东省律师协会合规与风控专委主任。


(会议现场)




11月7日,为深入贯彻落实党的二十届四中全会精神,助力数字强省建设,省律协在“东数西算”国家枢纽节点韶关举办高水平法律服务助力数据要素市场高质量发展学术会议。会议聚焦数据要素市场法治建设与律师行业专业能力提升,邀请北京大学上海临港国际科技创新中心数据跨境流通技术研究中心主任、特聘研究员柳峰,广东省律师协会合规与风控专委主任李兰兰等4位专家围绕数据要素市场热点议题作主旨演讲。


本篇聚焦柳峰主任和李兰兰主任的主旨演讲精彩内容,柳峰主任深入分析了数据跨境流动的规则与适用,李兰兰主任则全面解读了人工智能数据合规痛点与解决思路。




(柳峰主任)


柳峰主任指出,针对数据跨境流动领域体系架构不完整、实务操作体系不清晰、双向合规实践难等问题,北京大学上海临港国际科技创新中心联合国内企业进行数据跨境流动的体系架构研究、实务操作体系探索与基础设施开源平台试点,通过建立技术对等、双向合规的数据编码登记体系,助力企业实现全流程跨境合规。


(李兰兰主任)


李兰兰主任首先以2025年最火的大模型DeepSeek为例,指出在全球开放以来,美国、意大利、比利时、印度、澳大利亚、韩国、荷兰等国对其提出的数据合规问题主要集中在数据安全、个人隐私保护、数据跨境传输等方面。在我国,大模型的数据合规审查法律依据包括《网络安全法》、《数据安全法》、《个人信息保护法》、《网络数据安全管理条例》、《生成式人工智能服务管理暂行办法》等。


李兰兰主任强调,目前AI在我们日常工作和生活中发挥非常便捷的作用,但同时伴随着大规模的应用也出现了一些问题,如AI辅助医疗诊断系统,模型幻觉可能导致医疗事故,患者隐私信息可能泄露于输出结果中;传统小模型在复杂场景易产生模型幻觉导致风险评级错误等;AI生成剧情文本可能包含暴力/歧视性内容等;低质量数据导致的模型输出偏差如招聘模型性别歧视等。出现这些问题与大模型语料来源及内容质量密不可分。《全国数据资源调查报告(2024年)》显示,在人工智能领域,全球主流基础大模型的中文语料仅占全部语料的1%,高质量中文数据成为制约我国基础大模型能力的瓶颈。因此,高质量的中文训练语料显得越来越重要,训练语料的合规性也是越来越重要。语料合规应重视来源合规、内容合规、标注合规等。其中,语料来源合规方面建议开展语料质量评估、语料多样性评估、语料可追溯性评估等;语料内容合规方面则应加强内容过滤评估、知识产权保护评估、个人信息保护影响评估和个人信息保护合规审计等;在语料标注合规方面则应重视标注人员管理、标注规则建设、标注内容审核及存储要求等。


李兰兰主任指出,根据《生成式人工智能服务管理暂行办法》关于“使用具有合法来源的数据和基础模型”的要求,训练数据需通过合法渠道获取采用,不得侵犯第三方合法权益。根据不同的数据来源方式探讨其来源合规性:一是自采来源合规。通过APP、小程序、传感器等工具自动收集数据,如自动收集IP地址,应基于“合法利益”或“履行合同”目的进行收集和处理;在隐私政策中新增“模型训练数据来源”章节,明确说明用户输入数据是否用于训练;若使用用户交互数据用于模型优化,需单独告知并获得用户同意。同时,应避免未经授权使用受保护作品,通过技术手段对训练数据进行版权过滤与合规性审查等。二是开源许可来源合规。根据不同的开源渠道分别审查相关开源协议或开源许可证中对使用目的、使用方式、排他性等约定和提示,同时还应注意不得对相关网络稳定性和安全性造成不利影响等。三是数据交易来源合规。审查数据提供方主体的合法合规基础上,注意交易合同中关于数据来源的合规义务和责任、知识产权和数据权益的约定等;如数据提供方的数据来源于其上一链路的提供方,则应调查上一链路的数据来源的合规,同时注意留存对语料合规审核流程的证明材料。(律师开展数据交易合规审查可以参考《广东省律师协会律师从事数据交易合规评估业务操作建议流程》)。四是用户输入来源合规。很多平台网站的内容会由用户主动提供和传输,比如AI换脸等应用平台,平台规则或合同中约定好各方的权利义务,涉及传输违法内容如涉赌等情形时,应当由用户承担相应法律责任,作为平台还有一个监督义务,应当采取措施监测和保障平台内容的合法合规性,因此,如发现内容违规情形时,可立即采取删除、断开链接等措施。涉及接入其平台的第三方产品和服务提供者,还应约定相关的数据合规义务。五是共享授权来源的合规。涉及公共数据,应依据国家和当地的公共数据授权运营的规定审查其授权流程的合法合规性,及授权运营协议中对授权应用场景、授权期限、数据处理方式、数据权益等约定。


最后,李兰兰主任对于大模型的数据合规提出四点建议:一是完善语料来源合规的审核流程并留痕;二是第三方合规审查与机制建设;三是开展个人信息保护影响评估及机制建设;四是定期开展个人信息保护合规审计。


更多专家的智慧火花持续绽放,敬请关注后续分享,聆听更多前沿洞见。



供稿 | 发展部

编辑、排版 | 李霞

校对 | 宣传部


【声明】内容源于网络
0
0
Owen跨境
跨境分享汇 | 持续提供优质内容
内容 44793
粉丝 1
Owen跨境 跨境分享汇 | 持续提供优质内容
总阅读229.9k
粉丝1
内容44.8k