摘要:基于新浪微博和今日头条评论数据,综合运用多样化的网络文本分析技术,捕捉公众对人工智能安全的认知和态度,以提高研究结果的科学性与深度。研究发现,公众的关注主要聚焦于技术安全性、社会变革与影响、治理与监管三个层面。而公众对人工智能安全认知态度呈现复杂多样性,一方面,公众对人工智能技术发展抱有积极期待,认为其能推动技术创新和产业发展,并造福社会;另一方面,公众也对人工智能应用安全持有关切和担忧,对可能引发的危害公平竞争、消费者权利侵蚀、失业和监管失灵等风险和安全问题给予密切关注。针对上述问题,提出构建“系统-公众”开放性交流机制、提升全民人工智能安全素养、健全法治与技术双重保障体系、积极引导转业就业等引导策略,力图有效化解公众对人工智能的担忧,有助于公众积极调适并融入人工智能技术在安全框架下的健康应用中。
关键词:人工智能安全;文本挖掘;在线评论;公众认知
过去十年,人工智能在深度学习和自然语言处理等领域的进展,使其在医疗、金融和教育等行业表现出近乎人类的能力,提升了生产效率与生活质量[1]。然而,伴随技术扩散,隐私泄露、算法歧视和职业替代等安全隐患和伦理风险日益显现,其越来越影响人工智能的社会接受度和政策制定。因此,深入理解公众对人工智能安全的认知与态度,引导公众积极调适以应对人工智能时代的冲击成为重要议题。
近年来,人工智能安全的一些关键议题备受学者们关注。其一,算法偏见与歧视问题,由于训练数据不均衡或模型设计缺陷,AI 系统可能在决策中产生不公平结果[2],如面部识别、招聘算法对特定性别与族群存在偏向[3-4]。其二,隐私保护[5]、自动化失业[6]与责任归属[7]等社会伦理问题也备受争议。其三,人工智能的滥用对市场的冲击问题。研究者认为它会对市场与社会秩序造成冲击,包括杀熟定价、虚假信息生成等[8]。研究者除了对人工智能安全风险展开研究外,也积极探索公众对人工智能的认知。他们发现,公众对人工智能的认知与情感复杂且动态,全球大多数人对其商业应用感到担忧,尤其在就业与隐私方面[9],但短期又对 AI 技术的便利性充满期待[10]。在国内,公众态度从 2018 年的有限认知逐渐转向 2020 年的积极开放[11-12],公众对人工智能的态度大多中立,正面情感多于负面[13]。另外,在不同应用场景中公众态度差异显著。比如,疫情期间公众对人工智能在医疗和公共健康领域的应用认可度较高,认为其在准确性和有效性上具有优势[14],同时医疗领域超过 67% 的受访者支持 AI 辅助诊断[15];而在教育领域公众对公平性和数据隐私等问题的担忧更加明显[16-17]。
尽管现有文献在人工智能认知方面获得了有洞见的发现,却对“人工智能安全”的具体认知和态度缺乏关注。现有研究多依赖问卷调查或定性归纳,较少利用网络评论这一自发性、动态性数据源来揭示公众的真实关切与潜在逻辑。基于在线评论的文本分析,有助于弥补现有研究的直观性和普遍性不足,能揭示公众对人工智能安全的真实态度与关注点。基于此,本文通过文本挖掘与质性分析相结合的方法,系统分析公众在在线评论中对人工智能安全的认知与情感特征,并以此细粒度探讨公众态度引导策略,既丰富和支持了前人在该领域的理论研究,又有助于引导公众参与人工智能安全治理。
研究设计
本研究采用 LDA 主题模型和情感分析对公众评论进行文本挖掘,具体步骤如下。
(1) 数据收集与预处理。获取新浪微博和今日头条平台相关评论数据文本,构建初始语料库;对收集到的数据进行过滤、降噪等预处理工作以提高研究的准确性和可信度。
(2) 高频词及社会语义网络分析。为初步揭示评论中出现的重要关键词和其潜在语义结构,本研究运用 TF-IDF 算法提取高频词并进行可视化分析,以识别公众关注的核心内容;基于高频词构建共现矩阵,利用 Gephi 生成语义网络图,深入探讨关键词之间的关联与潜在意义,从而更准确地把握公众对人工智能的态度和观点。
(3) LDA 主题建模。LDA 主题模型本质是贝叶斯概率模型,用于从大规模文本中自动提取潜在主题并完成聚类(见图1)。本研究将公众网络参与视为语料库,留言视为词的集合,假设每条评论由若干隐藏主题混合而成,通过参数 α 和 β 确定留言-主题和主题-词的概率分布。生成新留言的过程为:先从留言对应的主题分布中抽取主题 Z,再从主题 Z 的词分布中抽取词,重复 N 次(N 为留言中的词总数),最终生成新留言。最后,将新留言与原有留言比较,选择相似度最高的 α 和 β 作为最终输入参数[18]。为了优化模型效果,设置主题数量在 3 到 10 个之间,计算各模型的困惑度和主题连贯性,选择困惑度最小且连贯性最高的模型作为最优模型[19]。此外,提取各主题中概率最高的 10~15 个关键词,结合语义分析确认主题含义,同时计算评论的主题概率分布和各主题的权重,反映其热度和集中度。通过定量评估和定性解释相结合的方式获得评论的最优主题分类,从多维度深入了解主要讨论主题,并妥善处理主题数量设置对 LDA 建模结果的影响。
图 1 LDA模型示意图
注:α和β分别是留言-主题与主题-词的狄利克雷分布;ψ和Φ分别是每一条留言与K个主题相对应、每个主题与语料库中所有词集合相对应的多项分布;D是语料库包含的留言数。
(4) 情感分析。使用 SnowNLP 中实现的方法对每个已识别主题下的评论进行情绪分析,能够确定每个讨论主题的整体情绪极性。具体来说,评论语料库中的每个词根据其情绪倾向分为积极、消极和中性。通过分析主题级别的汇总情绪分数,研究能够深入了解公众情绪倾向以及评论中表达的不同讨论主题的偏好[20]。情感分析结果还补充了 LDA 建模,以增强提取主题的可解释性。与主题建模一起,这个多维分析框架为在线评论中涵盖的主要主题和表达的态度提供了全面的视角。具体研究框架如图 2 所示。
图2 研究框架
数据获取及处理
以新浪微博与今日头条上公众对人工智能安全问题的评论作为研究数据,为后续文本挖掘与情感分析奠定了重要基础。中国最大的社交媒体平台就是新浪微博,微博平台具有信息资源共享、检索和利用便捷、信息采集、传播和更新快捷等优点[21]。新浪微博月活跃用户和日活跃用户量在国内微博服务领域处于领先地位[22]。其形成的大量公众评论,反映出真实用户在不同话题下的真实看法和立场。此外,今日头条作为中国最受欢迎的内容聚合平台之一,拥有庞大而多样化的用户群体,该平台涵盖广泛的主题和领域,包含与人工智能相关的新闻、文章和视频,为研究提供了丰富的话题和讨论。同时,今日头条的评论功能相对开放,用户可以自由表达意见,从中能获取公众的真实反馈和意见。
为获取微博与今日头条两大平台上关于人工智能安全感知的文本评论,本研究利用Python,以“人工智能安全”“AI风险”等为关键词,抓取了2018年1月—2024年3月的所有相关微博与今日头条中的相关文章,再进行主题词提取,得到与人工智能安全相关的话题词,再以话题词为关键词进行评论爬取,最终一共爬取了4142篇话题文章,获得46467条评论数据,再进行一系列相关数据处理与数据清洗后,最终累计获得33789条有效数据。
公众对人工智能安全认知分析
3.1 公众对人工智能安全总体认知
从2022年开始,人工智能安全相关话题文章在微博和今日头条等社交媒体平台上发表数量逐渐增多(见图3),这一现象可以归因于多个重要因素,包括技术的快速发展、日益增长的人工智能应用范围、社会关注等。一方面源于技术的快速发展,人工智能的应用已经渗透到人们生活的各个方面,许多人对其产生了依赖,甚至难以想象没有人工智能的生活。另一方面,随着AI在各个领域的不断扩展与应用,其引发的安全问题也愈发复杂和多样化,例如通过自动化的钓鱼攻击,生成高度个性化的钓鱼邮件等安全问题近几年来层出不穷,使得公众对人工智能安全担忧加剧。这促使了相关话题文章的增加,以满足公众对安全问题的需求。此外,社会对人工智能的关注不断提升,推动了人工智能安全研究的发展。政府、学术界、产业界和公众加大投入,促使更多研究机构和团队投入相关领域开展研究,进一步推动相关话题文章的发表。因此,人工智能安全相关话题文章在社交媒体平台上的发表数量逐渐增多,反映了公众对人工智能安全问题的认知程度越来越高,人工智能安全在学术和社会领域日益受到重视,人工智能安全研究将会向纵深方向发展。
图3 近几年社交平台上人工智能相关话题发表数量情况
通过对近几年人工智能相关话题的评论进行关键词提取,本研究基于TF-IDF值选取了排名前20的高频词,并绘制词云图以直观展示公众的关注重点(见图4)。分析结果表明,公众的关注主要集中在人工智能技术及其应用场景,以及对人工智能的态度和看法。首先,"人工智能""技术""模型"等高频词的出现表明公众对人工智能技术的高度关注,同时"安全""风险""隐私"等词的突出则表明公众对人工智能可能带来的安全隐患和隐私问题存在担忧。其次,随着人工智能的快速发展,特别是ChatGPT等的出现,公众对人工智能在社会、经济及个人生活中的深远影响表现出浓厚兴趣。关键词如"自动驾驶""数据""工作""人脸识别"和"大数据"频繁出现,进一步验证了公众对人工智能在各领域及场景应用的重视,同时也揭示了其衍生问题的认知。此外,"失业""伦理""价格歧视"等词从侧面反映出人工智能技术应用可能引发的社会影响和潜在问题。综上,公众对人工智能的关注覆盖技术风险及其在各领域应用所引发的社会、经济问题,显示出公众对人工智能的多维度思考以及对其潜在影响的审视。
图4 人工智能在线评论高频词词云图
高频词反映文本中单词的出现频率,未涉及语义关系。而社会语义网络通过分析单词之间的相关性和语义联系,生成由词语及其关系构成的图形,展现同义、反义及上下文关联等语义关系。因此,为了进一步探讨各高频词之间的联系,需借助社会语义网络分析,在已有语料库的基础上,将焦点落于词频与词频间的关联和意义,能够实现词条语义的深度解构[23]。借助Gephi进行社会语义网络分析并进行可视化,生成了社会语义网络图(见图5)。从层次划分来看,根据"核心-边缘"的层次结构,可将整体语义网络图划分为"核心-次核心-过渡-边缘"四层结构[24]。第一层由"安全风险""安全""网络安全""人工智能"构成,主要与公众本质核心紧密连接,共同构成了公众心目中最核心的关注点,即表示公众对人工智能产生安全感知。第二层由"生成式人工智能""大数据杀熟""数据泄露""大数据""隐私泄露""人脸识别""虚假合成"等词汇构成,进一步拓宽了公众对人工智能安全与威胁的关注范围和认知程度,揭示了人们对安全问题的具体关切。现实案例显示,某些实际应用场景引发了公众对相关安全和威胁问题的关注,例如生成式人工智能模型被用于制造虚假新闻、欺骗性内容,加剧公众对于信息真实性和可信度的担忧,大数据杀熟现象可能导致个人信息被滥用,消费者受到不公平的定价和服务待遇等。公众对于这些问题的担忧是合理的,但需要采取有效的措施对人工智能应用安全加以治理,并引导公众理性关注,确保公众对人工智能安全的信任和信心。第三层主要包括"价格歧视""机器人""互联网""消费者""隐私""失业""监管"等词,反映出人工智能应用背景下衍生出的社会问题,例如,公众担心人脸识别技术会导致个人隐私泄露,害怕机器人和自动化技术会造成大规模失业,担心消费者会受到人工智能引发的价格歧视和隐私侵犯等。这突显了公众对人工智能在个人隐私、 经济利益和职业安全等方面存在深深的不信任和缺乏信心。
图5 人工智能在线评论社会语义网络图
3.2 LDA 主题分析
通过特征提取和语义网络分析,可以识别公众对人工智能安全感知的关注点及其关系,但无法深入挖掘评论的具体语义。LDA 主题模型不仅揭示潜在主题,还能分析公众对人工智能安全的具体担忧和期望。根据文本特点,本研究预估主题数在 3~15 之间。建模结果显示:当主题数超过 12 时困惑度上升,发生过拟合;在 3~12 之间评估,主题一致性在主题数为 5 时最高(见图 6)。综合理论依据与评估结果,最终选择 5 个主题作为文本分类体系。
图6 主题一致性计算
基于 LDA 主题模型的"主题-关键词"分布结果(见表 1),并结合语义及具体应用场景,对相关主题进行归纳与解释。
主题 1 为"视觉技术与个人信息安全"。 近年来,人脸识别等视觉技术广泛嵌入安防与公共管理,在提升便捷性与安全性的同时,加剧了公众的隐私担忧。过度依赖面部特征与身份数据可能诱发信息泄露与滥用风险,尤其是在系统漏洞或黑客攻击的情境下,不仅威胁个人信息安全,还可能放大社会监控和秩序问题。由此可见,视觉技术发展与个体隐私权保护之间存在显著张力。
表1 LDA 主题模型结果
主题2为"算法与数据垄断"。公众忧虑集中于大型平台依托庞大用户数据形成的数据垄断,并利用算法实施如"大数据杀熟"等差异化定价策略。具体而言,平台可能基于用户的搜索行为、浏览习惯与消费记录,制定差异化的价格或服务,从而引发对价格歧视与资源分配不公的担忧。同时,数据在算法驱动的市场决策中所扮演的重要角色,也加深了公众对数据滥用、隐私泄露及定向广告等问题的忧虑。在此背景下,公众普遍呼吁相关监管机制与法律制度的建立,以约束企业行为并缓解由算法与数据垄断带来的不公平现象。
主题3为"自动驾驶安全与风险"。自动驾驶的安全性与可靠性是公众关注焦点。复杂环境中的识别精度不足与接管延迟可能增加事故风险,驾驶责任的模糊也引发公众质疑。此外,"道德困境"情境下的决策公平性与传统驾驶岗位可能的流失,进一步加剧伦理与就业压力,引发公众对就业安全与社会稳定的焦虑。
主题4为"网络安全与社会风险"。随着人工智能的快速发展,其高度复杂的系统结构和对大规模数据的依赖,使其更易暴露于安全漏洞和隐私威胁之中。公众担忧黑客可利用技术漏洞窃取个人数据或篡改模型参数,从而影响系统预测的准确性与公正性。同时,人工智能也可能被不当应用于网络犯罪,例如通过自然语言处理与生成技术提升诈骗与钓鱼攻击的隐蔽性和欺骗性。在此背景下,公众对日益复杂的网络威胁表现出持续性的恐慌与警惕。
主题5为"失业与职业安全"。人工智能的自动化潜力带来效率提升与新就业机会,但同时引发公众担忧其对传统职业的替代效应。对制造业等劳动密集型行业冲击尤甚,大量重复性与繁重岗位会被机器人取代,公众对此表现出强烈焦虑。各国尝试通过再培训与技能转移缓冲冲击,但围绕招聘决策中的算法歧视与权责界限模糊等新风险亦不断涌现。这些担忧凸显了技术进步与劳动伦理之间的紧张关系。
根据各主题在文本中的概率分布(见图7),公众对人工智能议题的关注呈现出一定差异化特征。结果显示,主题1视觉技术与个人信息安全的概率最高(0.486),凸显公众对基于人脸识别与大数据应用所引发的隐私泄露与信息滥用问题的高度敏感与担忧,反映出人工智能发展与个人权益保护之间的核心张力。其余主题的概率分布相对接近:主题2算法与数据垄断为0.147,主题3自动驾驶安全与风险为0.131,主题4网络安全与社会风险为0.136,共同揭示了公众对人工智能系统性安全隐患的深层忧虑。人工智能的复杂性与高度智能化特征既提升了社会效率,也使其更易受到攻击,进而加剧了社会对算法偏差、自动驾驶失误及网络犯罪的警觉。相较之下,主题5失业与职业安全的概率最低(0.100),显示公众对就业替代的关注度低于技术安全问题。然而,其所折射出的就业不稳定性与社会结构变动,依然可能引发长期的社会焦虑与不平等。这一结果表明,人工智能治理不仅需着眼于技术与系统风险,更需兼顾劳动与社会治理维度,方能实现可持续发展。
图7 主题-文档概率分布
3.3 情感分析
基于词频特征分析,本研究进一步利用情感分析探讨公众对人工智能安全的认知。通过 Python 的 SnowNLP 库对评论进行情感分类,生成 0 ~ 1 范围的情感极性分数,0 接近消极,1 接近积极。情感分小于 0.45 为消极,大于 0.55 为积极,中间为中性,并将 0.15 作为阈值,将积极和消极情感分为轻度、中度、强度三级[25]。通过定量计算情感极性分布,客观识别不同立场评论的情绪成分,揭示公众关注点及心理驱动因素(见表 2、表 3)。
表2 网络评论情感分布表
表3 网络评论情感倾向分布
公众对人工智能安全的情绪感知通过评论情感倾向表现,积极情感表明态度正面,消极情感则反映负面态度。在33789条评论中,积极评论占52.09%,中性占9.15%,消极占38.76%,积极情绪文本与消极情绪文本都占据了主导地位,表明公众对于人工智能安全问题既有积极的一面又有担忧的一面。从正面与负面情感细分来看,积极情绪中轻度、中度、高度情感倾向分别占18.96%、20.64%、60.40%,高度积极情绪为轻度的3.1倍;在消极情绪中,三者分别占25.60%、24.69%、49.72%,高度消极情绪分别约为轻度和中度的2倍。综上,公众对人工智能安全的评论表现出明显的两极化趋势,积极情绪占比稍高,但高度积极评论仅占60%左右,说明不少人对人工智能安全的乐观看法仍较模糊。同时,消极评论比例较大,其中近一半表现出强烈负面情绪,反映公众对人工智能安全问题存在深度担忧与质疑。这种两极化情感体现了公众对人工智能安全的复杂态度,既认可其安全问题和技术可控性,也担忧其潜在风险与不确定性。
为了进一步探究不同情境下公众对人工智能安全的正负面关注,对 LDA 模型生成的各主题下的评论文本进行了情感分析,并根据各主题在评论文本中出现的概率,对各主题的情感强度进行加权计算,结果见图 8,正值为积极情感强度得分,负值为消极情感强度得分[26]。
图8 主题情感强度
结果显示公众在不同人工智能安全主题上的情感强度存在显著差异。对主题 1 视觉技术与个人信息安全情感最复杂,既有最高的正向评价(0.082),也伴随最高的负向担忧(-0.068),表明公众认可视觉技术带来的社会进步与其巨大潜力与优势,但与此同时,其技术进步也引发了公众对其可能存在的风险和隐私问题有很大的担忧;主题 4 网络安全与社会风险整体偏向积极(0.049),负面较弱(-0.008),人工智能技术作为新一轮科技革命的核心,对网络安全有着深远影响,其在网络安全与减少社会风险方面的应用使公众对其充满期待和关注,公众可以通过网络安全措施能够提升安全感和社会稳定。相比之下,主题2算法与数据垄断、主题3自动驾驶安全与风险和主题5失业与职业安全以消极情感为主,分别约为-0.037、-0.034和-0.029,反映出对隐私、安全与就业问题的担忧。总体而言,公众对网络安全与社会风险持乐观态度,认可其在提升安全和稳定方面的作用;对算法与数据隐私、自动驾驶安全与风险、失业与职业安全的担忧更突出,主要集中在隐私、安全隐患和就业问题。对于视觉技术与个人信息安全,公众同时表现出高度期待与深切担忧,反映出技术应用中需在便利与风险防范之间取得平衡。因此,尽管公众认可人工智能技术的潜力,但也对其可能带来的负面影响保持警惕,需要在推广技术的同时加强相关风险管理和隐私保护。
3.4 结果讨论
基于上述微博和今日头条公众评论的情绪和主题分析结果,从以下三个角度进行讨论。
(1) 从技术发展与应用的视角来看,随着人工智能技术逐步渗透至更多领域,公众对其安全议题的关注持续增强。总体而言,公众对人工智能持积极接纳态度,但亦期望其发展能够充分兼顾潜在安全隐患与社会影响。我国公众在金融、交通、教育等重点领域的安全与风险认知尤为深刻,凸显人工智能日益嵌入社会生活所带来的风险感知与权益担忧。反映出人工智能发展与个人权益保护之间的结构性矛盾:人工智能提升了社会效率与生活质量;但其潜在的隐私泄露、系统漏洞及伦理困境等问题,构成了对公众合法权益的潜在威胁。
(2) 从数据安全与个人隐私的视角来看,基于在线评论的主题分析结果显示,公众关注点广泛,涵盖数据安全、算法透明与视觉隐私等方面。公众普遍对人工智能带来的隐私风险高度警惕;其虽能提升网络安全中的威胁检测与防御水平,却也可能放大网络攻击与数据泄露风险。随着数据资源日益集中,公众对单一机构或企业过度控制数据的风险表达不安,认为其可能侵蚀个体数据主权,削弱选择权,并推动市场垄断与算法偏见的滋生,此与既有研究结论相符[27]。因此,若数据安全与隐私保护问题得不到有效回应,公众信任或将受损,进而阻碍人工智能的健康与可持续发展。
(3)从道德与社会影响视角来看,人工智能的发展引发了一系列亟须回应的伦理与社会议题。在伦理层面,自动驾驶中的紧急情境决策、医疗人工智能的诊疗责任及患者自主权保障,凸显责任划分与社会共识的重要性。在社会层面,自动化趋势可能重塑就业结构,制造业、零售业与服务业面临冲击,加剧公众焦虑与结构性不平等,因而教育提升、职业再培训与社会保障成为必要的政策方向。此外,人工智能在信息生态中亦带来新型风险:算法推荐加剧"信息茧房"与社会分化,人工智能在网络攻击与舆论操控中的应用削弱公共信任,危及社会稳定。上述伦理与社会风险的交织表明,人工智能治理已超越单一技术范畴,亟须在伦理规范、法治建设与社会治理框架上实现系统性完善,以确保其可持续与负责任发展。
3.5 引导策略
面对人工智能应用引发的多重安全挑战,治理策略不应仅限于严格的监管措施,还需在技术发展与社会影响之间寻求平衡与包容的调节机制。为进一步引导公众积极应对人工智能带来的安全问题,可以采取以下应对策略。
3.5.1 构建"系统-公众"开放性交流机制,增强对人工智能信任
建立开放性交流平台,让公众表达对人工智能的意见与担忧,并及时获取技术发展与应用信息。通过公开运行报告和安全评估结果提升透明度,同时加强风险评估与信息披露,帮助公众理解潜在风险和防护措施。此外,推广可解释机制,使模型决策逻辑更加清晰,缓解"黑箱"担忧。在互动机制中充分吸收用户反馈,形成动态维护与纠错的闭环。总之,增加透明度和解释能力对增强公众对人工智能系统的理解和信任都具有积极意义,这将是当前人工智能治理的一个重要方向。
3.5.2 提升全民人工智能安全素养,增强公众安全防护意识
提升公众人工智能安全素养是治理的重要环节。当前舆论多聚焦应用与商业价值,而对安全隐患与社会影响重视不足,导致公众认知失衡[28]。因此,政府与社会机构应以风险防护为核心,推动系统化科普和教育,以风险案例和实际问题为切入点,多渠道普及隐私保护和防护知识,培养公众理性认知与自我保护能力,营造良好的技术治理环境。
3.5.3 健全法治与技术双重保障体系,引导公众正确维权
完善法治与技术相结合的保护体系,强化对数据隐私与个人信息的安全防护。一方面,应以隐私保护原则为核心,开展数据脱敏与分级保护,防止信息滥用;另一方面,以法律制度为依托,对信息采集和使用加强监管,确保合规与透明。同时,畅通举报与维权渠道,建立高效的纠错与赔偿机制,鼓励公众依法维权。在此基础上,发挥社会监督与企业责任,共同构建负责任的数据治理环境。双重保障不仅能提升公众安全感,还为人工智能的可持续发展奠定制度基础。
3.5.4 积极引导转业就业,缓解职业就业安全危机
深刻理解"人工智能+"带来的就业机遇与挑战,关注职业发展和就业安全,提早布局专业和就业扶持计划,引导公众有序转移就业,减少职业市场的动荡和忧惧。政府应提前布局,预判受冲击行业与群体,制定前瞻性就业援助政策,并通过专家研讨及时识别风险。对重点行业劳动者提供职业培训与再就业支持,帮助其顺利转型。通过多层次就业扶持计划,为劳动者提供稳定的过渡渠道。只有在产业升级的同时完善再就业保障,才能缓解公众焦虑,提升社会对人工智能发展的信心。
结论与展望
深挖公众对人工智能安全的认知与态度,以新浪微博和今日头条的评论文本为研究样本,力图全面掌握社会大众的真实想法。研究发现,公众关注点主要集中在三个层面:其一,技术安全性,公众关注人工智能技术本身的安全性,包括算法的安全性、数据的安全性等;其二,社会变革与影响,公众关注人工智能技术对社会的变革与影响,包括就业、隐私、伦理等方面的问题;其三,治理与监管,公众关注人工智能技术的治理与监管问题,包括政策制定、法律法规的完善等。此外,公众对人工智能安全的认知与态度呈现出复杂多元的特征。公众对人工智能技术发展抱有积极期待,认为其能推动技术经济发展,造福社会;公众也对人工智能应用可能引发的各类风险及应对策略表示担忧。这种矛盾并存的认知态度折射出公众对人工智能前景的期许,亦映射出其对技术潜在危害的隐忧。
价值贡献在于:(1)从多维度研究视角揭示公众对人工智能安全感知现状。现有研究多采用单一的问卷调查或定性研究的方法,本研究采用文本挖掘和情感分析相结合的多种方法对大量在线评论进行深入分析,为人工智能安全与治理的研究提供了一种创新性的研究视角,能更准确地反映公众的实际关切,为制定治理政策提供依据。(2)丰富了人工智能安全认知理论。以往研究多集中于探讨公众对人工智能应用的态度,本研究聚焦于公众对人工智能安全问题的认知挖掘,弥补了公众人工智能安全认知理论的不足。
不足之处有:(1)不同的用户使用的语言风格和表达方式可能不同,这给语言数据收集和预处理带来挑战;(2)目前大多数情感词典是基于海外语言和文化开发的,对于我国的特征和文化语境的覆盖较少,未来应优化情感词典,提高挖掘精度。
来源 | 公众号“科学与管理”,原文刊于《科学与管理》第46卷第2期
作者 | 颜志萍 硕士研究生,研究方向:平台治理,安全治理;李文鹣(通信作者) 博士,副教授,硕士生导师,研究方向:平台经济,平台治理
往期推荐
审核:梁兆南、陈华博
关于联盟

