点击图片 即可查看课程详情
基于AIGC的数字化教育资源开发新范式
2022年是AIGC(Artificial Intelligence Generated Content,译为“人工智能生成内容”)火爆出圈的一年,其标志性事件是OpenAI发布的大型语言生成模型ChatGPT。ChatGPT除了具有交互式问答的优势外,还可以实现完成代码生成、论文写作、诗词创作、新闻写作、音乐创作等多场景任务。全球各大科技企业都积极拥抱AIGC,不断推出相关技术、平台和应用,如谷歌的Bard、百度的文心一言、阿里的通义千问等。当前,AIGC已率先在传媒、电商、影视、娱乐等行业取得创新性应用,其在教育领域的应用前景也广受学界和业界关注。教育领域中与AIGC应用最为契合的当属数字化教育资源建设与开发。AIGC作为人工智能时代内容创作的变革性工具之一,为解决数字化教育资源开发中的瓶颈问题提供了新的思路和解决方案。在AIGC场景下,人机共创将成为数字化教育资源开发的新方向。本研究试图对基于AIGC的数字化教育资源人机共创的可能性和必然性进行分析,对基于AIGC的数字化教育资源人机共创范式内核进行阐释,建立基于AIGC的数字化教育资源人机共创框架,明晰基于AIGC的数字化教育资源人机共创流程,以期为数字化教育资源开发者和相关研究者提供借鉴和参考。
1.数字化教育资源开发的演进历程与发展趋势
我国数字化教育资源开发在演进历程上,按开发主体的不同,可分为政府开发模式、市场开发模式、公益开发模式和自主开发模式四种。
开发与共享是资源建设过程中相辅相成的两个环节,开发与共享往往形成联动效应,共享模式的演进在一定程度上能反映出资源开发理念的演化和发展过程。按共享模式的不同,我国数字化教育资源开发主要经历了共建共享、公建共享、共创共享三阶段的发展过程。
按资源内容生成模式的不同,数字化教育资源在演进上又可分为专业生成内容、用户生成内容、AI辅助生成内容和AI生成内容四个阶段。专业生成内容,是由专业个人或团队有针对性地开发具有权威性的、制作精良的教育资源。用户生成内容,泛指用户将自己原创的内容通过互联网平台进行展示。AI辅助生成内容是指互联网用户或专业团队在AI的协助下生成内容。AI生成内容亦即AIGC,是AI辅助生成内容在技术上的进一步发展,其终极目标是AI脱离人的辅助直接自动、自主生成内容,大幅提升内容生成效率。不过,AIGC在数字化教育资源开发领域的应用尚处在理论探讨层面,目前尚无相关实践案例。
通过对我国数字化教育资源开发的演进历程进行梳理,可以发现,我国数字化教育资源开发历经多年发展,在资源开发模式上已较为成熟,整体呈现出多方开发主体协同、多类用户参与、多种共享模式共存的资源开发特色。但现有资源开发模式仍存在一定的瓶颈,首先是资源体量还不够大,资源类型还不够丰富,无法完全满足数字化时代师生对资源的多样化、海量化需求。其次是资源开发效率有待提高,目前的资源开发主要以人工开发为主,需要耗费大量的人力、物力和时间。再次是资源质量难以完全得到保证,尤其是在多用户共创共享、用户生成内容等资源开发模式下,容易出现资源质量参差不齐等问题,资源开发方需要投入大量的精力和成本进行资源质量监控和内容审核。
随着AI在新闻写作、剧情续写、视频剪辑、语音生成等领域的广泛应用,资源开发者与AI协同开展资源开发,进行人机共创,将成为数字化教育资源开发领域新的发展趋势,有望解决当前数字化教育资源开发中体量、效率和质量等瓶颈问题。在人机共创模式下,一方面,AI内容生产将推进数字化教育资源开发的批量化、海量化、高效化,另一方面,资源开发者可以从传统资源开发工作中解放出来,扮演资源质量把关者、资源开发协同者、资源内容共创者等角色,不断拓展自身创造力和创意力,使资源开发过程更具科学性、协同性和创意性。
2.AIGC在内容生成方面的技术优势
AIGC的发展源于算法、数据和算力的综合提升,其运用大量基础算法模型,突破内容生成数量与规模的上限,使得内容生成越来越走向自动化和智能化。
在算法层面,AIGC算法模型不断获得突破。Transformer模型、Diffusion模型等基于深度学习算法的模型相继出现,并被运用于自然语言处理领域。2023年3月GPT-4发布,该模型具备强大的识别能力,允许用户指定视觉或语言任务,并具备长内容创建、扩展会话、文档搜索和分析等功能。在数据层面,当下的Web 3.0数据资源同时具有海量化、智慧化、多模态、自组织等多重属性,为AIGC出现与发展提供了强有力的数据“原料”保障。在算力层面,以ChatGPT为例,AI算力是ChatGPT模型训练与产品运营的核心基础设施,在ChatGPT大模型的三次历史迭代中,OpenAI的GPT、GPT-2和GPT-3的参数量从1.17亿增加到1750亿,对算力的需求也在飞速上涨。出现如此巨大算力需求的根本原因是AI的算力不再是传统算力,而是“智能算力”,以多维度的“向量”集合作为算力基本单位。
基于AIGC的技术原理,其在内容生成方面具有天然优势:第一,自动化内容创作与生成。预训练模型技术大幅提升了AIGC模型的通用化能力和工业化水平,同一个AIGC 模型可以高质量地完成多样化的内容输出任务,实现内容生产与服务的自动化。第二,多模态信息融合与交互。多模态融合是指将多种感官进行融合,而多模态交互是指人通过多种通道与计算机进行交流。随着算法模型持续性的迭代升级,AIGC技术正朝着多模态信息融合、跨模态内容生成、智能化场景落地的方向快速发展,多模态信息融合与交互正成为AIGC区别于传统UGC和PGC的显著技术特征。第三,具备认知交互能力。在传统技术环境下,代码的输入输出是人与机器交互的底层逻辑,人和机器的交互可以通过鼠标、触控等方式来实现。AIGC的出现则为人与机器的沟通带来了更为多样化和便捷化的交互方式,通过文本对话交互、语音交互等方式模拟人类对话过程,使机器交互能力上升到类人化层面,在交互感知和交互手段上更具先进性。
3.AIGC与数字化教育资源人机共创的契合性
基于AIGC的内容生成特点及技术优势,其与数字化教育资源人机共创具有极高的契合性,具体体现在如下三个方面:
(1)AIGC已具备与人类进行资源共创的潜力
首先,AIGC发展到现在已具有极强的内容生成能力,这种生成能力使其可以在资源内容创作中大展拳脚。AIGC能够以优于人类的信息生成能力和知识水平承担信息挖掘、素材调用、复刻编辑等基础性机械劳动,从技术层面实现以低边际成本、高效率的方式满足海量的数字化教育资源生成需求;同时能够创新内容生产的流程和范式,从而推动教育资源开发向更有创造力的方向发展。其在内容生产领域即将实现三大技术突破:一是智能数字内容孪生,即建立现实世界到数字世界的映射,在将现实世界中的物理属性和社会属性进行数字化的同时,对现实世界中的内容进行智能增强与智能转译,以实现现实世界内容到数字世界内容的高质量映射。二是智能数字内容编辑,即通过数字内容的语义理解和属性控制两类技术来实现对内容的修改和控制,从现实世界实现对虚拟数字世界中内容的控制和修改,同时利用数字世界高效率仿真和低成本试错的优势,为现实世界内容生成提供快速迭代能力。三是智能数字内容创作,其主要目标是让人工智能算法具备内容创作和自我演化的能力,实现从基于模仿的内容生成向基于概念的内容生成转变。这三大技术突破均会对数字化教育资源内容及形式的创新产生显著推动作用。
其次,AIGC已表现出一定的创造潜能。随着大模型相关技术的发展,AIGC在创造性内容生成方面已表现出一定的发展潜力。以ChatGPT为例,它作为“通用语言模型”的表现已经超过了专门用语言模型,能够适应不同的任务情境,根据任务情境生成个性化内容。此外,ChatGPT除了能完成传统的模式化内容生成外,还可以模拟人类的创作过程,创造小说、诗歌、戏剧、计算机代码,实现更加高效的创作方式和更加多样化的内容生成,已具备一定原创属性的“生成性”。
(2)AIGC本质上是与人类互动生成的过程
目前AIGC尚不具备完全自发自主生成内容的能力,其内容生成主要以人类的输入为前提,根据人类的输入请求生成个性化输出内容,在本质上是通过与人类进行文字、言语等互动来生成满足人类需求的内容。以ChatGPT为例,其通过自然语言理解来与人类用户对话,通过考虑上下文信息、语义理解来生成人类所需的内容。因此,提问措辞越具体精确、越具有创造性,ChatGPT生成的内容就越具体精确和具有创造性。有研究指出,避免使用模糊的术语和含糊的语言、考虑上下文和前提条件、避免过于主观或带有偏见的问题、避免复杂的问题结构等是向ChatGPT提问式必须要注意的问题。由此可见,能否向AI提出一个好的问题,能否与AI进行高质量的互动,是确保AIGC生成高质量资源内容的前提所在。这也从一个侧面证实,AIGC本质上是人机互动生成的过程,人机共创理念也顺应了这一内容生成机制的发展。
(3)AIGC要生成高质量资源离不开人的审核把关
尽管AIGC使用了先进和高精度的自然语言处理技术,具备达到人类创作水平的潜能,但目前在内容深度、广度和整体质量方面仍存在差距,甚至还有可能包含语言冗余和事实问题方面的错误。OpenAI曾公开表示,ChatGPT有时会写出看似合理但不正确或荒谬的答案,其原因可能是在强化学习训练期间,没有真实的来源;训练模型的谨慎导致它拒绝可以正确回答的问题;监督训练可能会误导模型,因为理想的答案取决于模型知道什么,而不是人类知道什么等。因此,AIGC要生成高质量的数字化教育资源,离不开人类对资源内容的质量审核与把关。以ChatGPT为例,人类可以对其生成的内容进行整合、重组、驳斥、修改和润色等,最终使这些内容达到高质量水平。相关报道指出,从试用ChatGPT的结果来看,它已经具备了一定的创作能力,但与专业人员的写作水平仍存在一定差距,如果得到人类作者的修改和编辑,将可能达到专业化水平。比如,2022年, 英矽智能创始人兼首席执 行官Zhavoronkov博士在科学期刊 Oncoscience 发表了一篇研究观点文章,将ChatGPT列为共同作者,原因是该文章中的大部分内容由 ChatGPT 生成,且Zhavoronkov审核了ChatGPT 生成的观点。再如,2021 年,美国某作家就相关主题向 GPT-3 提问,对所获答案进行编辑润色,将这些答案汇编后生成了一本达到出版水平的书。
1.人机共创的理念与原则
(1)人机共创的理念基础
人机共创即人与机器以协同合作的方式共同创作内容,人机各自承担相应创作任务。人机共创的理念基础是人机协同,人机共创的理想和终极状态是人机共生。
人机协同不是人类智能和机器智能的简单相加,而是一种人机融合的智慧,其目的是让机器智能成为人类智能的拓展和延伸。在价值论层面,人机协同系统可替代人类的部分工作,将人类解放出来,让人类能有精力投入其他更富有创造性的工作。在伦理层面来讲,“人机协同”是对人与技术之间和谐统一和平衡状态的表述,体现工具理性与价值理性的统一。随着人工智能技术的发展,人机协同中的“机”已经超越计算机等一般机器的范畴,人机协同的紧密程度也在不断加深,机器在与人的互动中不断提升智能化水平,人机协同正在向人机共生的高级形态发展。
人机共生这一理念来源于生物学领域中的共生理论。共生理论认为,共生是不同种属的生物按某种物质联系共同生活,按其共生行为方式可划分为偏利共生、偏害共生、互利共生等类型。共生现象不只存在于生物界,在社会、经济、政治、教育等领域也有广泛的应用。人工智能领域的“人机共生”是对人类和机器之间合作互动的一个理想化的发展预期,即通过人与机器之间的和平共处、合作耦合,实现人与机器的和谐相处、共同进化。人机共生强调人机之间的双向“互利”,即利用人类智能和机器智能之间的互补性,将二者结合起来实现共创价值最大化。
(2)人机共创的原则
人机共创的第一条原则是人与机器互促。在人机共创过程中,机器的优势体现在内容生成的速度、效率和体量,能为内容创作快速提供适切的内容和信息;人的优势体现在创作者能合理把握内容创作的方向、构思的深度、内容的结构与形成过程,并且具有个性化创意能力。人与机器互促体现为二者充分发挥各自优势促进内容的创作与生成,机器所生成的内容可作为内容创作者创作时的参考,内容创作者充分发挥运筹、构思和创意能力,对机器生成的内容进行优化重组。与此同时,机器也能以人的创作过程为基础不断对其算法模型进行训练、迭代和优化,不断向人类学习,提升其内容创作能力。
人机共创的第二条原则是人与机器互信。信任是人机合作的前提,相关案例表明,在某些规则清晰、明确且可以良好定义的领域,人工智能已超越人类,且此领域内的工作交给机器去做可能比交给人类做更放心。同时,人机互信是人机协同发展的重要基础,在美国国家研究委员会组织的研讨会上,与会者认为:人类和智能机器可以共同完成彼此无法独自完成的复杂任务;智能机器是人类的学习伙伴,而不是工具媒介。因此,实现人机共创的前提是人与机器要加强互动和合作,人机之间要保持充分的信任关系,达到人和机器各司其职、彼此协同、深度合作。
人机共创的第三条原则是人与机器互补。在人机共创中,智能机器和人类要结合各自的长处,弥补彼此的弱点,增强彼此生成内容的能力。随着大数据技术的发展,质量参差不齐的各类信息资源混杂在互联网上,机器智能由于算法和模型存在的天然不足难以保障其产生的知识信息的质量,这是机器“天生”的弱点。此时便需要充分发挥人的批判性思维和信息鉴别能力,对这些信息进行过滤、筛选和判断,保证机器生成内容的质量。同时,机器快速处理和生成信息的能力也可以帮助人类提高工作效率。因此,人机共创必须遵循人与机器互补的原则,扬长避短,提升人机共创内容的质量和效率。
2.基于AIGC的数字化教育资源人机共创原理
第一,基于AIGC的数字化教育资源人机共创是系统化的人机协同过程。资源开发者与AIGC开展数字化教育资源人机共创旨在融合人的智慧和机器的智能以形成超越人机各自智能的新型资源开发形式。资源开发者与AIGC协同合作、相互作用所产生整体效能由人机各自发挥的效能和二者相互作用产生的协同效能之和组成,产生“1+1>2”的效应。在此过程中,AIGC作为技术人造物,在注入“智能、智慧”的思想后,知识和内容的生成由人和机共同完成,由此形成数字化教育资源建设中人机“双主体”格局。一方面,
资源开发者与AIGC以协同合作的姿态实现技术的具身与应用,以人机融合的方式开展资源内容创作。另一方面,人机共创可以使资源开发的专业化与智能化充分融合,使人机协同向智慧化阶段跃迁。
第二,基于AIGC的数字化教育资源人机共创是人机互动生成的过程。在人机共创过程中,人机互动是人机之间开展信息交换和认知碰撞的有效途径,也是人机共创的基础和前提,能够以用户需求为牵引,以人机对话为手段,有效触发资源内容的生成、转化、流动和演化。如前文所述,AIGC本质上是与人类互动生成的过程。在AIGC场景中,人机互动形式正在发生颠覆式变化,将逐步由文本互动向多模态互动发展,显著提高人机互动效率、准确性和用户满意度。在全新的人机互动模式下,人机共创的内容在资源开发者与AIGC之间充分共享,并以内化方式纳入资源开发者的原有的知识体系,促进资源开发者知识结构的更新,同时生成的内容在资源开发者的审核与修订过程中不断迭代优化,使生成资源的质量得到充分保证。
第三,基于AIGC的数字化教育资源人机共创是人机互利共生的过程。互利共生是生态系统中最重要的种间关系,指某两个物种间的一种互相依赖、双方获利的共生关系。在数字化教育资源人机共创过程中,AIGC擅长的是以极速处理海量数据并快速生成满足用户需求的内容;而资源开发者擅长灵活地适应各种不断变化的环境,并具备常识、创造力和共情能力。人与机器之间的这种差异性和互补性,为人机互利共生创造了前提。不同于AIGC出现之前人机之间松散的“工具型”关系,互利共生模式下的人机共创将人类和智能机器视为共同解决任务的“伙伴”和“共同体”,通过人和机器之间对等的智能感知和交互决策,既凸显人的能动性,又强调机器的智能性和自主性,不仅可以提升资源开发者的专业能力和创意能力,增强其进行实践创新的智慧,同时可以提升AIGC的自主进化和演进迭代能力,从而达到二者的互利共生。
3.基于AIGC的数字化教育资源人机共创机制
(1)互动生成机制
AIGC的内容生成离不开AI与人的有效互动,且互动方式正日益多样化。以ChatGPT为例,其在与用户的互动方面具有自动回复、智能问答、多轮对话、智能社交等功能。自动回复指ChatGPT可以根据用户输入的关键字自动生成回复;智能问答指ChatGPT可以根据用户的输入,得出有用的语义问答;多轮对话是指 ChatGPT可以实现人机多轮对话,根据用户的输入对对话内容进行深度分析;智能社交是指ChatGPT可以根据用户输入生成个性化的对话。
当前,多数AIGC已具备连续多轮互动对话的能力。在该技术的支持下,AIGC能够根据资源开发者输入的问题或关键词提供更准确、更贴合语境的资源内容和素材。多轮对话解决了传统智能问答系统只能进行僵硬的“一问一答”式对话、无法存留“记忆”等问题。在数字化教育资源生成过程中,多轮对话对提升资源内容的准确性和科学性的促进作用不言而喻。资源开发者可以通过多轮对话,从细节完善角度不断提出对AI所生成的资源素材的修改意见,使AIGC生成的素材在上一版本的基础上不断迭代优化,最终可以达到人工生成资源的质量水平。
但当前AIGC在人机互动方面存在的不足是AIGC在提供资源内容的同时并不提供信息来源,用户很难对信息进行溯源或追问。这无形中会阻断用户与AI进行更深入互动的可能,尤其在内容生成的过程中,AI看似条分缕析的回答可能会限制用户思维的发散,压缩用户的认知空间。此外,在很大程度上,AIGC很难让信息内容产生化学反应,生成的内容在创造性、创意性、个性化和决策性方面尚待提升。因此,要提高人机共创数字化教育资源内容的质量和创造性,需要资源开发者掌握人机互动话语的内在规律,提升资源开发者的问题意识和提问能力。同时,在人机共创过程中,为了避免资源开发者对AIGC的过度依赖,充分彰显资源开发者的想象力、洞察力、判断力、思辨能力、共情能力、合作能力、创新能力尤为重要,这些能力在人机共创中应引起足够重视。
(2)深度加工机制
精细化和个性化是数字化教育资源深度加工的两个重要特征。精细化包括资源素材的精细化和资源聚合的精细化。在资源素材的精细化方面,AIGC已具备丰富多样的素材生成能力,如多模态生成,可根据用户输入一次性生成多种格式的资源素材;情感生成,是指生成带有一定情感色彩的资源素材;增量生成,即指在已生成素材的基础上,继续生成更多与教学内容相关的素材,以增强资源素材的多样性,避免同质化;对抗生成,是指在生成过程中引入对抗因素,从而生成更具有特色的资源素材。在资源聚合的精细化方面,AIGC能实现基于多媒体信息的智能组合、同主题信息的自动整合等,从而帮助资源开发者快速生成聚合化的数字化教育资源包。
数字化教育资源内容的创作,既需要满足学习者的个性化学习需求,也需要体现资源开发者的创作风格。风格化、个性化的资源内容,不仅可以为学习者带来独特的个性化学习体验,也可以作为资源开发者的竞争优势。虽然AIGC一直致力于学习和模仿人类内容创作模式,其内容创作的风格化、个性化水平也在不断提升,但AI的创作本质上是遵循相对固化和模式化的算法逻辑,在内容结构、知识表征、底层逻辑等方面难以做到完全个性化和风格化。因此,在人机共创模式下,要实现数字化教育资源的个性化和风格化,首先,资源开发者要坚持专业角度的判断力与个性化表达,提高数字化教育资源的表现水平与知识价值;其次,资源开发者要与AI进行深度互动,对资源属性和需求进行个性化描述,使AI能根据个性化的描述生成更具风格化的资源;再次,可以探索将AIGC与UGC这两种内容生成模式进行有效整合,让资源使用者也参与到基于AIGC的资源创作中,使资源生成与用户需求直接对接,满足用户对资源的个性化需求。
(3)协同互补机制
协同互补是基于AIGC开展人机共创数字化教育资源的关键机制,具体体现在以下三个方面:
第一,AI的客观呈现与人的主观描述互补。人类智能形成的学科知识是有机的、能动的、自主的,而AI作为类人主体,是对人类智能的模拟,其最缺乏的是对于现实物理世界的感知能力,它很难从真正意义上学到人类所感知和理解的知识,知识对于 AI 来说只是一堆代码和符号而已。AIGC 以互联网上的数据集为知识来源,其对知识的描述基本是中性的,很少带有主观性和倾向性。但人类有能力理解复杂和抽象的概念,能在看似无关的语句之间建立联系并进行自主建构和主观化描述。因此,在人机共创过程中,AI的特长在于基于海量数据对某一知识进行相对客观的呈现,而资源开发者擅长于从知识阐释视角对其进行主观描述,二者的互补有助于实现资源外在呈现方式与内在属性描述的统一。
第二,AI 的信息加工与人的观点阐释互补。在信息处理能力方面,AI无疑具有显著优势,无论是信息采集的维度与广度,还是信息加工的速度与效率方面,人类都无法企及。在海量数字化教育资源开发背景下,资源开发者需要充分挖掘AIGC批量化内容生产和信息加工能力。但从学习者对数字化教育资源的需求特点来看,其真正所需要的,除了规模化的知识内容外,对这些知识内容的概括、解释、提炼与分析可能更为重要。虽然AI也具备一定的规律阐释和总结能力,但无法与人类相提并论。因此,人类在观点阐释提炼方面较之AI具有天然优势,这种天然优势可以与AI的信息加工优势形成互补,从而实现资源信息加工与观点阐释的统一。
第三,AI的知识生成与人的意义建构互补。数字化教育资源开发不仅仅是生成知识内容,还需要深度挖掘知识的价值和内涵。从知识管理的角度,知识可分为显性知识和隐性知识两类。显性知识是客观有形的,能够以一定的信息化形式进行表达或编码;隐性知识是一种高度个人化的知识,难以规范化,包括个体的思维模式、价值观等。AI所生成的知识以显性知识为主,随着AIGC的发展,其在某种程度上也可以生成部分隐性知识。而人类的学习不但能建立起一套隐性知识体系,还能建立起隐性知识之间不确定的秩序或规则,即进行意义的建构。意义建构是基于人的视角及学习目标对知识的应用,是将知识转化为生产力、创造力的过程。因此,要实现数字化教育资源开发过程中显性知识与隐性知识的有机融合,可以将AI的知识生成与资源开发者的主观意义建构进行互补。
(4)质量监控机制
AIGC所生成的内容存在一定的质量风险,包括内生风险和外在风险。内生风险主要是指与算法有关的风险,比如不可解释风险和不可问责风险,外在风险主要指与数据有关的风险,如个人隐私风险或数据被误用、滥用的风险等。以 ChatGPT 为例,其训练数据来主要来自于互联网,而互联网上的信息包罗万象、质量堪忧。ChatGPT所使用的语言模型是在大量文本数据上训练的,语言模型很难准确区分数据集中的事实性信息和虚构类信息,生成的资源有可能是以虚假类信息为基础,最终导致资源在科学性、正确性方面出现偏差。
根据前文所述,AIGC 内容生成机制中存在“数据”“算法”两大技术关键。因此,基于AIGC的数字化教育资源质量监控应兼顾这两个技术关键。首先在数据方面,对海量数据的治理是确保资源质量的重要前提,主要包括对数据真实性、标准化、分类与管理等环节的治理。其次在算法方面,对算法模型的治理是确保资源质量的关键因素,主要包括对算法的评估、优化、安全和可解释性的治理。
在具体操作方面,应采取资源开发团队专业把关、AI技术甄别审核、资源使用者评估反馈相结合的人机协同质量监控机制,具体如图1所示。资源开发团队对资源质量的审核包括学科专家审核和技术人员审核。学科专家主要对资源内容的相关属性如准确性、完整性等进行审核;技术人员主要从生成技术角度对资源进行语言流畅度评估、情感倾向分析、对话质量评估、主题分类评估、语义相似度评估等。在AI技术甄别审核方面,随着AIGC的发展及存在的潜在问题,一大批AI内容检测工具涌现出来,如GPTZero、Sapling等。AI审核已经成为AIGC内容核查与质量监控的重要辅助手段,可以审核和识别不当、有害或虚假性内容,其可以实现的质量监控功能包括信息来源分析、信息模式识别、生成技术鉴定、信息演变跟踪等。同时,资源开发团队还可以与AI协同开展质量监控,最典型的监控方式是交叉验证,即人与AI对可能有质量问题的某一资源进行交叉核实和验证,最后由资源开发者结合交叉验证结果得出审核结论。除了资源开发团队外,资源使用者在使用过程中也可以对资源质量进行评估和反馈,评估和反馈结果也作为资源质量判定和改进的重要参考。
图1 基于AIGC的数字化教育资源人机协同质量监控
1.基于AIGC的数字化教育资源人机共创框架
本研究以人机协同和人机共生理念为基础,遵循人机互促、人机互信、人机互补三原则,将基于AIGC的数字化教育资源人机共创物理空间、信息空间与社交空间相融合,构成人机共创三元空间:在物理空间,资源开发者与AIGC开发目标;在信息空间,各自应用擅长的技能和认知,协同完成资源AIGC的智能与资源开发者的智慧和创意彼此互补,人的认知可通过算法程序进行外显表征;在社交空间,资源开发者与AIGC之间进行广泛互动,触发内容创生。在人机共创三元空间中,通过嵌入前文所述的互动生成、深度加工、协同互补、质量监控四种共创机制,形成基于AIGC的数字化教育资源人机共创框架,具体如图2所示。在人机共创框架中,互动生成机制与社交空间形成对应关系;深度加工机制与信息空间形成对应关系;质量监控机制与物理空间形成对应关系;协同互补机制同时对应物理空间和信息空间。四种人机共创机制均能清晰划分出资源开发者与 AIGC 的创作职责范围,比如在深度加工机制中,资源开发者的职责是实现资源的个性化,而AIGC的职责是实现资源的精细化;在协同互补机制中,资源开发者主要负责对知识的主观描述、观点阐释和意义建构,而AIGC则主要负责知识的客观呈现、信息加工和知识生成。
图2 基于AIGC的数字化教育资源人机共创框架
2.基于AIGC的数字化教育资源人机共创流程
基于AIGC的数字化教育资源人机共创在流程上由确定需求、素材生成、素材审核、重组聚合、分发应用、反馈优化等6个环节构成,具体如图3所示。
确定需求是数字化教育资源开发的起始环节,资源开发者在充分调研的基础上,精准确定师生对资源内容、资源类型、资源表征形式、资源结构、资源体量、资源质量、资源服务平台的相关需求。
素材生成是指以师生需求为导向,资源开发者将资源需求转化为精确的互动话语,与AI通过互动输入的方式生成多模态的数字化教育资源素材,包括文本、图像、音频、视频、动画、虚拟人等,生成方式有文本生成、音频生成、图像生成、视频生成、跨模态生成、虚拟人生成等。文本生成包括结构化文本、非结构化文本以及交互式文本的生成;音频生成包括语音克隆、由文本生成播报语音、自动生成背景音乐等;图像生成提供自动图像生成、个性化画作生成等功能;视频生成提供视频属性编辑、自动视频剪辑合成等功能;跨模态生成是指基于模态之间的语义一致性,实现不同模态内容在表现形式上的相互转换,包括文字生成图片、文字生成视频、图像生成视频、图像生成文字、视频生成文字等;虚拟人生成主要是指生成虚拟教师形象或虚拟学伴形象。整体上,资源素材的生成是一个迭代式互动生成的过程,通过互动话语的不断迭代,由AI生成符合要求的资源素材。
素材审核是指资源开发者与AI通过人机协同方式对生成的资源素材进行形式和内容方面的质量监测与评价,目的是通过二者的协同筛查,剔除掉部分不符合质量要求的资源素材。素材审核的重点内容包括内容安全审核、内容校对/勘误、低质量识别、虚假信息检测、交叉验证、演变跟踪等。其中资源开发者审核的重点是资源内容的准确性、完整性、创新性、教育性、知识性和相关性等。准确性是指素材客观反映知识内容的属性;完整性是指素材内容的广度和深度;教育性是指素材内容是否与特定的教学目标一致;知识性是指素材内容是否包含学科知识;相关性是指素材内容与学习者需求的匹配程度。AI审核的重点是素材来源的真实性、可靠性、互操作性和规范性等。真实性是指素材来源真实可信;可靠性是指素材本身的稳定性和安全性;互操作性是指素材能够在多个系统或平台中运行或互访;规范性是指素材符合数字化教育资源开发标准。
重组聚合是指资源开发者和AI共同完成资源素材的重组与聚合,将已有的人工生成素材和人机共创素材汇集在一起,实现对资源素材的集成和包装,使其形成一个功能齐全、结构完整的有机整体。重组聚合具体包括素材编目、素材标签提取、素材重组、创意聚合、生成知识图谱等操作和处理。在此过程中,AI 主要负责固定范式的资源素材合成与生产,比如将文本和图像按知识层级结构合成为图文并茂的PPT课件;资源开发者负责从创新资源表征形式、呈现手段、呈现时序等方面完成资源的创意化合成与生产,比如将虚拟教师嵌入教学视频中,形成声画同步的虚拟教师讲授视频等。聚合完成的数字化教育资源包括音视频学习资源、数字化教育资源包、全媒体数字教材、在线课程等多种形式。
分发应用是指将生成的数字化教育资源根据师生的个性化需求进行分发使用。此阶段的操作包括对师生用户进行画像、对资源进行智能检索、智能推荐和按需定制,最终实现资源的精准分发。人机共创资源的最后一个环节是反馈优化,通过对师生资源使用行为数据的分析,结合师生使用数字教育资源后的评论反馈及使用效果,将数字化教育资源存在的问题及不足反馈给资源开发者,使其再次确认资源需求并对资源开发的相关环节进行优化和完善,形成人机共创资源迭代优化的闭环结构,促进资源开发效率和质量的不断提升。
图3 基于AIGC的数字化教育资源人机共创流程
No.4
基于AIGC的数字化教育资源人机共创
风险与挑战
AIGC作为AI在内容生成领域的最新技术,在教育教学中的应用已初见端倪。在教育领域中,基于AIGC的数字化教育资源人机共创有望成为数字化教育资源开发的新范式,并将大大提升数字化教育资源开发的效率、体量和质量。但任何新兴技术都是一把双刃剑,AIGC也不例外。AIGC在数字化教育资源人机共创中的应用可能会引发诸如内容版权、伦理与安全、算法歧视与偏见等风险。
在内容版权方面,AIGC本质上属于机器学习的应用,在模型的学习和训练过程中不可避免会使用大量的数据集,目前行业内部对于训练后生成内容的版权归属问题存在很大争议。一种观点认为产出的内容由素材库训练生成,其本质上来自素材库,需要向相关素材作者支付版权费;另一类观点则认为AIGC生成内容的过程是一个完全随机的过程,不涉及版权问题。到底哪种该观点更合理目前尚无定论,但需要指出的是,这两种观点都可能引起一部分原创素材版权拥有者的强烈不满。尤其是在数字化教育资源人机共创过程中,资源创作的主体既包括资源开发者又包括AI,共创生成资源的版权到底应该归属于资源开发者还是AIGC平台,还是由二者共同拥有版权?谁以及如何对共创生成资源的版权进行保护?这些都是需要我们进一步思考和解决的问题。
在伦理与安全方面,随着 AIGC 的不断成熟,人工智能已经能够通过分析事先收集的大量训练数据,制造出以假乱真的音视频。这项技术不仅可以用于篡改视频,还可以用于制造完全虚构的视频内容。由于契合人们“眼见为实”的认知共性,这项技术的滥用将使资源开发者和学习者难以甄别真实和虚假信息。虽然AI内容检测工具可以检测出部分虚假内容,但伴随着相关算法模型的不断升级,AIGC生成的内容逃避检测的能力将越来越强。与一般性数字化资源不同的是,数字化教育资源必须严格具备科学性、准确性、真实性、权威性、规范性等属性,虚假信息、伪造信息的掺入将使共创生成的数字化教育资源面临不可预知的质量风险和误用风险。
在算法的歧视与偏见方面,由于AIGC依赖于其训练数据中的统计规律,而训练数据主要来自于从互联网上抓取到的各种信息。基于互联网信息鱼龙混杂的特性,数据集在多样性、代表性、公正性等方面往往存在缺陷,容易导致偏见、“观点霸权”、刻板印象、文化片面性等问题;数据集的类型区分不清,还会导致事实与想象不分,加剧错误信息的扩散和传播。如果这些带有偏见和片面性的信息内容不慎进入到数字化教育资源中,将会对学习者的思维方式和价值观念产生误导,久而久之容易让学习者形成认知偏见,造成不良后果。
综上所述,开展基于人机共创机遇与挑战并存,AIGCAIGC的数字化教育资源应用所带来的内容版权、伦理与安全等风险,需要各方共同努力与合作来积极应对。要针对数字化教育资源开发的具体应用场景,进一步优化 AIGC 相关技术和功能,推进制定相关法律法规,加强师生伦理教育与指导,促进AIGC 的良性发展,形成AIGC 与数字化教育资源开发双螺旋式的互促共进。
⚪来源:教育技术学
⚪以上图文,贵在分享,用于学术教育之用,版权归原作者及原出处所有。
⚪免责声明:转载旨在分享,侵删
【9月15日-18日 • 太原】基于学科体系的知识图谱助力教学改革与教学模式创新研修班
【9月19日-23日 • 线上】新入职教师岗位适应与教学能力提升在线训练营
【9月22日-25日 • 济南】课程思政示范课申报设计暨课程思政教学设计工作坊
【9月22日-25日 • 厦门】锻造金师 打造金课——以全国高校教师教学创新大赛为引领的教学竞赛作品培育工作坊
【9月22日-25日 • 济南】职业教育一流核心课程申报及精品在线课程建设专题培训班
【10月13日-16日 • 青岛】探索未来教学新路径:以ChatGPT为代表的AI技术在教学资源制作中的创新应用实操训练营
【10月13日-16日 • 沈阳】职业院校新一轮双高专业群申报及建设方案的设计与撰写实战研修班
【10月20日-23日 • 郑州】新时代职业院校辅导员(班主任)综合素质能力提升训练营暨辅导员素质能力大赛赛前辅导专题培训班
【10月20日-23日 • 合肥】高校/职业院校课程思政比赛、示范课程申报与建设专题培训班
【10月27日-30日 • 成都】高等院校“四新建设”背景下基于OBE理念的人才培养方案及教学大纲修订专题培训班
【11月14日-17日 • 线上】“数字化时代高校虚拟教研室建设及教育教学创新”培训班
【11月24日-27日 • 西安】备战第十届“互联网+”大学生创新创业大赛--赛项解读与专家指导研修班
热 课堂革命相关分享


