点击图片 即可查看课程详情
知识图谱解决方案由于其在多个行业的广泛应用而获得了发展势头。Gartner预测,到2025年,知识图谱技术将应用于80%的数据分析,而2021年这一比例为10%。具体来说,随着生成和收集的数据量不断增加,需要对其进行理解,并将其用于人工智能和机器学习,这可以从知识图谱提供的结构化数据和上下文中受益。
然而,对于许多组织来说,问题仍然存在,“这是适合我们的解决方案吗?”很多企业经常会问到这个问题。下文总结了典型的知识图谱用例以及企业案例实践,可供借鉴。
“搜索不起作用”通常是那些只利用关键字来决定搜索结果应该是什么样子的组织的普遍看法。语义搜索的核心是基于上下文和意义提供结果的搜索。如果没有语义理解,搜索相关性或搜索引擎根据用户意图找到并返回一页搜索结果的能力是不可能实现的。因此,知识图谱创建了一种机器可读的结构,允许系统显式地捕获上下文,从而让搜索引擎理解概念、实体及其之间的关系。
今天,我们使用的许多搜索引擎,如谷歌、亚马逊、Airbnb等,都利用了多种知识图谱,以及自然语言处理(NLP)和机器学习(ML),超越了基本的基于关键字的搜索。理解语义搜索正在成为提供良好搜索体验的基础,这种搜索体验植根于对用户的深入理解,并最终推动预期的数字体验获得信任和采用(无论是知识转移、企业学习、员工/客户保留,还是增加销售额)。
“我们的劳动力正在退休,正面临人才流失的挑战。我们希望能够得到快速答案的问题,如:
·W1956年,我们用什么涂料来制造这个工程部件?”
解决方案结果:知识图谱模型支持浏览和发现以前未捕获的人员、角色、项目、组织和工程材料之间的关系,以聚合并在搜索结果中返回。提供机构信息的统一视图,从而将查找专家和项目信息的时间从3-4周缩短到5-10分钟。
数据源和数据集的大小和复杂性使得传统的数据字典和实体关系图(ERD)不够用。知识图谱为所有类型的数据提供了结构——可以作为语义层,也可以作为领域映射解决方案——并支持跨数据源创建多边关系,显式地捕获如何使用数据,以及对数据进行了哪些更改。因此,知识图谱支持数据治理和质量检查——了解企业数据,它在哪里,谁可以访问它,在哪里,以及随着时间的推移如何共享或更改它。因此,利用知识图谱解决方案的数据治理策略提高了数据的可访问性,提高了数据质量和可观察性。
·使用一个包含超过100亿条记录的消费者数据数据库,其中有脏数据和数百万个重复数据。
解决方案结果:通过知识图谱创建和映射过程就可以将记录数量从大约100亿减少到大约40亿,使用匹配算法优化QA过程,从而实现80%的记录重复删除,以及95%的精度。
每个企业的数据策略都努力促进灵活性,允许数据在当前和未来系统之间移动,最大限度地减少专有解决方案的限制,并避免供应商锁定。为此,需要基于共享的术语、web标准和安全协议来创建数据。来自EDM委员会的金融行业业务本体(FIBO)是概念图模型的一个例子,它为金融行业的关键概念和术语提供了通用词汇和含义,并提供了一种无论数据来源如何都能对齐和协调数据的方法。作为基于标准的数据模型,图谱允许从组织内部或外部的源(例如链接数据、订阅、购买的数据集等)一致地获取不同的信息类型。最终允许组织处理来自各种来源(包括公共来源)的大型数据,并促进知识发现、行业合规和高效的数据驱动分析。
Data-as-a-Product for Global Veterinary
“我们大多数高度相关的数据都被困在4-5个遗留数据平台中,很难统一和理解我们的数据,这减慢了我们的工程过程。最终,我们需要一种方法来建模和描述各个应用实践之间的业务流程和数据流,并使其数据与行业标准保持一致。这将使我们能够使服务正常化,提高效率,并创造跨应用报告数据的能力,以及特定应用中的趋势分析。”
解决方案结果:分类学/本体被用作生成图谱模式,并描述应用合作伙伴感兴趣的“事情”的关键类型以及它们之间的关系。这是为了确保使用来自所有提交数据的应用实践的通用词汇表,并实现:
·识别潜在的药物靶点和理解不同分子之间的关系,以及
·使公司能够将本体论数据模型作为产品和可共享的行业标准提供
客户数据通常分布在多个应用程序、部门和地区。每个团队和系统都需要保存关于客户的不同数据集,以便发挥其特定的作用——这无意中导致了割裂的体验。知识图谱解决方案允许创建一个连接层,以促进从内部或外部源到组织不同信息类型的一致性聚合。图谱能促进知识发现,以及更有效的数据驱动型分析,从而可以了解公司与客户的关系,并支持个性化营销、产品和服务。
某商业房地产公司的客户360应用
“我们失去了一个价值数百万美元的客户,因为我们的一个地区销售代表向客户提供了一个客户已经拥有的房产。我们如何更好地了解我们的客户?我们希望能够快速回答以下问题:过去10年,谁是我们在北美的回头客?
“我们的客户数据库包含超过20亿不同消费者的记录(估计反映了2.4亿真实世界的个人)——我们需要了解我们有多少个版本的‘客户A’,以便整合从不同数据源收集的情报,以充分了解每个客户。”
解决方案结果:通过更快地访问内容、提高客户智能、以及定制材料的能力,来改善潜在客户的挖掘和销售周期,其中销售代表搜索客户信息的时间减少1%,每年节省成本624万美元。
了解客户后的下一个关键步骤是个性化并向他们推荐相关内容。随着在线用户注意力的下降,数字个性化已经成为公司商业模式的首要任务之一。企业需要创新的方式来了解并针对他们的在线客户提供相关和个性化的内容。图谱分析提供了一种有意义的方法来聚合关于客户的信息,并与解决方案和服务建立关系,以确定一种方法来决定与客户共享哪些信息是正确的。
某医疗保健培训和信息提供商的客户旅程地图
“我们想要了解病人的经历,用正确的渠道和节奏提供下一个最好的内容。”
“我们希望根据我们的受众及其环境提供量身定制的培训内容和课程推荐,这样我们就可以将用户与帮助他们更好地掌握关键能力的精准学习内容联系起来。”
解决方案成果:语义推荐服务提升了准确性,取代了人工聚合内容的过程——更高质量、更高级、更有针对性的内容推荐。丰富的元数据和语义建模可以推动5万份培训材料与特定课程的匹配,引领新的、数据驱动的、基于受众的营销方式,展示了推荐服务如何从超过230万用户中实现更高用户参与度。
供应链和环境社会治理(ESG)
制定ESG计划不再是一种选择。许多组织现在都有一个目标,即建立一个标准化的中心平台,以获得与其供应链流程相关的环境影响的见解。但是,这些信息通常存储在不同的位置,隐藏在部门文档或应用程序中。此外,不同行业之间通常没有标准化的词汇,导致对关键业务和供应链概念的理解不一致。知识图谱整合从不同来源不断抓取的数据,支持交互式查询,并提供供应链中元素的图形表示,从而有助于供应链路径探索和决策分析。
聚合数据以减少全球咨询公司供应链的碳足迹
“我们正处于ESG的关键时刻,我们的客户来找我们回答以下问题:我们用什么材料来包装x产品最好:哪条航线最省油? 谁是2020年最符合ESG标准的工厂?”
解决方案结果:通过关键供应链和ESG概念之间的语义关系,使公司能够利用知识图谱来减少对环境的影响,并建立一个集中的知识数据库。顾问可以利用经过认证并与行业标准保持一致的知识见解,为客户提供能够产生利润的战略建议,同时为客户提供市场情报分析。
金融业是由市场和交易网络构成的。一家金融机构的风险问题可能会对许多机构产生多米诺骨牌效应。因此,大多数大型金融机构都将其数据转移到数据湖或数据仓库,以便在一个地方了解和管理金融风险。然而,风险分析的最大挑战仍然是缺乏一种可扩展的方式来理解数据是如何相互关联的。图谱使机构能够将这些建模和可视化为节点和节点的集合,它们指定了某些金融概念和实体之间的确切联系。基于图谱的解决方案进一步利用所涉及实体之间的关系来创建一个语义增强的机器学习模型。
联邦金融监管机构的金融风险报告
“数据科学家和经济学家发现,为了方便地访问、解释和监管功能,很难有效地利用其竖井数据源,包括回答以下问题:
解决方案结果:图谱数据,支持探索、链接和理解实体,如产品、类别/客户、订单,支持组织的风险引擎算法的风险欺诈模式检测。最终导致:
·实时风险欺诈检测:基于风险引擎的风险欺诈模式检测。
·非破坏性欺诈预防:帮助公司在欺诈交易发生之前识别和截断欺诈交易,而不影响合法的商业交易。
许多因素都会影响并购(M&A)后的整合效果,因为与新公司的兼并或收购不可避免地会带来另一个应用程序、运营、数据/内容和本地语言的生态系统。知识转移的过程以及使过程和数据的战略对齐的挑战,正成为本已微妙的并购成功日益令人担忧的问题。图谱提供了语义上协调、存储和连接相似或相关组织概念的方法。该方法进一步使用分类法和本体论模式以人们更容易理解的方式表示信息,允许使用组织上下文存储数据。
全球领先的内容管理和知识产权服务提供商
“在过去5年里,我们经历了多次并购。我们正在寻找一种方法来连接和标准化我们在40个系统中拥有的数据,这些系统有一些重叠的应用程序、数据和用户。”
“在我们的电子商务平台上,不清楚我们具体的产品或解决方案是什么。由于我们无法在整个组织中一致地命名和描述我们的解决方案产品,我们正在失去业务。我们如何在整个公司范围内使用我们的产品和解决方案?”
解决方案结果:知识图谱解决方案通过提供实体及其关系的全面和结构化表示,允许显式地捕获和对齐知识和数据模型。这有助于尽职调查过程,允许快速识别和分析关键利益相关者、竞争对手和潜在的协同作用。此外,图谱还可以作为一个有用的工具,用于更好地理解合并所涉及的复杂性,促进重复数据删除工作或信息和情报的丢失,并实现基于上下文的决策。
为进一步加速大学英语教学改革与创新,加快推进信息技术与大学英语教学的深度融合,贵州财经大学外语学院在原有网络在线课程的基础上,课程负责人肖菊副教授,融合数字信息技术,重构课程内容,梳理课程知识点,陆续开发了《大学英语I》、《大学英语II》、《大学英语III》等多门课程的知识图谱和问题图谱体系,推出贵州省首批知识图谱课程,全力助推大学英语教学数字化转型。
让我们一起来了解下相关课程基于超星泛雅平台进行知识图谱建设的基本情况吧!
目前3门知识图谱课程已在学习通和学银在线同步上线。共建设知识点566个,关联试题332个,关联学习资源160个,同时关联了大量的学术资源。部分知识点之间已经进行了跨课关联,形成横向融通、纵向贯通的大学英语课程体系。数字资源库内容丰富,可提供微课视频、教学课件、单元测试、拓展资源等内容,还可全过程记录学习情况,充分支持学生自主学习。
图谱建设通过二次开发教材内容,提炼思政元素,突出价值引领,重构教学内容,设计“5I”在线学习模块,包括:I Prepare: Unit Preparation(单元导入)、I Analyze: Text Analysis(文章分析)、I Apply: Language Application(语言应用)、I Explore: Cultural Exploration(文化探索)、I Produce: Creative Production(创造性产出)。
5个模块环环相扣,将知识传授、能力培养、价值引领“三位一体”的育人理念贯穿课程体系全过程。课程还特别提炼了重点、难点、考点和思政知识点,提供个性化思政育人教学素材。
在讲授语言知识、培养基本技能的同时,将中华优秀文化、社会主义核心价值观等融入到教学中,树立与单元主题相关的正确价值观,形成本课程知识目标、能力目标、思政目标的关系矩阵,充分体现学生在语言习得、文化素养、跨文化能力等方面的正向成效,实现知识传授与思政教育的同频共振,促进纯语言教学向“语言+思政”的转变,发挥外语课程立德树人的思政育人功能。
基于知识图谱的线上线下混合式教学包括课前自主学习、课堂深化认知、课后内化应用三个阶段,强调师生在不同教学阶段的“协同增效作用”。在不同的教学阶段,采用不同的教学方法、安排不同的教学活动,通过师生的双向互动,促进教师和学生的共同发展。
课前线上学习属于学生自主学习阶段。教师发布单元学习任务清单,通过学习通课件视频学习、在线讨论测试等活动精准掌握学生学习画像,进行学情诊断,科学制定教学策略,以便课中因学施教、有的放矢。
课中线下学习属于课堂深化认知阶段。根据学情因学设教,通过随堂测试、课堂调查、小组合作探究、师生互动对话等活动答疑解惑,深化对新知识的认知,攻克教学重难点问题,增强教学针对性,巩固知识点的掌握。
课后线上学习属于知识内化应用阶段。根据课前自学画像、课中教学成效,布置富含思政元素又能检测语言能力的在线作业,突出学以致用。教师查看学习者画像掌握学生认知薄弱点,通过即时在线反馈、推送个性化学习资源等方式促进学生知识内化。
⚪来源:网络
⚪以上图文,贵在分享,用于学术教育之用,版权归原作者及原出处所有。
⚪免责声明:转载旨在分享,侵删
“人工智能+”视域下的教育知识图谱
-
教育知识图谱的概念模型与构建方法研究
教育知识图谱的六大类应用场景