大数跨境
0
0

天道Innovation | 一文了解人工智能时代下的大语言模型

天道Innovation | 一文了解人工智能时代下的大语言模型 天道金科
2024-06-05
1
导读:​近年来,基于大模型研发的生成式人工智能,展示了在语言理解和内容生成等方面的出色能力,引发社会关注。天道金科在行业大模型这个方向持续探索和发展,从2022年11月OpenAI发布ChatGPT的时候,

近年来,基于大模型研发的生成式人工智能,展示了在语言理解和内容生成等方面的出色能力,引发社会关注。


天道金科在行业大模型这个方向持续探索和发展,从2022年11月OpenAI发布ChatGPT的时候,我们就开始关注和研究大模型相关技术。从最初将ChatGLM接口和钉钉/微信消息打通、构建群助手开始,先后在产业链分析、产业图谱构建,大模型生成产研报告,基于领域大模型的政策仿真,基于自然语言协助数据可视化等领域探索和实践,并且取得了一定的效果和产品。


接下来我们将持续和大家分享天道金科在这些领域的实践和心得。本文将从人工智能的视角切入,与大家共同分享人工智能的发展历程与大语言模型的应用。


01

   何为人工智能?

自古以来,人类从学会使用工具起,就已经开始尝试创造智能化工具。直至上个世纪50年代,人们提出了人工智能的概念。人工智能(Artificial Intelligence,简称AI)是计算科学的一个分支,它要了解的是智能的实质,并生产出一种能以人类相似的方式做出反应的智能机器,研究领域包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,经历了初期的探索和发展低谷,以及后期技术上不断突破,并在最近十年左右逐步实现产业化。


图源网络


02

   人工智能的发展历程


第一阶段(1956年-1974年)繁荣期


1956年人工智能学科诞生,在其后的十多年,很快在数学定理证明、问题求解、博弈等领域取得了重大突破和进展。这段时期是人工智能发展的一个黄金时期,在数学定理证明领域的实际效果最好。达特茅斯会议上确定了符号AI的基本思路,依据这个思路发展出了基于符号主义、联结主义的数学定理证明。“符号主义”和“联结主义”分别是日后“专家系统”与“深度学习”的维形。


第二阶段(1974年-1980年)低谷期


乐观的情绪没有持续多久,就迎来了人工智能的第一个冬天。在二十世纪 60 年代末到 70 年代初,人工智能面临着许多问题无法解决,比如两个典型的难题是机器翻译和非线性的异或(XOR)问题。这些问题引起了人们对人工智能的沮丧,并使得政府大幅减少甚至停止了人工智能研究项目的资助。自 1969 年开始大约 10 年的时间,被称为人工智能的第一个冬天。


第三阶段(1980年-1990年)繁荣期


上世纪80年代随着计算机的普及,机器学习取代了逻辑计算,解决了上一次人工智能寒冬所面临的问题。进化后的符号主义开始复苏,“专家系统”程序的知识处理开始被全世界的科学家所接受,成为人工智能领域的焦点。“专家系统”是一个智能计算机程序系统,内部含有大量的某个领域专家水平的知识和经验,能够利用人类专家的知识来解决该领域的问题。此外,基于“联结主义〞使用程序模拟人脑神经元的工作原理等多重因素让人工智能重新焕发活力。


第四阶段(1987年-1997年)低谷期


人工智能的第二次浪潮归功于其商业价值获得企业的认可和追捧,然而这种热度并没有持续太久。“专家系统”从原始数据获取知识主要获取人工,效率低且知识不足,很多专家自己无法清晣、准确地描述出问题的思考和解决过程,知识推理很难实现形成逻辑化,系统经常发生各种奇奇怪怪的问题,没法达到人们对AI的预期,人工智能再次陷入入困难中,迎来了第二次寒冬。


第五阶段(1997年-2010年)复苏期


在人工智能的第二个冬天中,明星的光环照耀在互联网浪潮之上,大量的资金投入到 Web,互联网大发展。这个过程中,专家系统和互联网相结合,万维网联盟 W3C 推动符号主义人工智能的发展。自1990 年代起,多层神经网络已经成熟,只不过受限于算力太小,数据不足,而没有广泛应用。大约在 2006 年,多层神经网络以深度学习的名义开始火热起来,开启了人工智能的第三波浪潮。


第六阶段(2010年-至今)繁荣期


2013年,自然语言处理模型 Word2Vec诞生,首次提出将单词转换为向量的“词向量模型”,以便计算机更好地理解和处理文本数据。2014 年,除了生成对抗网络(Generative adversarial network,GAN)外,最重磅的当属深度神经网络在人脸识别的准确率上超越人类。这个成绩先是由 Facebook 的 DeepFace 模型实现了首次接近人类表现,深度学习开始在图像识别领域大放异彩。2015 年 DeepMind 开发的围棋 AI 程序 AlphaGO 战胜了职业选手,这是人工智能程序第一次战胜围棋职业选手,此后的 AlphaGo 加速进化,2017 年更强版本的 AlphaGo Master 以 3:0 的成绩完胜当时排名世界第一的职业围棋选手柯洁。当时许多人都想起了 20 年前,IBM 深蓝击败国家象棋世界冠军之后,人工智能转冷。AlphaGO 是否意味着又一次人工智能的冬天即将来临?然而这个转冷并没有发生,反倒迎来了新的突破,2017 年Google 提出了 Transformer 和 MoE(Mixture of Expert)架构,至此迎来了大模型时代。


03

   大语言模型的发展与应用


2022年11月30日,OpenAI公司推出一款人工智能对话聊天机器人ChatGPT,其出色的自然语言生成能力引起了全世界范围的广泛关注,2个月突破1亿用户,国内外随即掀起了一场大模型浪潮,Gemini、文心一言、Copilot、LLaMA、SAM、SORA等各种大模型如雨后春笋般涌现,2022年也被誉为大模型元年。据不完全统计,截至2023年10月,我国累计发布200余个人工智能大模型。这类基于自然语言处理的技术通过对海量数据以及人类偏好标注的方式学习,深入赋能千行百业,推动人工智能与数据要素成为新质生产力的典型代表。


行业内的部分大模型应用


为什么是大语言模型?


语言是人类与其他动物最重要的区别,而人类的多种智能也与此密切相关。逻辑思维以语言的形式表达,大量的知识也以文字的形式记录和传播。如今,互联网上已经拥有数万亿网页资源,其中大部分信息都是用自然语言描述。因此,如果人工智能算法想要获取知识,就必须懂得如何理解人类所使用的不太精确、可能有歧义并且甚至有些混乱的语言。哲学家维特根斯坦说过:“语言的边界就是思想的边界”,我们的理解是,语言本身与人类的智能是共生共长的,两者是一体的,理解了语言也就理解了这个世界。如果我们的基础大模型能获得所有语言的信息,那就同时获得了人类所有的知识,这个也是语言大模型之所以崛起的重要的原因。


何为大语言模型?


大语言模型(Large Language Models,LLM),是一种由包含数百亿以上参数的深度神经网络构建的语言模型,通常使用自监督学习方法通过大量无标注文本进行训练。简单来说,大模型可以理解为利用深度学习技术来进行语言预测的应用,能够展现出类似人类的智能。


用户可以使用自然语言与系统交互,从而实现包括问答、分类、摘要、翻译、聊天等从理解到生成的各种任务。大规模语言模型展现出了强大的对世界知识掌握和对语言的理解能力。


以阿里推出的通义千问为例,大语言模型能够在不同情境下生成自然语言文本并处理各种自然语言处理任务,为用户提供提供流畅、连贯和有趣的对话体验。


#按格式输出


#分类


#聚类


#其他一切可能解决的问题......


大模型的应用并不仅局限在语言领域,在图像生成方面也有长足的进步。2023年4月,基于GAN的Stable Diffusion发布了公开版本XL 1.0。这款图像生成模型拥有4.5亿参数,采用文本到图像的方式,可以从文本描述生成图像。它的生成效果和质量都大大超过了此前的开源图像模型。


Stable Diffusion官方中文版网站



接下来,我们将和大家分享天道金科基于领域大模型在政策仿真方面开展的实践和心得,欢迎关注!




转载/投稿/内容合作

请联系邮箱:tdkf@tdft.cn

【声明】内容源于网络
0
0
天道金科
天道金科股份有限公司是由浙江金控发起成立的国有控股企业。作为数字经济新业态、新模式的典型平台,公司致力于将产业数字化平台与应用场景深度融合,开发数据资源要素在促进产业变革中的价值,推动数字技术和实体经济融合共生,助力数字经济高质量发展。
内容 466
粉丝 0
天道金科 天道金科股份有限公司是由浙江金控发起成立的国有控股企业。作为数字经济新业态、新模式的典型平台,公司致力于将产业数字化平台与应用场景深度融合,开发数据资源要素在促进产业变革中的价值,推动数字技术和实体经济融合共生,助力数字经济高质量发展。
总阅读347
粉丝0
内容466