大数跨境
0
0

Grok开源与B200发布,双引擎亮相引爆AI圈。

Grok开源与B200发布,双引擎亮相引爆AI圈。 成都盛世云图信息技术有限公司
2024-04-02
0
导读:最近,ai圈迎来双爆炸性新闻,马斯克开源了当前旗下参数巨大的Grok模型,也是开源模型中最大的哪一个,同时,英伟达发布了B200芯片,相较于H100性能提升30倍,可训练万亿级别的参数的大模型。

前言:

最近,ai圈迎来双爆炸性新闻,马斯克开源了当前旗下参数巨大的Grok模型,也是开源模型中最大的哪一个,同时,英伟达发布了B200芯片,相较于H100性能提升30倍,可训练万亿级别的参数的大模型。

Grok开源与B200发布双引擎亮相引爆AI圈。






一、首先我们来了解一下马斯克开源的模型“Grok”

1. 模型概况

拥有3140亿个参数,成为目前参数量最大的开源模型;Grok-1 是一个基于 Transformer 的自回归模型。


2. 特点:

模型采用了混合专家架构,共有8个专家模型,其中每个数据单元(Token)由2位专家处理。这使得每次对Token的处理会涉及860亿激活参数,比目前开源的最大模型Llama-2 70B的总参数量还多。模型包含64个处理层,模型使用了48个用于处理查询的注意力机制单元和8个用于处理键/值对的注意力机制单元。模型支持8bit精度量化。 


1.训练数据:

Grok-1 发布版本所使用的训练数据来自截至 2023 年第三季度的互联网数据和 xAI 的 AI 训练师提供的数据。 


xAI已将Grok-1的权重和架构在软件托管平台GitHub上开源,根据Apache 2.0许可协议,用户可以自由使用、修改和分发软件,无论是个人还是商业用途。


Grok开源意味着什么?


首先,它将会为AI领域的研究人员提供一个前所未有的、参数量巨大的模型平台,这使得学术界和工业界能够在此基础上进行更深入的探索和创新,尤其使得国内的大模型领域上升一个台阶。


其次,Grok-1的开源可能会加速全民AI时代的进程,让更多的普通人能够接触到顶尖的人工智能技术,从而推动整个领域的发展。


二、再说回英伟达发布的最新算力芯片“B200”


从2016到2024年已经过去八年,AI算力已增长800倍,相较能耗,B200比H100降低了25倍。目前,亚马逊、谷歌、微软已经成为最新芯片超算的首批用户。


距上一代H100仅时隔两年,B200一发布便定位直指“新工业革命的引擎” ,“把AI扩展到万亿参数”。


双硬核公布对开发者的影响

近几年,大语言模型 (LLM) 将整合文本、图像、视频和语音,获得全面的信息获取能力。通过多模式交互,LLM 将不断自我增强,为全球信息访问和交互带来革命性变革。


AI 赋能人类突破代码编写屏障

未来,人类只需用简单语言与计算机沟通,即可完成特定任务。AI 自动生成代码,让每个人都能顺畅与计算机交流。

计算机编程技术正重塑就业市场,为拥有相关技能的人打开了一扇通往高收入、高需求职业的大门。目前,全球仅有百万级人口掌握编程知识,但未来这块领域将大幅扩展,为超过 80 亿人提供机会。


生成式 AI 将成为一个强大的工具,让用户使用自然语言就能创建应用程序。大语言模型将赋能人类,通过计算机轻松实现他们的想法。弥补编程技能缺口。人类将专注于专业领域,而 AI 将负责编码工作。此举将彻底变革软件开发,推动行业颠覆。


提示词工程:让计算机按您心意行事的艺术
提示词工程是一种艺术,它指导计算机执行任务,实现指令微调。通过巧妙的提示词设计,您可以让计算机根据您的想法工作。


借助Grok与英伟达此次的重磅发布,为用户提供大规模语言模型专业知识,企业可赋能医疗保健和金融等领域,从而提升客户服务效率,相当于聘请了经过预训练的资深专家。


如果你对AI以及算力有所兴趣或者想法,可以联系我们,竭诚为您解答。




2024


关注我们

联系电话

400-104-5151

联系地址

成都市双流区电子科大科技园D12栋

【声明】内容源于网络
0
0
成都盛世云图信息技术有限公司
盛世云图官方公众号,一体化云与大数据服务,旗下融合云平台;AI数字人;易企来与聚云网等产品,赋能企业数字化转型稳定发展。
内容 805
粉丝 0
成都盛世云图信息技术有限公司 盛世云图官方公众号,一体化云与大数据服务,旗下融合云平台;AI数字人;易企来与聚云网等产品,赋能企业数字化转型稳定发展。
总阅读20
粉丝0
内容805