

Grok开源与B200发布，双引擎亮相引爆AI圈。

成都盛世云图信息技术有限公司

2024-04-02

导读：最近，ai圈迎来双爆炸性新闻，马斯克开源了当前旗下参数巨大的Grok模型，也是开源模型中最大的哪一个，同时，英伟达发布了B200芯片，相较于H100性能提升30倍，可训练万亿级别的参数的大模型。

一、首先我们来了解一下马斯克开源的模型“Grok”

1. 模型概况

拥有3140亿个参数，成为目前参数量最大的开源模型；Grok-1 是一个基于 Transformer 的自回归模型。

2. 特点：

模型采用了混合专家架构，共有8个专家模型，其中每个数据单元（Token）由2位专家处理。这使得每次对Token的处理会涉及860亿激活参数，比目前开源的最大模型Llama-2 70B的总参数量还多。模型包含64个处理层，模型使用了48个用于处理查询的注意力机制单元和8个用于处理键/值对的注意力机制单元。模型支持8bit精度量化。

1.训练数据：

Grok-1 发布版本所使用的训练数据来自截至 2023 年第三季度的互联网数据和 xAI 的 AI 训练师提供的数据。

xAI已将Grok-1的权重和架构在软件托管平台GitHub上开源，根据Apache 2.0许可协议，用户可以自由使用、修改和分发软件，无论是个人还是商业用途。

Grok开源意味着什么？

首先，它将会为AI领域的研究人员提供一个前所未有的、参数量巨大的模型平台，这使得学术界和工业界能够在此基础上进行更深入的探索和创新，尤其使得国内的大模型领域上升一个台阶。

其次，Grok-1的开源可能会加速全民AI时代的进程，让更多的普通人能够接触到顶尖的人工智能技术，从而推动整个领域的发展。

二、再说回英伟达发布的最新算力芯片“B200”

从2016到2024年已经过去八年，AI算力已增长800倍，相较能耗，B200比H100降低了25倍。目前，亚马逊、谷歌、微软已经成为最新芯片超算的首批用户。

距上一代H100仅时隔两年，B200一发布便定位直指“新工业革命的引擎” ，“把AI扩展到万亿参数”。

双硬核公布对开发者的影响

近几年，大语言模型 (LLM) 将整合文本、图像、视频和语音，获得全面的信息获取能力。通过多模式交互，LLM 将不断自我增强，为全球信息访问和交互带来革命性变革。

AI 赋能人类突破代码编写屏障

未来，人类只需用简单语言与计算机沟通，即可完成特定任务。AI 自动生成代码，让每个人都能顺畅与计算机交流。

计算机编程技术正重塑就业市场，为拥有相关技能的人打开了一扇通往高收入、高需求职业的大门。目前，全球仅有百万级人口掌握编程知识，但未来这块领域将大幅扩展，为超过 80 亿人提供机会。

生成式 AI 将成为一个强大的工具，让用户使用自然语言就能创建应用程序。大语言模型将赋能人类，通过计算机轻松实现他们的想法。弥补编程技能缺口。人类将专注于专业领域，而 AI 将负责编码工作。此举将彻底变革软件开发，推动行业颠覆。

提示词工程：让计算机按您心意行事的艺术
提示词工程是一种艺术，它指导计算机执行任务，实现指令微调。通过巧妙的提示词设计，您可以让计算机根据您的想法工作。

借助Grok与英伟达此次的重磅发布，为用户提供大规模语言模型专业知识，企业可赋能医疗保健和金融等领域，从而提升客户服务效率，相当于聘请了经过预训练的资深专家。

如果你对AI以及算力有所兴趣或者想法，可以联系我们，竭诚为您解答。

2024

关注我们

联系电话

400-104-5151

联系地址

成都市双流区电子科大科技园D12栋

【声明】内容源于网络

成都盛世云图信息技术有限公司

盛世云图官方公众号，一体化云与大数据服务，旗下融合云平台；AI数字人；易企来与聚云网等产品，赋能企业数字化转型稳定发展。

内容 805

粉丝 0

成都盛世云图信息技术有限公司盛世云图官方公众号，一体化云与大数据服务，旗下融合云平台；AI数字人；易企来与聚云网等产品，赋能企业数字化转型稳定发展。

总阅读20

粉丝0

内容805