中国新开源人工智能模型容量是 ChatGPT 的两倍

跨语桥梁

2023-11-17

3449

【建站扶持计划】

免费7天，首月1元！ 16大主流媒体免费开户

立即查看>>

导读：至少从某些指标来看，Yi系列车型比美国竞争对手实现了巨大飞跃。

中国开发的人工智能 (AI) 模型正在多个领域掀起波澜，包括其开源性质以及处理多达 200,000 个上下文令牌的能力，远远超过了 Anthropic 的 Claude（100,000 个令牌）等其他流行模型或 OpenAI 的GPT-4 Turbo（128,000 个代币）。
北京零壹万物信息技术公司在其人工智能实验室01.AI中创建了这个渐进式生成聊天机器人，称为Yi系列。大语言模型（LLM）有两个版本：轻量级的 Yi-6B-200K 和更强大的 Yi-34B-200K，两者都能够保留大量的对话上下文，并且能够理解英语和普通话。

发布后仅几个小时，Yi 模型的排行榜就飙升，成为人工智能模型的关键存储库 Hugging Face 上第二受欢迎的开源模型。
尽管 Yi 模型可以处理大量的上下文提示，但它们也非常高效和准确，在几个综合基准中击败了其他法学硕士。

“Yi-34B 的性能优于LLaMA2-70B和Falcon-180B等更大的型号；而且 Yi-34B 的尺寸可以经济高效地支持应用程序，从而使开发人员能够构建出色的项目，” 01.AI 在其网站上解释道。根据开发者分享的记分牌，最强大的 Yi 模型在阅读理解、常识推理以及高考、C-eval 等常见 AI 测试方面表现出了强劲的表现。

像 Yi 系列这样的大型语言模型 (LLM) 通过分析和生成基于语言的输出来运行。它们通过处理“标记”或文本单元来工作，这些文本单元可以小到一个单词或单词的一部分。

说“200K 上下文标记”实际上意味着该模型可以理解并响应明显更长的提示，这在以前甚至会压垮最先进的法学硕士。Yi系列可以处理包含更复杂和详细信息的广泛提示而不会崩溃。

然而，最近的第三方分析指出了这一领域的局限性。当提示占用 Yi 模型容量超过 65% 时，它可能很难检索准确的信息。尽管如此，如果提示的大小保持远低于此阈值，即使在导致 Claude 和 ChatGPT 等模型性能下降的情况下，Yi 系列模型也能表现出色。
Yi 的一个关键区别在于它是完全开源的，允许用户在自己的系统上本地运行 Yi。这赋予他们更大的控制权、修改模型架构的能力，并避免对外部服务器的依赖。

01.AI 表示：“我们预测 AI 2.0 将创造比移动互联网大十倍的平台机会，重写所有软件和用户界面。这一趋势将催生下一波 AI 优先的应用和 AI-赋能商业模式，随着时间的推移促进 AI 2.0 创新。”

通过开源这样一个强大的模型，01.AI 使世界各地的开发人员能够构建下一代人工智能。通过可定制包中的大量上下文处理，我们可以期待大量利用 Yi 的创新应用程序。

对于 Yi-6B-200K 和 Yi-34B-200K 等开源模型来说，潜力巨大。随着人工智能渗透到我们的生活中，与依赖云的封闭替代方案相比，本地运行的系统具有更高的透明度、安全性和可定制性。

虽然 Claude 和 GPT-4 Turbo 占据了头条新闻，但这种新的开源替代方案可能很快就会在用户的设备上构建人工智能的下一阶段。正当我们似乎没有剩下的方法来升级我们的硬件时，也许是时候购买功能更强大的设备了，然后您才发现本地人工智能被更具“上下文感知”能力的竞争对手超越了。
原文链接：https://decrypt.co/206195/new-open-source-ai-model-from-china-boasts-twice-the-capacity-of-chatgpt

人工智能

 0

 0

跨语桥梁

大家好

内容 4367

粉丝 5

关注

一周要闻NO.120丨拳头《英雄联盟》团队裁员；TikTok美区入驻门槛大调整；中国两元店如何横扫意大利；乙游厂商转做AI女友

2024-10-19