大数跨境
0
0

Falcon LLM推出的Adaptive获2000万美元融资,中东力量拉开2024开源大战帷幕|F2AI焦点

Falcon LLM推出的Adaptive获2000万美元融资,中东力量拉开2024开源大战帷幕|F2AI焦点 非凡产研
2024-03-13
24
导读:2024,开源AI大战才刚刚拉开帷幕!
Adaptive,这家由Falcon AI模型背后团队创立的初创公司,于2024年3月11日对外宣布成功获得了2,000万美元的风险投资。这笔资金旨在帮助企业根据其特定需求定制大型语言模型。
Adaptive的联合创始人Launay曾在阿姆斯特丹的一家人工智能硬件初创公司与Adaptive的联合创始人Daniel Hesslow共事,后者现在是该初创公司的首席研究科学家。随后,两人与联合创始人Baptiste Pannier共事,共同构建了阿布扎比科技创新研究所的Falcon LLM系列开源模型。Adaptive创始团队中有几位是曾在人工智能公司 Hugging Face 和 AWS 工作过的工程师和研究人员。
创始团队:Baptiste Pannier、Julien Launay 和 Daniel Hesslow
此轮种子投资由Index Ventures领投,ICONIQ Capital、Motier Ventures、Databricks Ventures、HuggingFund by Factorial以及一些个人天使投资者参与。虽然公司的估值尚未公开,但科技媒体《The Information》此前曾报道称,这一融资轮次将该初创公司估值为1亿美元。

   Adaptive:将Gen AI对齐(Alignment )技术引入企业

在过去十年里,TikTok、Netflix和Twitter等公司之所以能吸引我们,让我们感觉每个人都有自己的互联网“副本”,根本原因在于推荐系统。推荐系统释放了互联网的力量,为个体消费者提供个性化、无缝的体验,取代了“旧”互联网通用、冷漠的特性,带来一种新的温暖和熟悉感。
生成式人工智能(GenAI)也在不断发展。就像消费者互联网公司能够提供可扩展的人类内容生成一样,GenAI正在推动机器生成内容的进步。但是,与消费者互联网相比,机器生成的响应通常缺乏人性化和温暖感。所以,如何赋予GenAI产品“温暖”成为了重要问题。OpenAI和DeepMind尝试使用偏好调整等对齐技术解决这个问题。偏好调整能够根据人类反馈指导模型生成更个性化和“温暖”的响应。然而,大多数企业缺乏实施这些技术所需的专业知识和基础设施,导致只能部署受限的GenAI体验。
Adaptive公司正努力解决这一问题。他们将对齐技术产品化,使每个企业都能够部署能够提供个性化体验的模型。这意味着不仅要确保模型返回技术上正确的结果,还要让结果感觉到个性化和人性化。
Adaptive专注于改进人类反馈强化学习(RLHF)的过程,这是将大型语言模型(LLMs)从基于文本预测的训练转变为驱动聊天机器人等应用的关键步骤。RLHF通过收集人工评估员对LLM响应质量的反馈,并据此进一步训练LLM以生成更优质的回答。
然而,传统的RLHF方法涉及雇佣代理商来评估模型,这不仅成本高昂,而且反馈质量有时无法满足商业需求。Adaptive的联合创始人兼首席执行官Julien Launay指出,让模型按预期工作是一项挑战。
Adaptive旨在开发一种方法,使LLMs能够定期且持续地从公司员工或客户与软件的互动中学习,从而提供更丰富的训练信号。公司计划提供一套解决方案,以捕捉人们与LLM互动的方式,并根据这些数据训练和微调模型。
此外,Adaptive提供了一个平台,简化了运行定制模型所需的强化学习算法的过程,使非专家团队也能轻松实现。该平台还支持企业选择特定数据、目标和强化学习算法来训练模型。
Adaptive还在探索AI反馈强化学习(RLAIF)的概念,其中一个独立的AI模型评估另一个正在训练的AI模型的响应,以降低成本并提供更广泛的训练数据。
面对竞争激烈的市场,Adaptive的技术适用于任何开源LLM或企业自建模型,但不支持微调第三方专有模型。公司的平台还能帮助客户测试不同LLM的性能,并监控部署后的表现,同时开发仪表板和指标,将LLM输出与业务关键指标相联系。
目前,Adaptive已有客户在使用其平台,公司计划利用新融资扩大团队规模,重点发展市场推广和销售团队。Adaptive的技术和平台为寻求更多控制权和降低成本的公司提供了新的可能性。

   Falcon LLM:开源创新重新定义人工智能

谈及Adaptive此类开源模型,就不得谈及其背后的老大哥Falcon。Falcon LLM是由阿布扎比先进技术研究委员会(ATRC)旗下阿联酋科技创新研究所(TII)发布的一系列大型语言模型。去年9月,Falcon LLM 发布了Falcon 180B,其在高达4096个GPU同时使用Amazon SageMaker上训练了3.5万亿个标记,总共使用了约700万GPU小时。这意味着Falcon 180B比Llama 2大2.5倍,并且使用了4倍的计算资源进行训练。

Open LLM Leaderboard于2023年11月新增了两项新的基准测试,并更新了上述表格以反映最新得分(67.85)。根据最新评测标准,Falcon与Llama 2 70B持平。

Falcon模型的开源性意味着任何人都可以自由地查看、修改或分发其源代码,使其成为公开可访问的资源。Falcon LLM之所以强大,得益于其创新的合作模式。在开发过程中,英伟达和微软成为了重要的合作伙伴。英伟达的先进硬件加速器和微软广泛的云基础设施为支持Falcon LLM进行复杂的人工智能操作提供了坚实支持。
举例来说,英伟达先进的图形处理单元(GPU)提升了训练这些大型语言模型所需的计算能力。再加上微软的Azure云平台,为企业提供了可扩展的解决方案,使得Falcon LLM能够在各种企业应用中实现无缝部署和运行。
这种协作模式确保了Falcon LLM在保持高性能的同时,也能保持高效和可扩展性。它为企业提供了一种利用人工智能的方法,而无需担心基础设施限制或资源限制。开源方法鼓励一种协作环境,全球AI社区可以共同为模型贡献和完善。集体努力带来了更快的进步和多样化的应用,确保了Falcon LLM始终处于AI技术的前沿。
开源不仅是Falcon LLM技术的一个组成部分,而且是其关键驱动因素。开源带来了一系列好处,包括透明度、灵活性和协作开发,对于AI模型的进步和增强贡献重大。
Falcon LLM的开源方法秉承了这些好处。它促进了一个鼓励知识共享和集体改进的环境。通过提供其AI模型代码库的访问权限,Falcon LLM允许全球开发人员研究、修改和增强其算法。促进了持续创新和改进的循环,直接惠及使用这些模型的企业。
阿布扎比先进技术研究委员会(ATRC)和阿联酋科技创新研究所(TII)在塑造Falcon LLM的开源之旅中发挥了至关重要的作用。中东政治和资本希望主导全球大模型和生成式AI的野心昭然若揭——该组织表示“协作是开源的基石。通过阿布扎比先进技术研究委员会(ATRC)和阿联酋科技创新研究所(TII)等组织的积极参与,我们正在创建一个全球智慧合作的平台,以推动AI的进步。”
像Falcon LLM这样的开源模型在民主化AI技术方面发挥着重要的作用。通过提供免费访问最先进的模型,Falcon LLM赋予了各种用户,从个人研究人员到大型企业,探索和创新AI的能力,而不需要支付通常与专有模型相关的高昂费用。
虽然开源AI模型具有显著的优势,但也不是没有挑战:首先由于代码的公开可访问性,知识产权保护变得复杂。其次当涉及大量贡献者时,确保质量控制可能会很困难。最后由于无限制访问,恶意更改或技术滥用的风险可能会增加。
作为一个开源AI模型,Falcon LLM在各个行业领域都有广泛的应用,从生成创意内容和自动化重复任务到更复杂的用途,如情感分析和语言翻译。这种广泛的适用性使得它成为企业客户服务、软件开发和内容创作等行业的宝贵工具。
不同行业有不同的需求,现如今Falcon LLM已经被应用于以下领域:
- 机器翻译:对于在多语言环境中运营的企业,Falcon LLM通过提供准确的翻译来弥合语言隔阂。
- 文本生成:内容创作者可以利用Falcon LLM自动生成文本,从而节省宝贵的时间和资源。
- 语义搜索:该模型通过理解搜索查询背后的上下文和含义,而不仅仅是匹配关键词,增强了搜索能力。
- 情感分析:企业可以利用Falcon LLM从各种在线来源中评估客户情感,帮助他们更好地了解自己的受众。

   开源模型才是大势所趋?

开源AI模型,如Falcon LLM,向全球开发者开放,允许他们贡献和改进模型。这些模型借助集体智慧,形成强大且不断进化的工具。企业采用开源模型能够持续进行改进和更新,但也可能面临管理复杂性和安全风险。

闭源AI模型,由特定组织开发,通常提供更严格的质量控制和专业支持,但可能限制定制化能力,并使企业依赖于供应商的更新和维护

开源模型的优势在于数据隐私和定制能力。企业可以在私有服务器上运行模型,避免数据外泄给第三方供应商。然而,选择开源还是闭源,企业需要根据自身需求进行权衡。

Falcon LLM作为一个开源模型,在商业应用中表现出色,能够无缝集成进各种业务流程。它的适应性使其能够根据企业的具体需求进行调整,无论行业或规模大小。

开源模型如Falcon LLM降低了企业采用AI的门槛,无需支付昂贵的许可费用,且可以在内部服务器上运行。尽管大型模型可能需要更多资源,Falcon LLM的优化架构确保了资源的高效利用。

总之,Falcon LLM将商业可用性与资源优化相结合,提供了灵活性以满足多样化的业务需求,并通过优化资源使用提供最大价值。随着AI技术的不断发展,开源模型将继续在推动创新和进步中发挥关键作用。

Open CSG创始人陈冉此前参与非凡产研举办的AIGC发展论坛时曾表示,大模型就应该以开源的方式给到客户——因为客户的数据拥有其自己的知识产权,训练出的模型也应该归客户所有,模型不应该被商用,应该追寻普世价值。开源非常重要;开源关乎商业模式盈利,关乎产业链。戴尔公司AI战略高级副总裁马特·贝克(Matt Baker)曾经接受媒体采访时,也对封闭模型的局限性直言不讳:“大型公开模型本身对私人企业几乎没有任何价值可言”。他表示,这些模型试图提供一个非常通用的模型,结果变得臃肿,但它们并不容易让企业用户轻松访问自己的数据。

智谱AI CEO张鹏则表示,开源和闭源大模型两者天生不是矛盾对立的,也不是竞争的关系。对于整个行业来说,两者互为补充。开源是为了保持社区的繁荣和多样性,能够保证技术、产品能够源源不断补充新鲜的血液和产生新的变化,闭源的商业化的版本肯定是用来满足安全、低成本、高效、持续有价值的商业化需求。

2024,开源AI大战才刚刚拉开帷幕!
【声明】内容源于网络
0
0
非凡产研
非凡产研是非凡资本旗下全球数智商业研究中心。非凡产研专注于商业场景下国内、出海及全球化企业服务生态领域的研究,团队成员来自知名研究咨询公司、私募基金和科技体等,是一支具有深入洞察、专业知识和丰富资源的分析师团队。
内容 1272
粉丝 1
非凡产研 非凡产研是非凡资本旗下全球数智商业研究中心。非凡产研专注于商业场景下国内、出海及全球化企业服务生态领域的研究,团队成员来自知名研究咨询公司、私募基金和科技体等,是一支具有深入洞察、专业知识和丰富资源的分析师团队。
总阅读236.0k
粉丝1
内容1.3k