【AI一周大事件】由陆兮科技根据公开信息整理,盘点每周人工智能、大语言模型、AI应用等领域的政策热点、行业趋势与学术动态。
1月29日,腾讯在深圳湾体育中心召开了公司年会。腾讯公司董事会主席、首席执行官马化腾在会上表示,目前腾讯在 AI 行业算得上第一阵列,之后它要将混元大模型落地到更多的应用场景中。同时,马化腾表示,在未来的短期一两年内,腾讯不会推出纯原生AI应用,而是会将混元大模型融入到现有的产品中来提升效率。
2023年9月7日,腾讯发布自研混元大模型,支持图片生成、文案创作、文字辨识、客户服务等功能。目前,已有超过180个腾讯内部业务接入腾讯混元,包括腾讯会议、腾讯文档、企业微信、腾讯广告和微信搜一搜等。2023年12月22日,腾讯混元大模型通过《人工智能大规模预训练模型》的相关技术要求,成为首批通过国家大模型标准符合性测试的4个大模型之一。
英伟达对华“特供版”H20芯片已接受订购,售价高达11万元
2月1日消息,据媒体报道,英伟达已开始接受经销商预订一款新的“中国特供缩水版” AI 芯片H20,性能远低于H100,但定价与华为昇腾产品相当。报道称,英伟达对中国 H20 分销商的订单定价为每张卡 12,000 美元至 15,000 美元。一些分销商已开始公开相关加价广告,价格约为 11 万元人民币(15,320美元)。相比之下,华为910B售价约为 12 万元。一位消息人士称,经销商正在提供 H20 服务器,预配置8个H20芯片,售价为140万元。相比之下,采用8颗H800芯片的服务器一年前推出时售价在200万元左右。
1月31日,有国外媒体读者提供的截图表示,ChatGPT 泄露了多段非用户本人的对话内容,其中包含了大量敏感信息。该读者原本只是使用 ChatGPT 进行一个无关的查询,却意外发现聊天记录中出现了不属于自己的对话内容。这些泄露的对话内容涉及多个方面。其中一组对话似乎来自药房处方药门户员工使用的支持系统,透露了该门户的名称、发生问题的店铺编号以及登录凭证。另一段对话则泄露了某人正在制作的演示文稿名称以及一份尚未发表的研究提案的细节。
这并不是ChatGPT首次出现信息泄露,去年11月就有研究人员发布过一份报告展示如何用查询功能来诱使ChatGPT泄露个人电子邮箱、电话、地址等私人数据。同日,OpenAI宣布GPT Mentions功能上线,支持用户在ChatGPT对话界面通过输入@并选择GPT的方式,调用不同GPTs。
微软、OpenAI参与人形机器人Figure AI新一轮融资
彭博社报道,人形机器人初创企业Figure AI正在进行新一轮融资,本次融资由微软和OpenAI领投,筹资总额多达5亿美元。这家公司还在为这笔交易寻找更多投资者。按目前讨论情况,微软将投资约9500万美元,OpenAI将投资500万美元。这笔交易可能会给Figure AI带来19亿美元的投前估值。
2月2日消息,欧盟27国代表投票一致支持《人工智能法案》文本,预计欧盟立法委员会将于2月13日进行投票,欧洲议会于 3 月或 4 月进行投票。该法案可能会在夏季之前生效,并应于2026 年实施,尽管部分立法将提前生效。
欧盟内部市场委员蒂埃里·布雷东表示,27国一致支持这一法案,说明他们认可“谈判者在创新与安全之间找到了完美平衡”。据悉,欧盟委员会于2021年4月提出《人工智能法案》提案的谈判授权草案。去年12月,欧洲议会、欧盟成员国和欧盟委员会三方就《人工智能法案》达成协议。不过也有包括法国、德国在内的一些国家对法案文本表达异议,担忧法案对先进人工智能模型的严格监管将阻碍欧洲 AI 发展。为了解决这些担忧,欧盟委员会在 AI 领域推出多项支持创新的措施,建立新的监管机构“人工智能办公室”负责该法案的实施。
标题:OLMo: Accelerating the Science of Language Models
链接:https://arxiv.org/abs/2402.00838
作者:Dirk Groeneveld, Iz Beltagy, Pete Walsh 等
单位:Allen AI 研究所等
摘要:
语言模型 (LM) 在 NLP 研究和商业产品中已经变得无处不在。随着其商业重要性的飙升,最强大的模型被闭源,封闭在专有接口后面,其训练数据、架构和开发的重要细节均未公开。考虑到这些细节在科学研究这些模型中的重要性,包括它们的偏差和潜在风险,作者认为研究界有必要获得强大的、真正开放的 LM。为此,本技术报告详细介绍了 OLMo 的第一个版本,这是一种最先进的、真正的开放语言模型及其用于构建和研究语言建模科学的框架。与之前大多数仅发布模型权重和推理代码的工作不同,本文发布了 OLMo 和整个框架,包括训练数据以及训练和评估代码。作者希望这个版本能够增强开放研究社区,并激发新的创新浪潮。
标题:Rephrasing the Web: A Recipe for Compute and Data-Efficient Language Modeling
链接:https://arxiv.org/abs/2401.16380
作者:Pratyush Maini, Skyler Seto, He Bai, David Grangier, Yizhe Zhang, Navdeep Jaitly
大型语言模型是在大量网络数据上进行训练的,这些网络数据通常是非结构化的、嘈杂的且措辞糟糕的。当前的缩放定律表明,从此类数据中学习需要大量的计算和数据,而这些计算和数据随着所训练的模型的大小而增长。这是不可行的,因为与预训练相关的计算成本和持续时间巨大,而且网络上高质量数据即将稀缺。在这项工作中,研究者提出了 Web 改写增强预训练(Web Rephrase Augmented Pre-training, WRAP),它使用现成的指令调整模型,提示以特定风格解释网络上的文档,例如「维基百科」或以「问答格式」联合预训练真实和合成的改写 LLMs。首先,本文证明在自然有噪声的 C4 数据集上使用 WRAP 可以将预训练速度加快 ∼3x 。在相同的预训练计算预算下,它在 Pile 的不同子集上平均提高了 10% 以上的困惑度,并将 13 个任务的零样本问题答案准确性提高了 2% 以上。其次,作者研究了重新措辞风格对模型性能的影响,深入了解训练数据的组成如何影响 OOD 设置中 LLMs 的性能。结果的收益归因于这样一个事实:重新表述的合成数据比真实数据具有更高的效用,因为它(i)包含密切反映下游评估风格的风格多样性,并且(ii)比网络抓取的数据具有更高的「质量」。
标题:Unsolved Mysteries of the Mind and the Brain: Fractal Brain Hypothesis
链接:https://link.springer.com/chapter/10.1007/978-981-99-9334-5_1
作者:Tanusree Dutta & Anirban Bandyopadhyay
几个世纪以来,哲学家们一直对人类的思想着迷。是什么让我们有意识?我们如何体验情绪?自我意识的本质是什么?当西方哲学家正在与心灵和身体的二元性作斗争时,感受质被表征为「意识的难问题」,吠陀哲学家将物理世界 Prakriti 和非物理世界 Purusha 结合在一起,作为单一实体 Purusha-Prakriti,从而避免了围绕感受质的大量辩论。在本章中,作者将探讨分形大脑理论(fractal brain theory),这是一种理解意识的新方法。
该理论提出,大脑是以分形模式组织的,每个组织级别都反映了它上面的组织级别。这种模式产生了大量可能的意识状态,每种状态都有自己独特的风味。作者还将讨论噪音在意识中的作用。噪音通常被视为一种干扰,但它也可以发挥积极作用。事实上,一些研究表明,噪音实际上可以提高创造力和解决问题的能力。最后,作者将研究脑电图和小组研究技术的局限性,这是发明高级脑电图(即十二烷图或DDG)的基础,这也是本书的主要重点。脑电图技术通常用于研究意识、脑部疾病,但它们有一些重要的缺点。作者将讨论这些局限性,以及如何用新的工具来解读潜意识以克服它们。本章只是我们进入人类思维迷人科学之旅的开始。在接下来的章节中,我们还将探索人类受试者对大脑神秘特征的实验,并揭示更多关于人类大脑科学的信息。
参考资料:
1.https://www.jiemian.com/article/10781442.html
2.https://baijiahao.baidu.com/s?id=1789426532565418375&wfr=spider&for=pc
3.https://arstechnica.com/security/2024/01/ars-reader-reports-chatgpt-is-sending-him-conversations-from-unrelated-ai-users/
4.https://www.bloomberg.com/news/articles/2024-01-30/humanoid-robot-startup-figure-ai-in-funding-talks-for-over-2-billion-valuation?embedded-checkout=true
5.https://www.theinformation.com/briefings/eu-unanimously-approves-draft-ai-act
6.https://mp.weixin.qq.com/s/Eh48Aqz2R-4loCl60StFEg
(*本文内容由网络公开信息整理而成,不代表陆兮科技官方立场)
.END.

陆兮科技:智能、便携、普惠、高效的类脑大模型革新者