大数跨境

【AI一周大事件】2月12日-2月21日

【AI一周大事件】2月12日-2月21日 陆兮科技LuxiTech
2024-02-23
2
导读:盘点每周人工智能、大语言模型、AI应用等领域的政策热点、行业趋势

【AI一周大事件】由陆兮科技根据公开信息整理,盘点每周人工智能、大语言模型、AI应用等领域的政策热点、行业趋势与学术动态。

NEWS
行业资讯

国资委召开中央企业人工智能专题推进会 加快建设一批智能算力中心

2月19日,国务院国资委召开“AI赋能 产业焕新”中央企业人工智能专题推进会。会议认为,加快推动人工智能发展,是国资央企发挥功能使命,抢抓战略机遇,培育新质生产力,推进高质量发展的必然要求。


会议强调,中央企业要把发展人工智能放在全局工作中统筹谋划,深入推进产业焕新,加快布局和发展人工智能产业。要夯实发展基础底座,把主要资源集中投入到最需要、最有优势的领域,加快建设一批智能算力中心,进一步深化开放合作,更好发挥跨央企协同创新平台作用。开展AI+专项行动,强化需求牵引,加快重点行业赋能,构建一批产业多模态优质数据集,打造从基础设施、算法工具、智能平台到解决方案的大模型赋能产业生态。



Sora推动AI视频生成进入全新领域

近日,美国OpenAI公司正式发布文生视频模型Sora,再次在全球掀起了人工智能关注浪潮。春节后的首个交易日,汉仪股份、宣亚国际、因赛集团等在内涉及文生视频的A股上市公司20%涨停,20日上午Sora概念股延续强势。业内人士认为,从当前展示效果来看,Sora显著领先于其他文生视频模型,后续潜在的商业化有望对短视频、电影、游戏等下游领域产生深远影响,并进而传导到上游算力基础设施,算力需求有望再次迎来爆发。



谷歌推出了全新的开源模型系列「Gemma」,可在笔记本运行

相比 Gemini,Gemma 更加轻量,同时保持免费可用,模型权重也一并开源了,且允许商用。Gemma「能够直接在开发人员的笔记本电脑或台式电脑上运行」。除了轻量级模型之外,谷歌还推出了鼓励协作的工具以及负责任地使用这些模型的指南。总体来说,Gemma 是一个轻量级的 SOTA 开放模型系列,在语言理解、推理和安全方面表现出了强劲的性能。



AI手机“大战”将起,多家手机厂商表态All in

2 月 18 日,魅族宣布 All in AI,将停止传统「智能手机」新项目,全力投入「明日设备」AI For New Generations。而 2 月 20 日,将 AI 功能部署到手机上最积极的手机厂商之一的 OPPO,宣布了其 AI 战略。OPPO 首席产品官刘作虎表示,对我们来说,AI 是新时代最关键的一个事情。



苹果接近完成一款人工智能工具,将与微软GitHub Copilot竞争

据报道,竞相增加更多人工智能功能的苹果公司接近完成一款面向应用程序开发者的关键新软件工具,这将加剧与微软的竞争。知情人士表示,新系统的运行方式将类似于微软的GitHub Copilot,并使用人工智能来预测和完善代码块。这简化了软件开发的编程过程,潜在节省了时间和金钱。



英伟达进军数据中心芯片定制业务,挑战博通

英伟达正在建立一个新的业务部门,专注于为云计算公司和其他公司设计定制芯片,包括先进的人工智能(AI)处理器。目前,数据中心的定制芯片设计由Broadcom和Marvell主导。



华泰证券:AI视频进入大规模应用前夜

华泰证券研报认为,OpenAI发布文生视频模型Sora,AI视频进入大规模应用前夜。1)Sora模型在视频生成时长、语义理解程度、以及视频效果和稳定性等方面超出此前竞品,随着Sora、Pika等应用的陆续出圈,后续AI视频应用竞争或更为激烈;2)虽Sora暂未公开使用权限,但其后续潜在的商业化有望对短视频、电影、游戏等下游领域产生深远影响;3)AI视频应用在算力消耗上远超文本、音频及图像,建议关注推理端算力需求提升,以及后续其商业化程度是否能形成收入和投资的正反馈。


NEWS
学术动态



SORA:作为世界模拟器的视频生成模型

标题:Video generation models as world simulators

链接:https://openai.com/research/video-generation-models-as-world-simulators


摘要

研究者们探索了在视频数据上大规模训练生成模型。具体来说,研究者在不同持续时间、分辨率和纵横比的视频和图像上联合训练了文本条件扩散模型。其中利用了一种 transformer 架构,该架构在视频和图像潜在编码的空间时间块(spacetime patches)上运行。最大的模型型号 Sora 能够生成一分钟的高保真视频。研究结果表明,扩展视频生成模型是构建物理世界通用模拟器的一条有前途的途径。



Gemini 1.5:在数百万上下文长度中解锁多模态理解

标题Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context
链接:https://storage.googleapis.com/deepmind-media/gemini/gemini_v1_5_report.pdf


摘要
在这份报告中,作者介绍了 Gemini 系列的最新型号 Gemini 1.5 Pro,这是一种高计算效率的多模态专家混合模型,能够从数百万个上下文 token 中调用和推理细粒度信息,包括多个长文档和数小时的视频和音频。


Gemini 1.5 Pro 在跨模态的长上下文检索任务上实现了近乎完美的召回,在长文档 QA、长视频 QA 和长上下文 ASR 方面提高了最先进的水平,并在一系列广泛的基准测试中达到或超过了 Gemini 1.0 Ultra 的最新性能。


通过研究 Gemini 1.5 Pro 长上下文能力的极限,结果发现下一个 token 预测和检索 (>99%) 的持续改进,最高可达至少 10M 个 token,比起 Claude 2.1 (200k) 和 GPT-4 Turbo (128k) 等现有模型有了代际的飞跃。最后,作者还重点介绍了前沿大型语言模型令人惊讶的新功能:当给出卡拉芒语(一种全球使用者不到 200 人的语言)的语法手册时,该模型学习将英语翻译成卡拉芒语的水平与从相同内容中学习的人类相似。


自我发现:大语言模型自组合推理结构
标题:Self-Discover: Large Language Models Self-Compose Reasoning Structures
链接:https://arxiv.org/abs/2402.03620


摘要

本文引入了 SELF-DISCOVER,一个自我发现任务内在推理结构的 LLM 一般框架,以解决对典型提示方法具有挑战性的复杂推理问题。


该框架的核心是一个自我发现过程,其中 LLMs 选择多个原子推理模块,如批判性思维和分步思维,并将它们组合成一个明确的推理结构,以便在 LLMs 解码过程中遵循。SELF-DISCOVER 大幅提高了 GPT-4 和 PaLM 2 在具有挑战性的推理基准(如 BigBench-Hard、接地代理推理和 MATH)上的性能,相比 CoT 提高了 32%。此外,SELF-DISCOVER 的性能比 CoT-Self-Consistency 等推理密集型方法高出 20% 以上,同时需要的推理计算量减少了 10-40 倍。最后,结果表明,自我发现的推理结构普遍适用于各种模型家族:从 PaLM 2-L 到 GPT-4,从 GPT-4 到 Llama2,并且与人类推理模式具有共性。



意识理论的综合、多尺度观点
标题An integrative, multiscale view on consciousness theories
链接:https://osf.io/preprints/psyarxiv/9byzu


摘要
意识经验是如何与物质大脑过程相关联的?最近意识研究的热潮中,出现了各种各样的理论,都试图回答这个古老的问题,其中一些理论现在正受到激烈的争论。到目前为止,大多数研究人员都在相对孤立的情况下专注于发展和验证他们喜欢的理论,而这篇由一群代表不同理论的科学家撰写的文章,采取了另一种方法。他们注意到各种理论经常试图解释意识的不同方面或机械水平,因此认为理论并不一定相互矛盾。相反,它们中的一些可能集中在基本的神经元机制上,并且部分兼容和互补,因此多种理论可以同时为最终的理解做出贡献。本文中,研究者们考虑到迄今为止在很大程度上被忽视的统一、面向综合的方法,寻求从各种理论中结合有价值的元素。

参考资料:

1.https://baijiahao.baidu.com/s?id=1791007513626079628&wfr=spider&for=pc

2.https://baijiahao.baidu.com/s?id=1790652077483029615&wfr=spider&for=pc

3.https://www.bbtnews.com.cn/2024/0218/504196.shtml

4.https://www.cnfin.com/bjh/detail/20240220/4013696_1.html

5.https://mp.weixin.qq.com/s/_iCYfqmXA3enKn3Hm-DwSA

6.http://www.sasac.gov.cn/n2588025/n2643314/c30098649/content.html

7.https://www.geekpark.net/news/331469

8.https://mp.weixin.qq.com/s/nYZUUbTRikK6rScd-bLH8g


(*本文内容由网络公开信息整理而成,不代表陆兮科技官方立场)

 .END.

陆兮科技:智能、便携、普惠、高效的类脑大模型革新者



【声明】内容源于网络
0
0
陆兮科技LuxiTech
陆兮的类脑大语言模型「Neuromorophic language model」基于循环神经网络和脉冲神经网络,采取原创的类脑算法架构
内容 26
粉丝 0
陆兮科技LuxiTech 陆兮的类脑大语言模型「Neuromorophic language model」基于循环神经网络和脉冲神经网络,采取原创的类脑算法架构
总阅读0
粉丝0
内容26