Mistral Small 3.1在前代基础上进行了显著改进,成为一款多模态模型,并具有高达128,000的令牌上下文长度。该模型经过量化处理后,可以适应单个RTX 4090显卡或配备32GB内存的MacBook。
Mistral的测试结果显示其性能优于其他同类模型,尽管外部验证仍在进行中。用户可以通过La Plateforme API访问Mistral Small 3.1,进行多种任务的交互。
主要特点包括:
- 多模态功能:支持文本、图像等多种输入形式。
- 扩展的上下文窗口:128,000令牌的上下文长度,适用于更复杂的任务。
- 高效硬件适配:可在普通消费级设备上运行,降低了使用门槛。
北京大学张牧涵团队近日提出了一种全新的框架——Long Input Fine-Tuning(LIFT),通过将长输入文本训练进模型参数中,使任意短上下文窗口模型获得处理长文本的能力。
这一方法颠覆了传统的长文本处理思路,不再专注于无限扩充上下文窗口,而是将长文本知识内化到模型参数中,类似于人类将工作记忆转化为长期记忆的过程。具体来说,LIFT框架通过在预训练阶段引入长文本数据,使得模型能够学习和存储这些信息,并在后续的推理过程中利用这些内化的知识。
目前大模型处理长文本面临的主要挑战包括:
- 传统注意力机制的平方复杂度导致处理长文本时计算和内存开销巨大。
- 模型难以理解散落在长文本各处的长程依赖关系。
LIFT框架通过将长文本知识内化到模型参数中,有效缓解了这些问题,为长文本处理提供了新的解决方案。这一创新有望在自然语言处理、文档摘要、法律文书分析等需要处理大量文本信息的应用场景中发挥重要作用。
据《科创板日报》报道,阿里云近日正式启动了一项名为“T 项目”的新计划,旨在加速下一代人工智能技术的研发。该项目将重点聚焦于多个前沿领域,包括AI 引擎、大型语言模型(LLM)和多模态技术等。
通过这些技术领域的突破,阿里云期望满足市场对更高效和智能解决方案的日益增长需求。“T 项目”的启动标志着阿里云在人工智能领域的布局进一步加深。
知情人士透露,该项目不仅会加快技术研发速度,还将吸引更多优秀人才参与其中。为了增强团队的多样性和创新能力,参与项目的员工将通过类似“借调”的方式加入,从而汇集不同背景的专业知识。
近年来,随着人工智能技术的迅猛发展,各大科技公司纷纷加大了在该领域的投入。阿里云此次启动“T 项目”,不仅是其对技术创新的坚定承诺,也是在全球竞争中保持领先地位的重要举措。通过在AI引擎、大型语言模型和多模态技术方面的持续探索,阿里云有望在未来实现更多突破性进展,为各行各业提供更加智能和高效的解决方案。
近日,由米哈游创始人蔡浩宇创立的神秘AI游戏公司Anuttacon推出了备受期待的新作《群星低语》(Whispers From The Star)。这款游戏以科幻为主题,结合了先进的自然语言处理和情感计算技术,为玩家提供了一种前所未有的互动体验。
与传统叙事游戏不同,《群星低语》通过实时对话机制,让玩家的选择直接影响游戏进程和角色命运。在游戏中,玩家将扮演一名天体物理系的女生Stella,她是外星星球GAIA上的唯一幸存者。玩家需要通过与Stella的对话来帮助她生存并找到逃离星球的方法。
游戏中的对话、情绪和肢体动作都是由AI实时生成,这使得每一个交互都充满了不确定性和新鲜感。此外,**AI技术**不仅提升了游戏的真实感,还为玩家提供了更加个性化和沉浸式的体验。
这款创新的游戏作品展示了AI在互动娱乐领域的巨大潜力,也为未来的游戏开发带来了新的灵感。
专注于让AI理解世界的Groundlight研究团队近日宣布开源了一套全新的AI框架,旨在解决视觉领域的一大难题——复杂的视觉推理。该框架不仅能让AI“看图识物”,还能像福尔摩斯一样,从图像中推理出更深层次的信息。
当前的AI在识别猫狗等简单对象方面已经相当成熟,但在理解图片背后的逻辑关系、进行更复杂的推理时,却经常遇到瓶颈。Groundlight的研究人员指出,现有的视觉语言模型(VLM)在处理需要深度解读的任务时表现不佳,这主要是因为这些模型在理解图像本身尚有不足。
为了解决这一问题,Groundlight的新框架采用了先进的多模态学习技术,通过结合图像和文本信息,提升AI的理解能力。该框架可以应用于多个场景,如医疗影像分析、自动驾驶中的环境感知以及安全监控系统中的人脸识别等。
此外,Groundlight团队还提供了丰富的文档和示例代码,方便开发者快速上手,进一步推动了计算机视觉领域的研究与应用。
腾讯搜狗输入法宣布其PC版「AI助手」正式接入满血版「腾讯元宝」大模型能力,为用户带来更便捷的AI体验。
此次升级无需额外下载AI软件,用户即可在键盘上直接体验强大的功能。借助腾讯混元和DeepSeek大模型的支持,AI助手能够实现「深度思考」和「联网搜索」,显著提升办公和学习效率。例如,在撰写文档或进行在线研究时,用户可以通过简单的操作获取相关信息和智能建议,大大减少了手动查找的时间。
具体应用场景包括:
- 撰写报告、论文等长文内容
- 进行快速信息检索和知识管理
- 提供实时语言翻译和语法检查
据报道,谷歌正在与台湾的联发科公司展开合作,共同研发其下一代人工智能芯片。这一举措旨在进一步提升谷歌在人工智能领域的技术能力。
此次合作将结合谷歌在AI算法和软件方面的深厚积累以及联发科在芯片设计和制造方面的丰富经验。双方计划通过优化硬件架构和算法,实现更高的计算效率和更低的功耗。
新的人工智能芯片预计将应用于智能手机、智能家居设备及其他物联网产品中,为用户提供更加智能化和高效的体验。
随着人工智能技术的不断发展,高性能、低功耗的专用芯片成为各大科技公司竞相追逐的目标。谷歌与联发科的合作不仅有助于推动行业进步,也将助力谷歌在激烈的市场竞争中保持领先地位。
小米公司近日宣布,通过将DeepSeek-R1算法迁移到其7B模型中,使其在音频理解领域取得了显著的突破。该模型在音频理解推断MMAU(Multi-Modal Audio Understanding)榜单上登顶,准确率提升了31%。
这一成果不仅展示了小米在人工智能领域的持续创新与技术实力,也标志着其在多模态理解方面的重大进展。DeepSeek-R1算法以其强大的自然语言处理能力而闻名,此次成功迁移至音频领域,进一步拓宽了其应用范围。
关键技术创新:
- 引入先进的多模态融合技术,提升音频特征提取能力。
- 优化模型训练策略,提高计算效率和推理速度。
- 结合大规模预训练模型,增强模型的泛化能力和鲁棒性。
未来,小米计划将这项技术应用于智能家居、语音助手等多个场景,为用户提供更智能、更便捷的服务体验。
近日,AI代码编辑器Cursor在其最新版本0.47.5的更新日志中透露,正在为Anthropic即将推出的“Claude3.7Sonnet Max”模型做准备。这一消息迅速引发业内关注。
然而,目前Anthropic尚未发布任何官方公告,关于“Claude3.7Sonnet Max”的具体信息仍是个谜。据了解,Cursor的更新日志明确提到为“3.7-sonnet-max”做准备,这或许暗示Anthropic正在为新模型铺垫技术基础。
近期,Anthropic对API进行了多项更新,包括提升Claude3.7Sonnet的处理效率、减少(token)使用量,并增强开发者的请求处理能力。这些改进可能为新模型的推出提供了坚实的技术支持。
在当前竞争激烈的AI市场中,各大公司都在不断推进自身技术的发展,以满足用户日益增长的需求。如果Claude3.7Sonnet Max确实发布,预计将带来更高效的代码生成和优化功能,进一步提升开发者的生产力。
尽管目前尚无确切消息,但业界普遍认为Anthropic的新动作将对整个AI领域产生重要影响。
浙江省人民政府办公厅发布了关于大力提振和扩大消费的专项行动实施方案。该方案旨在通过一系列措施,力争到2025年使社会消费品零售总额增长超过5%。方案中提到,将积极发展包括直播电商、即时零售、社区团购及兴趣电商在内的新型消费业态。
预计到2025年,全省将新增1000家直播相关企业,并培育300个“绿色直播间”,以此推动绿色环保理念在直播行业的应用。此外,政府还计划通过创新历史经典产品和中华老字号品牌,利用人工智能技术来提升消费者的购物体验。
值得注意的是,此次行动还将聚焦于打造国漫影视、数字内容以及二次元文化等领域的青年消费热点。同时,支持电商平台探索多元场景融合的发展模式,如二手商品交易市场的建设,鼓励平台为优质的外销商品提供更广泛的服务和支持。

