大数跨境

5月30日丨每日AI简讯

5月30日丨每日AI简讯 久新数智
2025-05-30
0



9agent.ai

点击蓝字 关注我们



每日AI简讯

2025.05.30


01

大模型

LLM

图片
  • DeepSeekR1今天一次「小更新」,颠覆了大模型格局,网友:尽快放R2

    DeepSeek发布R10528推理模型重大更新,高达6850亿参数,采用MIT许可证开源并支持商用。新版模型在编程任务基准测试中成绩显著提升,接近Claude4等顶级模型,用户实测显示其代码生成和复杂问题解决能力增强,但存在过度思考问题。该模型已在官方平台开放使用,免费且性能超越前代,引发开发者广泛关注,网友呼吁尽快推出R2版本。

    原文链接:https://www.jiqizhixin.com/articles/202505292

  • OpenRouter上线DeepSeekR10528 API,并推出特别免费版本

    OpenRouter正式上线DeepSeek最新开源模型DeepSeekR10528的API接口,该模型以671亿参数规模及高效架构为亮点,在数学推理与代码生成方面媲美OpenAI模型,成本仅为后者的1/20至1/50。OpenRouter同步推出含164K token上下文窗口的免费版本(deepseekr1:free),提供1000个免费信用点,大幅降低开发者使用门槛。此举通过优化部署和统一接口优势,助力开源AI生态发展,并在多平台竞争中凭借免费模式及灵活切换能力占据先机。

    原文链接:https://www.aibase.com/zh/news/18475

  • 蚂蚁集团开源Mingliteomni:首个媲美GPT4o的开源多模态模型

    蚂蚁集团宣布开源多模态大模型Mingliteomni,该模型基于MoE架构,总参数达220亿,支持文本、图像等多模态处理,性能对标GPT4o。作为首个开源对标GPT4o的模型,其模型权重和推理代码已开放,后续将发布训练代码及数据。该模型在多项评测中表现优异,验证了国产GPU训练顶级模型的可行性,延续了团队此前开源Linglite等模型的战略布局,为开发者提供高性能多模态技术方案。

    原文链接:https://www.aibase.com/zh/news/18496

  • 通义实验室、北大发布新技术ZeroSearch 让LLM检索能力激活,成本降低88%

    通义实验室与北京大学联合推出ZeroSearch框架,通过将大语言模型模拟为搜索引擎,无需真实搜索即可激活模型检索能力,训练成本降低88%。该技术利用预训练知识生成检索文档,避免传统方法中API调用成本高及搜索结果不稳定的问题,结合"模拟微调"策略提升文档质量。实验表明其性能优于传统搜索方法,且在模型参数量增加时持续提升,为大语言模型训练和智能检索应用提供新方向。

    原文链接:https://www.aibase.com/zh/news/18486

  • Resemble AI开源TTS Chatterbox,性能超越ElevenLabs

    Resemble AI推出开源TTS模型Chatterbox,基于0.5B参数的LLaMA架构,训练超50万小时音频,盲测中63.75%用户认为其语音质量优于ElevenLabs。该模型支持5秒语音克隆和情感参数调节,实时合成延迟低于200毫秒,适用于虚拟助手等交互场景。内置Perth神经水印技术确保音频可追溯,准确率达100%。开源模式降低开发门槛,GitHub已发布项目,同时企业用户可选购付费高阶服务,形成开源与商业化双轨战略。

    原文链接:https://www.aibase.com/zh/news/18477


02

产品应用

Product Application

图片
  • v0推出 GitHub 同步功能,助力团队高效协作

    v0平台推出GitHub同步功能,支持AI生成代码一键推送至GitHub仓库,并实时双向同步代码变更。新功能包含三大核心:自动检测仓库更新并同步至聊天界面、分支切换与拉取请求创建、全流程代码管理,使开发者无需切换工具即可完成开发协作闭环。该功能标志着v0从原型工具转型为开发平台,现已正式上线,可显著提升个人及团队的代码协作效率。

    原文链接:https://www.aibase.com/zh/news/18476

  • 字节推出全新 AI 剪辑应用 “剪小映”,轻松记录生活瞬间

    字节跳动推出AI视频剪辑应用"剪小映",基于火山引擎豆包大模型技术实现智能创作。该应用通过AI技术简化视频编辑流程,用户无需专业技能即可一键生成高质量视频,支持智能分析、剪辑及合成功能,有效降低创作门槛。作为继"即梦AI"后的新作,"剪小映"主打"捕捉美好,智创影片"理念,旨在帮助普通用户轻松记录生活瞬间并快速分享,其内置的大模型技术显著提升了视频处理效率,目前已在应用市场正式上线。

    原文链接:https://www.aibase.com/zh/news/18485

  • 字节发布图像Agent“小云雀AI” 打造一键爆款创作神器

    字节跳动推出图像Agent"小云雀AI",用户通过自然语言指令即可自动生成视频与图片内容,大幅降低创作门槛。该工具基于自研"云雀"大模型,整合深度学习和多模态技术,支持智能构图与视频编辑,适配短视频创作者、营销团队等多元化场景。安卓版已上线应用商店,iOS版本预计6月发布。作为2025年"AI Agent元年"的重要布局,该产品将推动生成式AI向更广泛应用场景渗透,助力用户实现零基础高效创作。

    原文链接:https://www.aibase.com/zh/news/18488

  • 可灵2.1重磅上线:价格降65%,性能显著提升

    AI视频生成工具可灵2.1版本正式发布,价格体系下调65%并推出三级质量模型。标准版(720P/20灵感值)、高品质版(1080P/35灵感值)和大师版(1080P影视级/100灵感值)分层满足不同需求,生成效果已超越前代2.0大师版。新版生成速度提升50%以上,尤其适配短视频及广告制作场景,虽暂仅支持图生视频功能,但通过优化算法显著缩短用户等待时间,性价比提升获市场广泛认可。

    原文链接:https://www.aibase.com/zh/news/18490

  • 百度上线AI志愿助手、高考大数据等系列AI产品

    百度针对2025年高考考生推出系列AI工具,包含高考高频考点库、AI志愿助手及24小时外援团直播间。高频考点库整合近三年核心知识点,考生通过百度APP搜索“高考”可获取各省份科目考点及真题解析;AI志愿助手可基于分数生成“冲稳保”三档志愿表并预测录取概率;外援团直播间联动2000所高校智能体及师生,提供实时答疑服务。三大工具覆盖复习、填报及咨询全流程,助力考生高效备考。

    原文链接:https://www.aibase.com/zh/news/18499


03

硬件&底层技术前沿

Hardware Technologies

图片
  • 谷歌放大招!LMEval开源评测框架上线,AI模型比拼从此更透明

    谷歌发布开源框架LMEval,为大语言模型和多模态模型提供标准化评测工具。该框架兼容谷歌、OpenAI等主流AI平台,支持文本、图像、代码跨模态评估,内置多线程和增量评估功能节省计算资源。通过LMEvalboard可视化工具和规避策略检测功能,提升模型性能分析透明度。开源特性降低评测门槛,支持开发者快速对比Gemini等模型版本,推动AI行业评测标准化与技术创新。

    原文链接:https://www.aibase.com/zh/news/18482

  • 全球首款AI代理浏览器Opera Neon发布,智能聊天与自动化任务引领Web4.0时代

    Opera推出全球首款AI代理浏览器Neon,集成智能聊天、任务自动化及内容创作功能。Neon Chat支持50+语言上下文交互,Neon Do可离线执行表单填写、行程规划等任务,Neon Make通过指令生成代码/网站等创作内容。采用本地化数据存储和欧洲服务器保障隐私,未来将推付费订阅模式。该浏览器以"代理式"设计推动Web4.0发展,相较Chrome和Safari的AI功能更具主动服务特性,现开放Alpha版候补名单,预计2025年晚些公测。

    原文链接:https://www.aibase.com/zh/news/18483

  • MotionPro炸场!AI视频生成革命来袭,40ms一帧精准控制,影视游戏行业要变天

    MotionPro推出AI视频生成精密控制技术,通过区域轨迹和运动掩码实现40ms/帧的精细化运动控制,可同步解耦物体移动与镜头推拉摇移。该技术突破传统高斯核扩展的粗糙控制局限,支持用户拖拽式交互操作,并开源PyTorch框架及MC-Bench数据集赋能开发者。其精准的镜头轨迹控制能力将重塑影视、游戏行业创作流程,但需警惕深假视频风险。研发团队表示将继续优化模型架构,探索多物体交互的沉浸式生成场景。

    原文链接:https://www.aibase.com/zh/news/18491

  • Ollama v0.8发布:本地AI模型新增流式响应与实时搜索功能

    Ollama推出v0.8版本,新增流式传输响应和工具调用功能,支持实时生成结果与连接外部API(如网络搜索)。该版本优化了内存泄漏问题,提升Gemma3等模型的长文本处理速度,并支持AMD显卡与OpenAI API兼容。开发者可通过开源框架运行Llama3.3、DeepSeek-R1等主流模型,实现本地低延迟交互,在隐私敏感场景下兼顾效率与安全。项目已在GitHub开源,提供Windows/Linux跨平台支持。

    原文链接:https://github.com/ollama/ollama/releases/tag/v0.8.0

  • 通义大模型发布OmniAudio 可从 360° 视频生成空间音频

    通义实验室推出OmniAudio空间音频生成技术,可通过360°视频直接生成四通道FOA格式音频,突破传统技术对固定视角视频的局限。该技术采用两阶段训练方案:先通过自监督流匹配预训练掌握通用音频特征,再结合双分支视频编码器进行微调实现视听对齐。配套Sphere360数据集含10.3万段全景视频,覆盖288类音频事件。实验显示OmniAudio在客观指标和主观评估中均优于基线模型,空间定位精度和音画同步性显著提升,现已开源相关代码及数据资源。

    原文链接:https://www.aibase.com/zh/news/18501


04

上市公司动态

Listed Company Updates

图片
  • 理想汽车 OTA7.4 更新:全新 MindGPT-4o-preview 模型上线,智能座舱焕然一新

    理想汽车推出OTA7.4版本更新,搭载自研MindGPT-4o-preview模型,全面升级智能座舱体验。理想同学升级为3D毛绒形象,新增“小同桌”角色互动功能,支持情感化语音及支付宝小程序操作。新增家庭账号系统可记录用车习惯,面容识别自动调整车辆设置。影音方面推出前后双音区独立播放和低音增强技术,并针对儿童推出“小主人”模式及六一主题内容。此次更新涵盖交互、个性化服务及娱乐体验,实现智能化与人性化深度结合。

    原文链接:https://www.aibase.com/zh/news/18479


05

其他

Other

图片
  • Telegram与xAI达成3亿美元合作:Grok聊天机器人全面整合

    Telegram与马斯克旗下xAI达成3亿美元现金加股权合作,将全面整合Grok聊天机器人至平台。该合作期限一年,Telegram用户可通过应用搜索栏使用Grok提问、总结文档、创建贴纸,企业还可用于客服审核。Grok此前已向高级用户开放,现计划扩展至全体用户。根据协议,Telegram将获得用户订阅xAI服务的50%分成,聊天机器人功能将固定在聊天界面顶部,实现深度交互整合。

    原文链接:https://www.aibase.com/zh/news/18474

  • Netflix 联合创始人 Reed Hastings 正式加入 Anthropic 董事会

    Netflix 联合创始人 Reed Hastings 加入人工智能公司 Anthropic 董事会,其丰富的科技与商业背景(曾任 Facebook、微软等公司董事)将为 Anthropic 提供战略支持。Hastings 表示看好 Anthropic 平衡人工智能发展与应对社会挑战的愿景,其加入或推动公司在技术创新与社会责任结合上的探索。此前 Anthropic 刚发布 Claude4 模型,Hastings 的卸任 Netflix 高管职位使其能更专注新角色,助力公司拓展技术应用与社会价值。

    原文链接:https://www.aibase.com/zh/news/18502



⬇️更多AI资讯关注我们⬇️



【声明】内容源于网络
0
0
久新数智
重塑生产力,开启人机协作新篇章!
内容 0
粉丝 0
久新数智 重塑生产力,开启人机协作新篇章!
总阅读0
粉丝0
内容0