5月30日丨每日AI简讯- 大数跨境

首页

5月30日丨每日AI简讯

久新数智

2025-05-30

9agent.ai

点击蓝字关注我们

每日AI简讯

2025.05.30

大模型

LLM

DeepSeekR1今天一次「小更新」，颠覆了大模型格局，网友:尽快放R2
DeepSeek发布R10528推理模型重大更新，高达6850亿参数，采用MIT许可证开源并支持商用。新版模型在编程任务基准测试中成绩显著提升，接近Claude4等顶级模型，用户实测显示其代码生成和复杂问题解决能力增强，但存在过度思考问题。该模型已在官方平台开放使用，免费且性能超越前代，引发开发者广泛关注，网友呼吁尽快推出R2版本。
原文链接：https://www.jiqizhixin.com/articles/202505292
OpenRouter上线DeepSeekR10528 API，并推出特别免费版本
OpenRouter正式上线DeepSeek最新开源模型DeepSeekR10528的API接口，该模型以671亿参数规模及高效架构为亮点，在数学推理与代码生成方面媲美OpenAI模型，成本仅为后者的1/20至1/50。OpenRouter同步推出含164K token上下文窗口的免费版本（deepseekr1:free），提供1000个免费信用点，大幅降低开发者使用门槛。此举通过优化部署和统一接口优势，助力开源AI生态发展，并在多平台竞争中凭借免费模式及灵活切换能力占据先机。
原文链接：https://www.aibase.com/zh/news/18475
蚂蚁集团开源Mingliteomni:首个媲美GPT4o的开源多模态模型
蚂蚁集团宣布开源多模态大模型Mingliteomni，该模型基于MoE架构，总参数达220亿，支持文本、图像等多模态处理，性能对标GPT4o。作为首个开源对标GPT4o的模型，其模型权重和推理代码已开放，后续将发布训练代码及数据。该模型在多项评测中表现优异，验证了国产GPU训练顶级模型的可行性，延续了团队此前开源Linglite等模型的战略布局，为开发者提供高性能多模态技术方案。
原文链接：https://www.aibase.com/zh/news/18496
通义实验室、北大发布新技术ZeroSearch 让LLM检索能力激活，成本降低88%
通义实验室与北京大学联合推出ZeroSearch框架，通过将大语言模型模拟为搜索引擎，无需真实搜索即可激活模型检索能力，训练成本降低88%。该技术利用预训练知识生成检索文档，避免传统方法中API调用成本高及搜索结果不稳定的问题，结合"模拟微调"策略提升文档质量。实验表明其性能优于传统搜索方法，且在模型参数量增加时持续提升，为大语言模型训练和智能检索应用提供新方向。
原文链接：https://www.aibase.com/zh/news/18486
Resemble AI开源TTS Chatterbox，性能超越ElevenLabs
Resemble AI推出开源TTS模型Chatterbox，基于0.5B参数的LLaMA架构，训练超50万小时音频，盲测中63.75%用户认为其语音质量优于ElevenLabs。该模型支持5秒语音克隆和情感参数调节，实时合成延迟低于200毫秒，适用于虚拟助手等交互场景。内置Perth神经水印技术确保音频可追溯，准确率达100%。开源模式降低开发门槛，GitHub已发布项目，同时企业用户可选购付费高阶服务，形成开源与商业化双轨战略。
原文链接：https://www.aibase.com/zh/news/18477

产品应用

Product Application

v0推出 GitHub 同步功能，助力团队高效协作
v0平台推出GitHub同步功能，支持AI生成代码一键推送至GitHub仓库，并实时双向同步代码变更。新功能包含三大核心：自动检测仓库更新并同步至聊天界面、分支切换与拉取请求创建、全流程代码管理，使开发者无需切换工具即可完成开发协作闭环。该功能标志着v0从原型工具转型为开发平台，现已正式上线，可显著提升个人及团队的代码协作效率。
原文链接：https://www.aibase.com/zh/news/18476
字节推出全新 AI 剪辑应用 “剪小映”，轻松记录生活瞬间
字节跳动推出AI视频剪辑应用"剪小映"，基于火山引擎豆包大模型技术实现智能创作。该应用通过AI技术简化视频编辑流程，用户无需专业技能即可一键生成高质量视频，支持智能分析、剪辑及合成功能，有效降低创作门槛。作为继"即梦AI"后的新作，"剪小映"主打"捕捉美好，智创影片"理念，旨在帮助普通用户轻松记录生活瞬间并快速分享，其内置的大模型技术显著提升了视频处理效率，目前已在应用市场正式上线。
原文链接：https://www.aibase.com/zh/news/18485
字节发布图像Agent“小云雀AI” 打造一键爆款创作神器
字节跳动推出图像Agent"小云雀AI"，用户通过自然语言指令即可自动生成视频与图片内容，大幅降低创作门槛。该工具基于自研"云雀"大模型，整合深度学习和多模态技术，支持智能构图与视频编辑，适配短视频创作者、营销团队等多元化场景。安卓版已上线应用商店，iOS版本预计6月发布。作为2025年"AI Agent元年"的重要布局，该产品将推动生成式AI向更广泛应用场景渗透，助力用户实现零基础高效创作。
原文链接：https://www.aibase.com/zh/news/18488
可灵2.1重磅上线:价格降65%，性能显著提升
AI视频生成工具可灵2.1版本正式发布，价格体系下调65%并推出三级质量模型。标准版（720P/20灵感值）、高品质版（1080P/35灵感值）和大师版（1080P影视级/100灵感值）分层满足不同需求，生成效果已超越前代2.0大师版。新版生成速度提升50%以上，尤其适配短视频及广告制作场景，虽暂仅支持图生视频功能，但通过优化算法显著缩短用户等待时间，性价比提升获市场广泛认可。
原文链接：https://www.aibase.com/zh/news/18490
百度上线AI志愿助手、高考大数据等系列AI产品
百度针对2025年高考考生推出系列AI工具，包含高考高频考点库、AI志愿助手及24小时外援团直播间。高频考点库整合近三年核心知识点，考生通过百度APP搜索“高考”可获取各省份科目考点及真题解析；AI志愿助手可基于分数生成“冲稳保”三档志愿表并预测录取概率；外援团直播间联动2000所高校智能体及师生，提供实时答疑服务。三大工具覆盖复习、填报及咨询全流程，助力考生高效备考。
原文链接：https://www.aibase.com/zh/news/18499

硬件&底层技术前沿

Hardware Technologies

谷歌放大招!LMEval开源评测框架上线，AI模型比拼从此更透明
谷歌发布开源框架LMEval，为大语言模型和多模态模型提供标准化评测工具。该框架兼容谷歌、OpenAI等主流AI平台，支持文本、图像、代码跨模态评估，内置多线程和增量评估功能节省计算资源。通过LMEvalboard可视化工具和规避策略检测功能，提升模型性能分析透明度。开源特性降低评测门槛，支持开发者快速对比Gemini等模型版本，推动AI行业评测标准化与技术创新。
原文链接：https://www.aibase.com/zh/news/18482
全球首款AI代理浏览器Opera Neon发布，智能聊天与自动化任务引领Web4.0时代
Opera推出全球首款AI代理浏览器Neon，集成智能聊天、任务自动化及内容创作功能。Neon Chat支持50+语言上下文交互，Neon Do可离线执行表单填写、行程规划等任务，Neon Make通过指令生成代码/网站等创作内容。采用本地化数据存储和欧洲服务器保障隐私，未来将推付费订阅模式。该浏览器以"代理式"设计推动Web4.0发展，相较Chrome和Safari的AI功能更具主动服务特性，现开放Alpha版候补名单，预计2025年晚些公测。
原文链接：https://www.aibase.com/zh/news/18483
MotionPro炸场!AI视频生成革命来袭，40ms一帧精准控制，影视游戏行业要变天
MotionPro推出AI视频生成精密控制技术，通过区域轨迹和运动掩码实现40ms/帧的精细化运动控制，可同步解耦物体移动与镜头推拉摇移。该技术突破传统高斯核扩展的粗糙控制局限，支持用户拖拽式交互操作，并开源PyTorch框架及MC-Bench数据集赋能开发者。其精准的镜头轨迹控制能力将重塑影视、游戏行业创作流程，但需警惕深假视频风险。研发团队表示将继续优化模型架构，探索多物体交互的沉浸式生成场景。
原文链接：https://www.aibase.com/zh/news/18491
Ollama v0.8发布：本地AI模型新增流式响应与实时搜索功能
Ollama推出v0.8版本，新增流式传输响应和工具调用功能，支持实时生成结果与连接外部API（如网络搜索）。该版本优化了内存泄漏问题，提升Gemma3等模型的长文本处理速度，并支持AMD显卡与OpenAI API兼容。开发者可通过开源框架运行Llama3.3、DeepSeek-R1等主流模型，实现本地低延迟交互，在隐私敏感场景下兼顾效率与安全。项目已在GitHub开源，提供Windows/Linux跨平台支持。
原文链接：https://github.com/ollama/ollama/releases/tag/v0.8.0
通义大模型发布OmniAudio 可从 360° 视频生成空间音频
通义实验室推出OmniAudio空间音频生成技术，可通过360°视频直接生成四通道FOA格式音频，突破传统技术对固定视角视频的局限。该技术采用两阶段训练方案：先通过自监督流匹配预训练掌握通用音频特征，再结合双分支视频编码器进行微调实现视听对齐。配套Sphere360数据集含10.3万段全景视频，覆盖288类音频事件。实验显示OmniAudio在客观指标和主观评估中均优于基线模型，空间定位精度和音画同步性显著提升，现已开源相关代码及数据资源。
原文链接：https://www.aibase.com/zh/news/18501

上市公司动态

Listed Company Updates

理想汽车 OTA7.4 更新：全新 MindGPT-4o-preview 模型上线，智能座舱焕然一新
理想汽车推出OTA7.4版本更新，搭载自研MindGPT-4o-preview模型，全面升级智能座舱体验。理想同学升级为3D毛绒形象，新增“小同桌”角色互动功能，支持情感化语音及支付宝小程序操作。新增家庭账号系统可记录用车习惯，面容识别自动调整车辆设置。影音方面推出前后双音区独立播放和低音增强技术，并针对儿童推出“小主人”模式及六一主题内容。此次更新涵盖交互、个性化服务及娱乐体验，实现智能化与人性化深度结合。
原文链接：https://www.aibase.com/zh/news/18479

其他

Other

Telegram与xAI达成3亿美元合作：Grok聊天机器人全面整合
Telegram与马斯克旗下xAI达成3亿美元现金加股权合作，将全面整合Grok聊天机器人至平台。该合作期限一年，Telegram用户可通过应用搜索栏使用Grok提问、总结文档、创建贴纸，企业还可用于客服审核。Grok此前已向高级用户开放，现计划扩展至全体用户。根据协议，Telegram将获得用户订阅xAI服务的50%分成，聊天机器人功能将固定在聊天界面顶部，实现深度交互整合。
原文链接：https://www.aibase.com/zh/news/18474
Netflix 联合创始人 Reed Hastings 正式加入 Anthropic 董事会
Netflix 联合创始人 Reed Hastings 加入人工智能公司 Anthropic 董事会，其丰富的科技与商业背景（曾任 Facebook、微软等公司董事）将为 Anthropic 提供战略支持。Hastings 表示看好 Anthropic 平衡人工智能发展与应对社会挑战的愿景，其加入或推动公司在技术创新与社会责任结合上的探索。此前 Anthropic 刚发布 Claude4 模型，Hastings 的卸任 Netflix 高管职位使其能更专注新角色，助力公司拓展技术应用与社会价值。
原文链接：https://www.aibase.com/zh/news/18502

⬇️更多AI资讯关注我们⬇️

【声明】内容源于网络

久新数智

重塑生产力，开启人机协作新篇章！

内容 0

粉丝 0

久新数智重塑生产力，开启人机协作新篇章！

总阅读0

粉丝0

内容0