9agent.ai
点击蓝字 关注我们
每日AI简讯
2025.06.21
01
大模型
LLM
人人皆可创作音乐!腾讯AI Lab开源音乐生成大模型SongGeneration
腾讯AI Lab推出开源音乐生成大模型SongGeneration,解决音乐生成中的音质、音乐性与生成速度难题。该模型基于LLM-DiT融合架构,支持文本控制生成、多轨合成、风格迁移及音色克隆功能,生成48kHz高音质音乐。评测显示其旋律、伴奏、音质等维度优于多数开源模型,并与商业模型Suno v4.5相当。模型参数仅3B,支持中英文多曲风,提供开源代码与体验地址,助力音乐创作、游戏音效等场景,推动“人人皆可创作”愿景。
原文链接:https://www.jiqizhixin.com/articles/2025-06-20
Andrej Karpathy最新演讲爆火!人类已进入「说话就能编程」的软件3.0时代
OpenAI早期成员Andrej Karpathy在YC AI Startup School演讲中提出,人类已迈入以自然语言为编程接口的“软件3.0”时代。他划分软件发展三阶段:传统代码的1.0、神经网络权重的2.0和由LLM驱动的3.0,强调LLM作为新型操作系统,通过自然语言指令实现编程。他指出LLM具有百科全书式知识但伴随幻觉缺陷,需通过人机协作循环构建“部分自主性”产品,如增强型工具而非完全自主的智能体。未来需重构数字基础设施,使文档和网站对AI友好,并呼吁为新型计算机打造生态。
原文链接:https://www.jiqizhixin.com/articles/2025-06-20-2
天工不止造物,也能修bug:Skywork-SWE给代码智能体补上软件工程课
昆仑万维发布32B参数量的开源代码智能体基座模型Skywork-SWE,该模型通过构建业内最大的可验证软件工程数据集,从15万GitHub项目中筛选出10,169个真实代码问题,支持多轮交互推理与代码修复闭环。在SWE-bench基准测试中以47%正确率刷新纪录,验证了数据扩展定律的有效性。模型能完成复杂任务如定位漏洞、生成补丁并通过单元测试,为软件工程智能体提供了接近真实开发场景的训练范式和性能突破。
原文链接:https://www.jiqizhixin.com/articles/2025-06-20-3
跨越1.6亿年进化分歧,DNA语言模型以单核苷酸分辨率对植物基因组跨物种建模
康奈尔大学研发出PlantCaduceus DNA语言模型,基于16种被子植物基因组预训练,支持单核苷酸分辨率建模。该模型在拟南芥微调后,成功预测进化差异达1.6亿年的玉米基因组,剪接供体预测精度较现有模型提高1.45倍,翻译起始位点预测提升7.23倍。其通过捕捉跨物种保守序列模式,实现基因组注释和适应性分析精准预测,未来计划扩展至更多植物类型及长距离DNA交互研究,助力作物改良和基础基因组学突破。
原文链接:https://www.jiqizhixin.com/articles/2025-06-20-4
华讯方舟装备取得基于大模型的自适应远程通讯控制系统及方法专利
深圳市华讯方舟装备技术有限公司于2024年10月申请的“基于大模型的自适应远程通讯控制系统及方法”专利获授权,标志着其在AI+通信领域的核心技术突破,优化远程通信系统的自适应能力。
原文链接:http://m.toutiao.com/group/7517874640338043419/
02
产品应用
Product Application
准确率70.14%,多模态数据Transformer模型预测药物相互作用,使多药同服更安全
西安交通大学与天津科技大学联合研发SCAT模型,通过整合医学文献、药物说明书文本及分子结构图等多模态数据,结合BiGRU和交叉注意力机制实现药物相互作用精准预测。该模型在DDIExtraction-2013数据集测试中准确率达70.14%,超越现有主流方法,能有效识别多药联用时潜在风险,尤其适用于需同时服用多种药物的老年群体,为降低药物不良反应发生率提供AI解决方案。
原文链接:https://www.jiqizhixin.com/articles/2025-06-20-5
通义APP全面升级翻译能力,打造最强翻译综合体
通义APP升级翻译功能,整合文字、同传、文档、图片四大翻译场景,支持119种语言和方言互译。通过通义千问多语种训练,显著提升专业术语处理与语义一致性能力。新增免费不限次数的同传翻译功能,支持10种常用语种分屏对照。文档翻译保持原排版格式并自动生成总结脑图,图片翻译突破传统OCR实现"所见即所得"的整图译制,在菜单、海报等场景表现突出,为跨境办公、学术研究及旅游提供全场景解决方案。
原文链接:https://www.aibase.com/zh/news/19102
OpenAI 推出 ChatGPT Record:实时录音、转录与摘要的新功能
OpenAI在macOS应用中推出ChatGPT Record功能,支持Pro/Team等用户实现120分钟实时录音、同步转录及自动摘要生成。该功能专为会议记录、访谈等场景优化,英语识别准确率最高,录音文件转录后自动删除且不用于模型训练。企业用户可通过Compliance API接入,确保数据合规性。上线后用户反馈积极,显著提升信息处理效率,尤其适合高频次工作场景需求。
原文链接:https://www.aibase.com/zh/news/19103
Midjourney视频革命来袭!AI视频升频器与Niji视频模型开发中,解锁创意新境界!
Midjourney宣布研发视频升频器和Niji动漫视频模型两大AI工具。视频升频器可将低分辨率视频提升至4K画质,优化细节并解决像素化问题,适用于影视后期和短视频制作;Niji视频模型专注生成高品质动漫动态内容,支持风格化参数设置,助力动漫短片及游戏动画创作。两项技术均基于AI算法与GPU加速,整合了从文本到视频的全链路生态,预计将降低影视、广告及游戏行业制作成本,其订阅模式较同类竞品更具性价比,计划未来数月内开放测试。
原文链接:https://www.aibase.com/zh/news/19104
腾讯云推出全链路AI开发平台“AI Builder”,自然语言驱动零代码开发
腾讯云发布国内首款全链路AI应用开发平台“AI Builder”,通过自然语言交互实现零代码开发。用户仅需输入文字需求(如“创建鲜花管理应用”),平台即可自动完成界面设计、数据库配置及云端部署全流程,非技术人员也能快速生成小程序或网页应用。该平台支持实时自然语言调整样式逻辑,提供低代码编辑器与专业代码导出功能,并实现一键发布上线。其自动配置云函数、接口等后端资源的特性,大幅降低了开发门槛,助力全民参与数字化创新。
原文链接:https://www.aibase.com/zh/news/19113
04
上市公司动态
Listed Company Updates
小扎出手挖人!Meta 新目标锁定Ilya公司CEO
Meta CEO扎克伯格试图收购Ilya Sutskever创办的安全超智能公司未果后,成功挖角其CEO丹尼尔・格罗斯加入。格罗斯曾任职苹果机器学习总监和YC AI负责人,2023年获评《时代》AI领域影响力人物。Meta同时向前GitHub CEO纳特・弗里德曼发出邀约,并计划投资其管理的NFDG基金,该基金已布局多家AI初创企业。Meta组建约50人的超级智能团队,高薪吸纳谷歌、OpenAI等顶尖人才,此举既为应对Llama4模型争议,也显露出其抢占AGI领域制高点的战略布局,同时引发对SSI公司320亿美元估值泡沫的质疑。
原文链接:https://www.aibase.com/zh/news/19123
05
其他
Other
研究揭示过度依赖AI或损害批判性思维与记忆力
麻省理工学院研究发现,过度使用ChatGPT等AI工具会导致“认知负债”,表现为大脑连接性减弱、记忆编码能力下降及内容所有权感知降低。实验显示,纯脑力组在记忆力、语义准确性上表现最优,而AI依赖组即便脱离工具后,注意力和创造力相关神经活动仍明显不足。研究者警告长期依赖AI可能削弱批判性思维和深度学习能力,建议教育领域结合无工具学习阶段以平衡效率与认知发展。
原文链接:https://www.aibase.com/zh/news/19118
Mozilla 宣布停运 AI 内容检测工具 "Deep Fake Detector"
Mozilla将于6月26日终止其AI生成内容检测工具"Deep Fake Detector"及AI助手扩展Orbit。该开源工具利用ApolloDFT等模型帮助用户区分AI与人类创作内容,但运营期间仅积累约3300名活跃用户,未达商业预期。科技媒体分析此举或暗示Mozilla默认接受AI内容,可能影响Firefox浏览器内容质量及用户体验。官方虽未明确解释停运原因,但当前网络AI内容激增背景下,用户对真实性鉴别工具的需求愈发迫切,此次停运加剧了市场相关工具的缺口。
原文链接:https://www.aibase.com/zh/news/19120
“系统变革・智启未来”2025传媒年会召开 共探AI时代主流媒体破局与革新之路
会议聚焦AI时代媒体转型,探讨技术应用、国际传播等议题,推动行业系统性变革。
原文链接:http://m.toutiao.com/group/7515466640281190923/
⬇️更多AI资讯关注我们⬇️

