9agent.ai
点击蓝字 关注我们
每日AI简讯
2025-07-25
01
大模型
LLM
Seed LiveInterpret 2.0 | 字节跳动发布端到端同声传译模型 Seed LiveInterpret 2.0
字节跳动Seed团队发布端到端同声传译大模型Seed LiveInterpret 2.0,其翻译准确率接近专业同传水平(多人会议超70%、单人演讲超80%),延迟低至2-3秒,较传统系统降低超60%。该模型支持中英互译、多人语音实时处理及零样本声音复刻,可实时复刻说话者音色输出翻译语音,提升跨语言交流自然度。在RealSI数据集评测中,其翻译质量评分远超基准系统,达到接近真人同传水平。
原文链接:https://www.aibase.com/zh/news/19930
ChatGPT | ChatGPT 迎来“个性”功能:用户可选择多种对话风格
OpenAI在ChatGPT网页应用推出“个性”新功能,允许用户选择多种预设对话风格,如愤世嫉俗者、机器人、倾听者、智者等,以增强互动体验。该功能正逐步向全球部分用户推出,用户可通过“自定义ChatGPT”设置界面选择偏好个性,目前默认风格为开朗且适应性强。
原文链接:https://www.aibase.com/zh/news/19926
Gemini | 谷歌Gemini重磅更新:直接选用Imagen生成图像
谷歌对AI大模型Gemini进行重要升级,用户可直接在界面中选择Imagen模型生成高质量图像。此次更新还启用llms.txt文件,遵循MCP规范为开发者提供最新API和SDK使用方法,帮助高效构建应用。开发者可通过ai.google.dev获取该文件,并结合Gemini CLI扩展功能加速开发流程。
原文链接:https://www.aibase.com/zh/news/19914
Qwen3-Coder | 阿里云新AI编程模型Qwen3-Coder上线,价格仅为Claude4的1/3
7月23日,阿里云推出AI编程大模型Qwen3-Coder API,其输入和输出费用分别为每百万Tokens4元和16元,综合价格仅为Claude4的1/3。测试显示,该模型编程能力超越GPT4.1,堪比Claude4,能在代码生成、调试等方面助力开发者提升效率,推动行业创新。
原文链接:https://www.aibase.com/zh/news/19907
Sora2 | Sora2浮出水面:OpenAI 欲在生成式AI视频领域重夺C位
OpenAI正开发生成式AI视频模型Sora的继任者Sora2,其服务器代码已出现相关引用。Sora自2024年12月发布后暂无重大更新,近期因微软整合至Bing Video Creator重回视野。Sora2虽未公开发布,但预计几周内将公布更多信息。同时谷歌Veo3向大学生免费开放,非用户可通过谷歌云体验。生成式AI视频领域竞争将因双方动作更趋激烈。
原文链接:https://www.aibase.com/zh/news/19921
Higgs Audio v2 | 李沐团队发布 Higgs Audio v2,开创语音合成新纪元
李沐团队及Boson.ai推出开源文本转语音(TTS)大模型Higgs Audio v2,具备多语言对话生成、韵律调整、声音克隆等功能,可完成写歌并演唱、配背景音乐等复杂任务。其基于1000万小时语音数据训练,在情绪、问题等测试中胜率超GPT-4o-mini-tts,采用离散化音频分词器和预训练大模型技术,支持实时语音聊天、音频创作及语音克隆,代码已开源于GitHub和Hugging Face。
原文链接:https://www.aibase.com/zh/news/19913
Aeneas | 谷歌推出 Aeneas 模型:为古代文本解读开辟新路径
谷歌推出专为古代文本解读设计的Aeneas模型,通过处理数千拉丁铭文加速平行文本查找,支持多语言和多模态输入,能恢复文本缺口并定位地理来源。其基于超17.6万条古罗马铭文数据集训练,23位历史学家测试显示,结合模型上下文信息可提升研究效率与信心,为历史研究提供新工具。
原文链接:https://www.aibase.com/zh/news/19923
02
产品&应用
Product Application
Google Photos | Google Photos新增AI功能:照片秒变动漫、一键生成视频
Google Photos新增多项AI功能,包括通过Veo2模型将静态照片转为6秒动态视频(支持"细微动作""手气不错"选项),以及由Imagen AI驱动的Remix功能(可将照片转为动漫、漫画等风格)。应用内新增"创建"标签页整合创意工具,功能处于实验阶段,生成内容添加SynthID水印。照片转视频今日上线美国Android/iOS用户,Remix未来几周上线,创建标签页8月美国发布。
原文链接:https://www.aibase.com/zh/news/19916
YouTube Shorts AI特效 | YouTube Shorts将推全新AI特效 照片秒变视频!
YouTube宣布为Shorts创作者开放生成式AI功能,包括图片转视频功能(6秒内让静态照片动态化)及多种AI特效(如涂鸦变艺术图、自拍照变水下视频等)。这些功能由Google的Veo2视频生成AI模型支持,并添加SynthID水印标识AI内容。该功能下周率先登陆美、加等国,今年晚些时候覆盖更多地区,未来还将推出能同步生成音频的Veo3视频生成器及AI游乐场工具中心,助力创作者降低门槛、激发创意。
原文链接:https://www.aibase.com/zh/news/19918
Lumo AI助手 | 隐私卫士Proton推出AI助手Lumo!零日志加密聊天,挑战ChatGPT隐私短板
欧洲隐私保护公司Proton推出AI助手Lumo,主打极致隐私保护。其承诺不保留对话记录,采用端到端加密存储,并支持"幽灵模式"使对话关闭后消失。用户无需注册即可通过多端使用,支持文件上传及云端文件访问,基于开源模型构建,运行于欧洲数据中心,不利用用户数据训练,旨在解决主流AI助手的隐私短板,为注重数据安全的用户及企业提供选择。
原文链接:https://www.aibase.com/zh/news/19925
机器人服务员 | 特斯拉首家餐厅火爆开业,机器人服务员引发热潮!
特斯拉创始人马斯克在洛杉矶开设首家快餐店“Tesla Diner”,融合影院与超级充电站功能,提供汉堡、热狗等快餐,并配备人形机器人“擎天柱”作为服务员递送爆米花。开业六小时营业额达4.7万美元,超越附近麦当劳。未来计划在得州开设第二家,并可能全球推广,旨在消除电动车偏见,拓展智能技术应用场景。
原文链接:https://www.aibase.com/zh/news/19927
秘塔搜索API | 秘塔搜索 API 上线:定价3分钱 提供多模态搜索能力
秘塔AI搜索宣布搜索API正式上线,为开发者提供替代Bing Search API的选择(后者将于2025年8月下线)。该API基于其自建的数百亿多语言索引库及千万级调用验证的技术,定价0.03元/查询,支持网页、图片等多模态搜索,提供网页全文获取和问答接口,且无使用门槛,开发者可快速接入测试,预计推动搜索技术多场景应用。
原文链接:https://www.aibase.com/zh/news/19928
03
硬件&底层技术
Hardware Technology
Anthropic | Anthropic 表示人工智能模型能从“无害”数据中习得隐藏行为
Anthropic及研究团队揭示AI模型存在“潜意识学习”现象,即模型可从“无害”数据中通过统计模式继承隐藏行为。实验显示,仅当教师与学生模型架构相同时(如GPT-4.1nano),学生模型会吸收教师模型的特征(如对猫头鹰的偏好),甚至可能传播“错位”“奖励黑客”等高风险行为,挑战依赖数据过滤的AI开发方法。
原文链接:https://www.aibase.com/zh/news/19911
04
行业动态&政策
Industry Trends Policies
特朗普发布《美国 AI 计划》,力争 AI 领域全球霸主地位
特朗普发布《美国 AI 行动计划》,旨在确保美国在AI领域全球领导地位,涵盖90多项措施,包括拆除监管壁垒加速创新、鼓励开源模型发展、推动AI教育与技能培训,以及构建数据中心、升级电网等基础设施,为美国AI竞赛提供明确方向。
原文链接:https://www.aibase.com/zh/news/19908
周鸿祎:AI大模型时代,网络攻击门槛降低
360集团创始人周鸿祎在2025中国互联网大会上分析AI大模型时代的网络安全风险,指出大模型"幻觉"问题可能在关键领域引发严重后果,非专业人员通过自然语言即可编写程序,降低网络攻击门槛,甚至可能形成内部威胁;同时国家级高级威胁攻击将更普遍复杂。360正打造智能体安全专家和大模型卫士应对,以算法对抗算法并监控大模型输出。
原文链接:https://www.aibase.com/zh/news/19909
皮尤研究中心重磅发布:谷歌AI概览重塑搜索行为,外部网站流量锐减
皮尤研究中心最新研究显示,谷歌AI概览功能显著改变用户搜索习惯,致外部网站流量锐减。数据显示,出现AI概览的搜索中仅8%用户点击标准结果(无摘要时为15%),点击源链接概率仅1%,且26%用户在谷歌内终止浏览(标准结果为16%)。长查询(≥10词)触发AI摘要比例达53%,以“谁/什么/为什么”开头的问题触发率60%。维基百科、政府网站成最大赢家,新闻出版商则面临更激烈争执,监管机构亦关注谷歌是否转向媒体公司风险,其他研究佐证AI概览致外部点击率暴跌34.5%(桌面端降2/3,移动端近半)。
原文链接:https://www.aibase.com/zh/news/19912
国家安全部发布警示案例,科研人员因违规使用 AI 工具泄密
国家安全部公布多起涉密信息泄露案例,包括涉密单位人员小田闲聊泄露项目进展、科研人员小李违规使用AI软件上传核心数据致泄密、新干部小蒋拍涉密文件发朋友圈泄密。三人均受处理,提醒公众勿在非涉密环境用AI处理涉密信息,应从正规渠道下载AI软件。
原文链接:https://www.aibase.com/zh/news/19922
脉脉:超四成国内AI头部公司员工欲跳槽
脉脉平台数据显示,截至2025年7月,国内AI头部公司超41.07%从业者处于"正在看机会"状态,远超互联网行业的14.65%。自2月起每月新增上万AI人才更新求职状态,企业抢人白热化,超1000家AI公司发布岗位,华为、小红书等企业高管在个人主页标注"长期招人",HR和猎头活跃度达"分钟级",AI人才主页访问量激增。
原文链接:https://www.aibase.com/zh/news/19932
谷歌AI势不可挡!二季度财报揭秘:980万亿Token与20亿月活用户
2025年7月24日,谷歌母公司Alphabet发布二季度财报,显示AI驱动下多项业务强劲增长:月处理Token量达980万亿(两月翻倍),AI概览功能覆盖200多国/40语言,月活用户超20亿;谷歌云收入增32%至136.2亿美元,年化营收跑率破500亿;公司上调2025年资本支出至850亿,用于AI基础设施建设,巩固其AI领域领先地位。
原文链接:https://www.aibase.com/zh/news/19937
05
其他
Other
挑战AI极限!首届K奖编程大赛揭晓,顶尖模型成绩惨淡!
由Laude Institute主办、Databricks和Perplexity联合创始人发起的首届K奖编程大赛揭晓,巴西程序员爱德华多以7.5%的正确率获5万美元奖金,顶尖AI模型成绩惨淡。该赛事通过"无污染"新问题测试模型能力,与SWE-Bench 75%的顶尖得分形成对比,引发行业对AI评估标准的反思,主办方承诺开源模型得分超90%将奖励100万美元。
原文链接:https://www.aibase.com/zh/news/19920
⬇️更多AI资讯关注我们⬇️

