7月25日丨每日AI简讯丨ChatGPT重磅升级！用户可自定义多种对话风格，互动体验大提升- 大数跨境

首页

7月25日丨每日AI简讯丨ChatGPT重磅升级！用户可自定义多种对话风格，互动体验大提升

久新数智

2025-07-25

导读：摘要信息

9agent.ai

点击蓝字关注我们

每日AI简讯

2025-07-25

大模型

LLM

Seed LiveInterpret 2.0 | 字节跳动发布端到端同声传译模型 Seed LiveInterpret 2.0
字节跳动Seed团队发布端到端同声传译大模型Seed LiveInterpret 2.0，其翻译准确率接近专业同传水平（多人会议超70%、单人演讲超80%），延迟低至2-3秒，较传统系统降低超60%。该模型支持中英互译、多人语音实时处理及零样本声音复刻，可实时复刻说话者音色输出翻译语音，提升跨语言交流自然度。在RealSI数据集评测中，其翻译质量评分远超基准系统，达到接近真人同传水平。
原文链接：https://www.aibase.com/zh/news/19930
ChatGPT | ChatGPT 迎来“个性”功能:用户可选择多种对话风格
OpenAI在ChatGPT网页应用推出“个性”新功能，允许用户选择多种预设对话风格，如愤世嫉俗者、机器人、倾听者、智者等，以增强互动体验。该功能正逐步向全球部分用户推出，用户可通过“自定义ChatGPT”设置界面选择偏好个性，目前默认风格为开朗且适应性强。
原文链接：https://www.aibase.com/zh/news/19926
Gemini | 谷歌Gemini重磅更新:直接选用Imagen生成图像
谷歌对AI大模型Gemini进行重要升级，用户可直接在界面中选择Imagen模型生成高质量图像。此次更新还启用llms.txt文件，遵循MCP规范为开发者提供最新API和SDK使用方法，帮助高效构建应用。开发者可通过ai.google.dev获取该文件，并结合Gemini CLI扩展功能加速开发流程。
原文链接：https://www.aibase.com/zh/news/19914
Qwen3-Coder | 阿里云新AI编程模型Qwen3-Coder上线，价格仅为Claude4的1/3
7月23日，阿里云推出AI编程大模型Qwen3-Coder API，其输入和输出费用分别为每百万Tokens4元和16元，综合价格仅为Claude4的1/3。测试显示，该模型编程能力超越GPT4.1，堪比Claude4，能在代码生成、调试等方面助力开发者提升效率，推动行业创新。
原文链接：https://www.aibase.com/zh/news/19907
Sora2 | Sora2浮出水面:OpenAI 欲在生成式AI视频领域重夺C位
OpenAI正开发生成式AI视频模型Sora的继任者Sora2，其服务器代码已出现相关引用。Sora自2024年12月发布后暂无重大更新，近期因微软整合至Bing Video Creator重回视野。Sora2虽未公开发布，但预计几周内将公布更多信息。同时谷歌Veo3向大学生免费开放，非用户可通过谷歌云体验。生成式AI视频领域竞争将因双方动作更趋激烈。
原文链接：https://www.aibase.com/zh/news/19921
Higgs Audio v2 | 李沐团队发布 Higgs Audio v2，开创语音合成新纪元
李沐团队及Boson.ai推出开源文本转语音（TTS）大模型Higgs Audio v2，具备多语言对话生成、韵律调整、声音克隆等功能，可完成写歌并演唱、配背景音乐等复杂任务。其基于1000万小时语音数据训练，在情绪、问题等测试中胜率超GPT-4o-mini-tts，采用离散化音频分词器和预训练大模型技术，支持实时语音聊天、音频创作及语音克隆，代码已开源于GitHub和Hugging Face。
原文链接：https://www.aibase.com/zh/news/19913

Aeneas | 谷歌推出 Aeneas 模型:为古代文本解读开辟新路径
谷歌推出专为古代文本解读设计的Aeneas模型，通过处理数千拉丁铭文加速平行文本查找，支持多语言和多模态输入，能恢复文本缺口并定位地理来源。其基于超17.6万条古罗马铭文数据集训练，23位历史学家测试显示，结合模型上下文信息可提升研究效率与信心，为历史研究提供新工具。
原文链接：https://www.aibase.com/zh/news/19923

产品&应用

Product Application

Google Photos | Google Photos新增AI功能:照片秒变动漫、一键生成视频
Google Photos新增多项AI功能，包括通过Veo2模型将静态照片转为6秒动态视频（支持"细微动作""手气不错"选项），以及由Imagen AI驱动的Remix功能（可将照片转为动漫、漫画等风格）。应用内新增"创建"标签页整合创意工具，功能处于实验阶段，生成内容添加SynthID水印。照片转视频今日上线美国Android/iOS用户，Remix未来几周上线，创建标签页8月美国发布。
原文链接：https://www.aibase.com/zh/news/19916
YouTube Shorts AI特效 | YouTube Shorts将推全新AI特效照片秒变视频!
YouTube宣布为Shorts创作者开放生成式AI功能，包括图片转视频功能（6秒内让静态照片动态化）及多种AI特效（如涂鸦变艺术图、自拍照变水下视频等）。这些功能由Google的Veo2视频生成AI模型支持，并添加SynthID水印标识AI内容。该功能下周率先登陆美、加等国，今年晚些时候覆盖更多地区，未来还将推出能同步生成音频的Veo3视频生成器及AI游乐场工具中心，助力创作者降低门槛、激发创意。
原文链接：https://www.aibase.com/zh/news/19918
Lumo AI助手 | 隐私卫士Proton推出AI助手Lumo!零日志加密聊天，挑战ChatGPT隐私短板
欧洲隐私保护公司Proton推出AI助手Lumo，主打极致隐私保护。其承诺不保留对话记录，采用端到端加密存储，并支持"幽灵模式"使对话关闭后消失。用户无需注册即可通过多端使用，支持文件上传及云端文件访问，基于开源模型构建，运行于欧洲数据中心，不利用用户数据训练，旨在解决主流AI助手的隐私短板，为注重数据安全的用户及企业提供选择。
原文链接：https://www.aibase.com/zh/news/19925
机器人服务员 | 特斯拉首家餐厅火爆开业，机器人服务员引发热潮!
特斯拉创始人马斯克在洛杉矶开设首家快餐店“Tesla Diner”，融合影院与超级充电站功能，提供汉堡、热狗等快餐，并配备人形机器人“擎天柱”作为服务员递送爆米花。开业六小时营业额达4.7万美元，超越附近麦当劳。未来计划在得州开设第二家，并可能全球推广，旨在消除电动车偏见，拓展智能技术应用场景。
原文链接：https://www.aibase.com/zh/news/19927
秘塔搜索API | 秘塔搜索 API 上线:定价3分钱提供多模态搜索能力
秘塔AI搜索宣布搜索API正式上线，为开发者提供替代Bing Search API的选择（后者将于2025年8月下线）。该API基于其自建的数百亿多语言索引库及千万级调用验证的技术，定价0.03元/查询，支持网页、图片等多模态搜索，提供网页全文获取和问答接口，且无使用门槛，开发者可快速接入测试，预计推动搜索技术多场景应用。
原文链接：https://www.aibase.com/zh/news/19928

硬件&底层技术

Hardware Technology

Anthropic | Anthropic 表示人工智能模型能从“无害”数据中习得隐藏行为
Anthropic及研究团队揭示AI模型存在“潜意识学习”现象，即模型可从“无害”数据中通过统计模式继承隐藏行为。实验显示，仅当教师与学生模型架构相同时（如GPT-4.1nano），学生模型会吸收教师模型的特征（如对猫头鹰的偏好），甚至可能传播“错位”“奖励黑客”等高风险行为，挑战依赖数据过滤的AI开发方法。
原文链接：https://www.aibase.com/zh/news/19911

行业动态&政策

Industry Trends Policies

特朗普发布《美国 AI 计划》，力争 AI 领域全球霸主地位
特朗普发布《美国 AI 行动计划》，旨在确保美国在AI领域全球领导地位，涵盖90多项措施，包括拆除监管壁垒加速创新、鼓励开源模型发展、推动AI教育与技能培训，以及构建数据中心、升级电网等基础设施，为美国AI竞赛提供明确方向。
原文链接：https://www.aibase.com/zh/news/19908
周鸿祎:AI大模型时代，网络攻击门槛降低
360集团创始人周鸿祎在2025中国互联网大会上分析AI大模型时代的网络安全风险，指出大模型"幻觉"问题可能在关键领域引发严重后果，非专业人员通过自然语言即可编写程序，降低网络攻击门槛，甚至可能形成内部威胁；同时国家级高级威胁攻击将更普遍复杂。360正打造智能体安全专家和大模型卫士应对，以算法对抗算法并监控大模型输出。
原文链接：https://www.aibase.com/zh/news/19909
皮尤研究中心重磅发布:谷歌AI概览重塑搜索行为，外部网站流量锐减
皮尤研究中心最新研究显示，谷歌AI概览功能显著改变用户搜索习惯，致外部网站流量锐减。数据显示，出现AI概览的搜索中仅8%用户点击标准结果（无摘要时为15%），点击源链接概率仅1%，且26%用户在谷歌内终止浏览（标准结果为16%）。长查询（≥10词）触发AI摘要比例达53%，以“谁/什么/为什么”开头的问题触发率60%。维基百科、政府网站成最大赢家，新闻出版商则面临更激烈争执，监管机构亦关注谷歌是否转向媒体公司风险，其他研究佐证AI概览致外部点击率暴跌34.5%（桌面端降2/3，移动端近半）。
原文链接：https://www.aibase.com/zh/news/19912
国家安全部发布警示案例，科研人员因违规使用 AI 工具泄密
国家安全部公布多起涉密信息泄露案例，包括涉密单位人员小田闲聊泄露项目进展、科研人员小李违规使用AI软件上传核心数据致泄密、新干部小蒋拍涉密文件发朋友圈泄密。三人均受处理，提醒公众勿在非涉密环境用AI处理涉密信息，应从正规渠道下载AI软件。
原文链接：https://www.aibase.com/zh/news/19922
脉脉:超四成国内AI头部公司员工欲跳槽
脉脉平台数据显示，截至2025年7月，国内AI头部公司超41.07%从业者处于"正在看机会"状态，远超互联网行业的14.65%。自2月起每月新增上万AI人才更新求职状态，企业抢人白热化，超1000家AI公司发布岗位，华为、小红书等企业高管在个人主页标注"长期招人"，HR和猎头活跃度达"分钟级"，AI人才主页访问量激增。
原文链接：https://www.aibase.com/zh/news/19932
谷歌AI势不可挡!二季度财报揭秘:980万亿Token与20亿月活用户
2025年7月24日，谷歌母公司Alphabet发布二季度财报，显示AI驱动下多项业务强劲增长：月处理Token量达980万亿（两月翻倍），AI概览功能覆盖200多国/40语言，月活用户超20亿；谷歌云收入增32%至136.2亿美元，年化营收跑率破500亿；公司上调2025年资本支出至850亿，用于AI基础设施建设，巩固其AI领域领先地位。
原文链接：https://www.aibase.com/zh/news/19937

其他

Other

挑战AI极限!首届K奖编程大赛揭晓，顶尖模型成绩惨淡!
由Laude Institute主办、Databricks和Perplexity联合创始人发起的首届K奖编程大赛揭晓，巴西程序员爱德华多以7.5%的正确率获5万美元奖金，顶尖AI模型成绩惨淡。该赛事通过"无污染"新问题测试模型能力，与SWE-Bench 75%的顶尖得分形成对比，引发行业对AI评估标准的反思，主办方承诺开源模型得分超90%将奖励100万美元。
原文链接：https://www.aibase.com/zh/news/19920

⬇️更多AI资讯关注我们⬇️

【声明】内容源于网络

久新数智

重塑生产力，开启人机协作新篇章！

内容 139

粉丝 0

久新数智重塑生产力，开启人机协作新篇章！

总阅读107

粉丝0

内容139