大数跨境

每日AI动态速览20250905

每日AI动态速览20250905 跨境电商创业日记
2025-09-05
195
导读:大家好,这是一份关于 AI 大模型领域的每日新闻简报,内容聚焦最新的行业动态与发展趋势,帮助读者快速了解全球范围内的最新新闻。

大家好,


这是一份关于 AI 大模型领域的每日新闻简报,内容聚焦最新的行业动态与发展趋势,帮助读者快速了解全球范围内的重要信息。


本期内容共分为四部分:


一、玩家动态追踪

二、技术前沿分析

三、AI ToC 应用

四、AI ToB 应用


欢迎关注,如有反馈或建议,也欢迎在留言区讨论。


以下为正文内容:


一、玩家动态追踪

1 OpenAI

ChatGPT 新功能,又干掉一批创业项目

https://mp.weixin.qq.com/s/73lR1B4hPplk3G_rKyuuow

 OpenAI 宣布为 ChatGPT 上线分支对话(Conversation Branching)功能,用户只需点击按钮即可在原对话基础上“岔开话题”继续聊天,避免原始对话混乱。此前已有 T3.chat 等创业公司依靠类似功能吸引用户,如今该功能被 ChatGPT 原生支持,直接冲击相关初创项目

 分支对话开启后,系统会在底部标记“从某话题建立的分支”,用户可在新话题下继续提问,甚至可让模型回顾不同话题并选择合并核心内容,从而更方便地管理多主题对话

 这一功能有助于团队协作和多线任务处理,但部分用户仍建议界面需要优化,比如在视觉层面更清晰地区分分支结构。目前分支对话已面向所有用户开放使用


打造「专属对话空间」:OpenAI 向免费用户开放 ChatGPT Projects

https://www.ithome.com/0/880/421.htm

 OpenAI 宣布向免费用户开放 ChatGPT Projects 服务,该功能整合了 Canvas 与 ChatGPT Search,支持用户将对话整理到主题文件夹中,创建带命名和图标的项目,方便管理与检索。用户还可在对话中添加文件、设定自定义指令,并限制记忆仅在项目内生效,避免跨领域干扰

 文件上传限制按订阅等级区分,免费用户可上传 5 个文件,Plus 用户 25 个,Pro 用户 50 个,所有用户均可自定义颜色与图标以便快速识别。目前该功能已在网页版与 Android 端开放,iOS 版将在数日后上线

 这一功能提升了多主题对话的组织与效率,帮助用户高效管理信息与项目,减少杂乱对话带来的不便,进一步增强 ChatGPT 的实用性与易用性


OpenAI 宣布推出 AI 在线招聘平台,和微软的领英打起来了

https://www.qbitai.com/2025/09/328662.html

 OpenAI 宣布将于 2026 年推出 AI 驱动的在线招聘平台 OpenAI Jobs Platform,利用 AI 技术实现企业需求与员工能力的精准匹配,特别为小型企业与地方政府提供接触 AI 人才的渠道。这一举措将与微软旗下领英形成直接竞争,潜在引发商业冲突

 为帮助更多人掌握 AI 技能,OpenAI 已上线免费学习平台 OpenAI Academy,服务超 200 万人,并计划扩展至不同水平的认证课程,涵盖基础到高级应用。预计到 2030 年,将与沃尔玛等合作伙伴为 1000 万美国人提供 AI 技能认证,提升未来就业竞争力

 OpenAI Jobs Platform 还设立板块支持本地企业和政府,提升其吸引与利用人才的能力。通过与沃尔玛、波士顿咨询、埃森哲等合作,以及德州商业协会的参与,OpenAI 旨在推动 AI 人才与企业的最佳匹配,促进区域发展与现代化


消息称 OpenAI 将与博通合作量产其自研 AI 芯片

https://www.ithome.com/0/880/564.htm

 OpenAI 正与博通展开合作,计划量产自研 AI 芯片,以降低对英伟达的依赖并增强议价能力。此前已与博通、台积电合作开发首款芯片,并在基础设施中引入 AMD 芯片,以应对算力需求激增。目前英伟达在 AI 芯片市场占据约 80% 份额,其 GPU 被广泛使用

 OpenAI 芯片团队由前谷歌工程师 Richard Ho 领导,规模已扩至 40 人,但仍小于谷歌、亚马逊等公司。自研芯片面临高成本与技术挑战,大型设计项目单次成本可达 5 亿美元,若含软件和配套设备成本可能翻倍,难度极高

 首款芯片定位于 AI 模型训练,未来计划开发更强处理器。自研芯片不仅有助于降低对英伟达依赖,也可能成为新收入来源,但研发与量产难度大。此举显示 OpenAI 在 AI 硬件上的雄心与对未来发展的重视


谷歌

谷歌发布开源文本嵌入模型 EmbeddingGemma

https://www.oschina.net/news/370455/google-embedding-gemma

 谷歌发布基于 Gemma 3 架构的开源文本嵌入模型 EmbeddingGemma,参数量为 308M,支持 100+ 种语言,量化后可在 200 MB 内存运行,并在 MTEB 榜单中位列 500M 以下参数模型第一

 EmbeddingGemma 提供 768/512/256/128 维 Matryoshka 输出,支持 2K token 上下文长度,适配不同任务需求,具备高效轻量的特点

 该模型已集成至 sentence-transformers、llama.cpp、MLX、Ollama、LiteRT、LangChain 等主流框架,官方在 Hugging Face、Kaggle 和 Vertex AI 提供权重及微调教程,并附带 Gemma Cookbook RAG 示例


AI「P 图」爆火出圈:「Nano Banana」一周为谷歌 Gemini 吸引千万新用户

https://www.ithome.com/0/880/541.htm

 谷歌实验项目“Nano Banana”因避免 AI 图像生成常见的恐怖谷效应而爆火,随后谷歌在 Gemini 上线 Gemini 2.5 Flash Image 集成。副总裁 Josh Woodward 表示,该功能上线后累计完成超 2 亿次图像编辑,吸引 1000 万新用户使用 Gemini 应用

 Nano Banana 最大优势在于多次编辑后仍能保持人物特征一致性,避免面部变形或相似度下降。用户可多次修改房间颜色、为宠物添加服饰或替换造型,图像依旧清晰准确,因此在正式发布前已登上 LMArena 榜单,发布后迅速走红

 目前 Gemini 免费用户每日可进行 100 次编辑,付费用户可扩展至 1000 次。分析师认为谷歌通过高质量工具吸引用户进入 Gemini 生态,Gemini 2.5 Flash Image 已展现实际应用价值,区别于大多数仍停留在演示阶段的同类产品


xAI

消息称马斯克旗下 xAI 公司 CFO Mike Liberatore 离职,仅上任数月

https://www.ithome.com/0/880/494.htm

 据华尔街日报报道,马斯克旗下的 AI 公司 xAI 的首席财务官 Mike Liberatore 已于 7 月底离职。Liberatore 自 4 月起担任该职位,其离职原因尚不明确。他曾是爱彼迎的高管,并在 xAI 进行的 50 亿美元债务融资和战略股权投资中发挥了重要作用。这些资金将用于支持 xAI 开发 AI 解决方案、数据中心及其旗舰平台 Grok

 xAI 由马斯克于 2023 年创立,旨在挑战科技巨头在 AI 领域的发展。Liberatore 的离职紧随 xAI 联合创始人 Igor Babuschkin 之后,后者于 8 月离开公司,并创办了一家专注于 AI 安全研究的投资公司。这一系列的高层变动引发了外界对 xAI 未来发展方向的关注

 此外,摩根士丹利表示,xAI 所获得的融资将有助于公司在 AI 技术和基础设施方面的进一步拓展。虽然目前 xAI 面临管理层变动的挑战,但公司仍然专注于其核心业务的发展和创新


DeepSeek

消息称 DeepSeek 正开发更先进模型:具备 AI 智能体能力,剑指年底发布

https://www.ithome.com/0/880/428.htm

 彭博社报道,DeepSeek 正在开发新一代具备更强 AI 体功能的模型,能在用户提供最少指令下完成多步操作,并通过学习不断改进,计划于今年最后一季度发布。创始人梁文峰正推动团队加速布局,以在新技术前沿与 OpenAI 等对手竞争

 今年 1 月,DeepSeek 推出的 R1 模型因模拟人类推理能力引起全球关注,开发成本仅数百万美元,但此后仅有小幅升级。与此同时,OpenAI、Anthropic、微软等纷纷推出新 AI 体软件,中国的 Manus AI 也凭通用 AI 体受到国际瞩目

 新一代 AI 体区别于传统聊天机器人,不仅能回应对话,还可执行更复杂任务,如旅行规划、代码编写与调试。尽管目标是打造几乎无需人工干预的自主系统,但目前 AI 体仍需一定程度人类监督


Kimi

月之暗面 Kimi K2 宣布更新:上下文长度扩展至 256K,带来更快的 API

https://www.ithome.com/0/880/609.htm

 月之暗面宣布推出 Kimi K2 最新版本(0905),在真实编程任务和 Agentic Coding 能力上显著提升,前端编程体验更佳,代码美观度与实用性增强。上下文长度由 128K 升级至 256K,并提供输出速度 60-100 Token/s 的高速版 API

 在 SWE-bench Verified 等真实软件工程基准测试中,Kimi K2 表现出色。新版模型 API 已在 Kimi 开放平台上线,支持 256K 上下文,具备 Token Enforcer 保证 toolcall 格式正确,兼容 Anthropic API,并支持 WebSearch Tool 与全自动 Context Caching,优化 K2+Claude Code 使用体验并节省输入 Token

 新版定价与 0711 版保持一致,高速版 API(kimi-k2-turbo-preview)同步升级。用户可通过 Hugging Face、ModelScope 等平台下载部署模型


6 其他

估值翻倍用时约 15 个月:法 AI 企业 Mistral 新融资轮中估值达 120 亿欧元

https://www.ithome.com/0/880/610.htm

 法国 AI 初创企业 Mistral AI 即将以 120 亿欧元的估值完成新一轮 20 亿欧元的融资。这使其成为欧洲最有价值的科技初创公司之一。此前,Mistral AI 已累计从全球投资者处筹集了超过 10 亿欧元。在 2024 年 6 月完成的上一轮融资中,该企业估值约为 58 亿欧元,这意味着其估值在大约 15 个月内实现了翻倍

 Mistral AI 正在积极筹措资金以扩展其业务,与美国和中国的同行保持竞争力。该企业近期还与英伟达合作,在法国推出 AI 云服务 Mistral Compute。此外,他们正在与法国贷款机构 Bpifrance 等进行数亿欧元级别债务融资的谈判,以进一步支持其发展

 这些融资活动表明 Mistral AI 在快速增长的 AI 领域中占据了重要位置。通过这些资金,Mistral AI 计划加速其业务扩展和技术研发,以在全球市场上提升竞争力


华纳兄弟探索起诉 Midjourney,指控其 AI 侵犯蝙蝠侠、超人、兔八哥等角色版权

https://www.ithome.com/0/880/580.htm

 华纳兄弟探索公司在洛杉矶联邦法院起诉 Midjourney,指控其未经授权使用 DC 漫画和汉纳巴伯拉动画等角色进行 AI 训练,生成图像和视频。诉状称 Midjourney 向用户提供侵权图片下载,并在上月取消对侵权图像生成视频的限制

 华纳兄弟要求法院命令 Midjourney 停止侵权并赔偿损失及利润返还。这起案件与 2024 年迪士尼、环球影业提起的类似诉讼相呼应,涉及达斯・维达、巴特・辛普森等角色。文件显示 Midjourney 成立于 2022 年,总部旧金山,创办人为大卫・霍尔茨,截至 2024 年用户接近 2100 万,年营收约 3 亿美元

 华纳兄弟发言人表示,公司核心在于角色和故事开发,此次诉讼旨在保护知识产权与合作伙伴权益,通过法律行动确保内容产业的可持续发展


二、技术前沿分析

FAIR:Set Block Decoding,一种语言模型推理加速器

http://arxiv.org/pdf/2509.04185v1

 研究人员提出了一种名为 Set Block Decoding(SBD)的新范式,通过在单一架构中整合标准的 next token prediction(NTP)和 masked token prediction(MATP),加速语言模型的生成过程

 SBD 允许模型并行采样多个未来 token,而不必是连续的,与之前的加速方法相比,这种灵活性使其能够利用离散扩散文献中的高级求解器,在不牺牲准确性的情况下显著提高速度

 SBD 不需要架构上的改变或额外的训练超参数,保持了与精确 KV-caching 的兼容性,并可以通过微调现有的 next token prediction 模型来实现。通过微调 Llama-3.1 8B 和 Qwen-3 8B,研究人员证明 SBD 能够将生成所需的前向传递次数减少 3-5 倍,同时达到与等效 NTP 训练相同的性能


UMASS、Microsoft Research:通过基于仿真的推理改进因果评估的生成方法

http://arxiv.org/pdf/2509.02892v1

 研究人员提出了一种新的框架,名为基于仿真的因果评估推理(SBICE),用于生成与真实观测数据一致的合成数据集,以改进因果估计器的评估

 SBICE 模型将生成参数视为不确定的,并在给定源数据集的情况下推断其后验分布,从而识别出与源数据分布紧密对齐的参数配置

 实验证明,SBICE 通过生成更现实的数据集,提高了估计器评估的可靠性,支持在不确定性下进行稳健且数据一致的因果基准测试


Stanford:IDEAlign,比较 LLM 与人类专家在开放式解释性注释中的表现

http://arxiv.org/pdf/2509.02855v1

 研究人员提出了一种名为 IDEAlign 的直观基准测试范式,用于通过三选一排除法任务捕捉专家相似性评级

 研究人员评估了多种相似性度量,包括基于向量的度量(主题模型、嵌入)和通过 IDEAlign 作为评判者的 LLM,与人类基准进行比较。结果显示,基于向量的度量难以捕捉到对专家有意义的相似性细微差别

 通过 IDEAlign 提示 LLM 显著提高了与专家判断的一致性(提高了 9-30%),这表明 IDEAlign 是在大规模评估 LLM 与开放式专家注释对比时的有前途的范式,有助于在教育及其他领域中负责任地部署 LLM


香港中文大学、字节跳动、哈佛大学:Mycroft,追踪集体通信中的依赖关系以实现可靠的 LLM 训练

http://arxiv.org/pdf/2509.03018v1

 研究人员提出了 Mycroft,一种轻量级的分布式追踪和根因分析系统,旨在解决集体通信中隐藏的可靠性问题,从而提高 LLM 训练的效率

 Mycroft 的核心思想是追踪集体通信状态,并利用内部控制和数据依赖关系来解决 LLM 训练中的可靠性问题。该系统已在字节跳动部署超过六个月,用于调试运行时的集体通信相关问题

 通过广泛的故障注入实验,研究人员展示了 Mycroft 的能力和效率。该系统在 90% 的情况下能在 15 秒内检测到异常,并在 60% 的情况下能在 20 秒内识别出根本原因


上海交通大学、蚂蚁集团:通过双向重建训练 LLMs 以提升文本嵌入能力

http://arxiv.org/pdf/2509.03020v2

 研究人员提出了一种新的训练阶段,旨在通过双向生成重建任务(即 EBQ2D 和 EBD2Q)丰富最终 token 嵌入的语义,从而提升 LLM 作为文本嵌入器的能力

 该方法在对比学习之前加入新的训练阶段,通过在查询-文档对中锚定 [EOS] 嵌入并重建任一侧,提升文本嵌入的语义表达能力,特别是在检索和重新排序任务中

 实验结果表明,该附加训练阶段显著提高了 LLM 在大规模文本嵌入基准(MTEB)上的性能,在不同的 LLM 基础模型和规模上实现了新的最先进结果


三、AI ToC 应用

AIBI Pocket,AI 袖珍宠物伴侣

https://www.producthunt.com/products/aibi-pocket

 AIBI Pocket 是一款可手持或佩戴在衣物上的微型 AI 伙伴,具备识别用户并与 ChatGPT 对话的功能,还能旋转如云台般展示天气动画,提供提醒服务,并与其他 AIBI 进行互动

 AIBI Pocket 集成 AI 角色与可穿戴设备的特点,为用户带来有趣且实用的日常陪伴体验。产品通过小巧设计与多样功能,将娱乐与实用性相结合,成为贴身的智能伙伴


DeepTutor,AI 学术研究助手

https://www.producthunt.com/products/deeptutor

 DeepTutor 将“氛围阅读”功能引入 Zotero,帮助用户快速把握论文核心而不陷于细节。通过原生集成,系统可即时生成摘要并提供上下文洞察,提升学术研究效率

 DeepTutor 特别适合日常使用 Zotero 的研究人员、博士生和学者,能够帮助用户更快理解论文并在研究中连接不同见解,为现代学术工作带来更智能化的支持


Nyx,AI 睡眠助理

https://www.producthunt.com/products/nyx-2

 Nyx 帮助用户摆脱睡前刷屏困扰,通过舒缓的语音对话、睡前故事和自适应作息安排,引导用户更快进入睡眠状态

 Nyx 提供个性化的睡眠放松方案,根据用户习惯调整夜间体验,帮助建立健康的睡眠节奏,让休息更加高效与安心


四、AI ToB 应用

TaskWand,AI 工作流自动化工具

https://www.producthunt.com/products/taskwand

 TaskWand 可将用户的文字描述即时转化为完整的 n8n 自动化流程,支持条件设置、循环及错误处理,大幅减少手动搭建的时间

 TaskWand 致力于帮助用户在数秒内完成可直接部署的工作流生成,让自动化过程更高效便捷,提升整体生产力


Piktochart,AI 可视化设计与沟通平台

https://www.producthunt.com/products/piktochart

 Piktochart 帮助用户轻松创建信息图表、传单、海报、演示文稿和报告,无需任何设计经验即可完成专业级视觉作品

  Piktochart 集成 AI 生成与设计资源,提供一体化的视觉沟通解决方案,让个人与团队能够更高效地表达想法,并通过免费使用降低设计门槛


Cosmic,AI 应用开发平台

https://www.producthunt.com/products/cosmic

 Cosmic 提供一体化的应用开发、部署与内容管理服务,用户只需通过自然语言即可在数分钟内构建和发布应用,显著降低开发门槛

 Cosmic 以 AI 优先的设计理念,为开发者与团队提供高效灵活的工具支持,帮助快速实现创意落地,满足多样化的应用与内容管理需求

【声明】内容源于网络
0
0
跨境电商创业日记
跨境分享馆 | 每天分享跨境见解
内容 0
粉丝 4
跨境电商创业日记 跨境分享馆 | 每天分享跨境见解
总阅读0
粉丝4
内容0