大数跨境

11月12日丨每日AI简讯丨GPT5.1隐身登场!256K上下文+NSFW功能引爆AI圈

11月12日丨每日AI简讯丨GPT5.1隐身登场!256K上下文+NSFW功能引爆AI圈 久新数智
2025-11-12
1
导读:摘要信息



9agent.ai

点击蓝字 关注我们



每日AI简讯

2025-11-12


01

大模型

LLM

图片
  • GPT5.1 | OpenAI 疑似测试 GPT5.1,新模型代码和创意表现强劲,或为 NSFW 模式铺路

    OpenAI疑似测试下一代大模型GPT5.1(内部测试名为Polaris Alpha),该模型已在OpenRouter平台开放API调用,最大上下文容量达256K,单次最大输出128K,知识库更新至2024年10月。用户测试显示其在文本生成、创意及编程任务中表现稳定,处理长文本时具备自我纠错能力,且测试版本出现NSFW功能迹象,或为年底推出成人模式铺路,预计最快11月中正式发布。

  • ERNIE-4.5-VL | 百度重磅发布新一代多模态AI模型ERNIE-4.5-VL

    百度近日发布新一代多模态思考模型ERNIE-4.5-VL-28B-A3B-Thinking,该模型采用3B激活参数,兼具计算效率与灵活性。其创新引入"图像思考"功能,支持图片放大、搜索等工具调用,可提升图像与文本交互体验,为智能搜索、在线教育等领域提供新可能。模型已开源,助力开发者探索多模态AI潜力。

  • Polaris Alpha | GPT-5.1“隐身”登场?OpenAI悄然上线Polaris Alpha,256K上下文+冷门知识引爆社区猜测

    OpenAI在OpenRouter平台低调上线代号“Polaris Alpha”的大模型,其能力特征被猜测与GPT-5.1高度吻合。该模型支持256K上下文窗口,知识更新至2024年10月,在长文档理解、代码生成等任务中表现突出,且为NSFW功能做技术准备,引发社区对其是否为GPT-5.1的热议。

  • Doubao-Seed-Code | 字节推出新AI编程模型!仅需3毛钱,就能让网页开发更轻松

    字节跳动推出新型AI编程模型Doubao-Seed-Code,其性能、价格及迁移成本表现突出。该模型兼容Claude API,与TRAE开发环境深度集成,登顶SWE-Bench Verified榜单;调用价格低廉,火山引擎推出9.9元套餐;迁移成本低,与Anthropic API原生兼容。测试中,其完成粒子动画、交互开发等任务,并成功开发故宫导览网站,展现强大代码生成与优化能力。

  • Nano Banana 2 | Nano Banana 2横空出世!精准渲染“11:15的满杯红酒”,AI图像生成迈入设计师级时代

    Nano Banana 2作为全新升级的AI图像模型,攻克了复杂细节还原难题,能精准执行“时钟显示11:15、红酒杯满至杯口”等多重精确指令,正确绘制钟面刻度、指针角度及液体张力等。其引入五步工作流,实现生成过程结构化、可干预,提升复杂任务可控性,推动AI图像生成从“随机出图”迈入“可控精修”时代。


02

产品&应用

Product Application

图片
  • Google TV接入Gemini | Google TV 正式接入 Gemini,用情境化问答革新家庭娱乐和学习方式

    谷歌宣布在Google TV流媒体播放器上推出Gemini语音助手,取代原有Google Assistant,作为整合Gemini战略的重要一步。升级后用户可通过自然对话访问内容,如跨情境影视推荐、剧集剧情查询,还能进行学习问答或DIY指导,未来几周向18岁以上用户推出,此前已宣布支持部分设备。

  • 远程驾驶服务 | 与 Waymo 正面对决?Grab 巨额投资德国远程驾驶初创 Vay,发力美国市场与东南亚协同

    新加坡科技巨头Grab投资德国远程驾驶初创公司Vay 6000万美元(或追加3.5亿),助力其在美国市场扩张。Vay通过人工操作员远程驾驶租赁汽车服务,定位为自动驾驶出租车补充,成本约为网约车一半。双方还将探索东南亚业务协同,Vay数据可提升自动驾驶模型训练,目标打造全球远程驾驶平台。

  • ChatTutor | AI教师“会画图”了!ChatTutor上线,边讲边画、实时推演,教学效果直逼真人名师

    2025年11月11日,可视化交互式AI教师系统ChatTutor正式发布,其突破传统AI问答纯文字输出局限,通过实时同步画板实现“边讲解、边绘制、边推演”的类人教学体验。该系统依托多模态生成技术,覆盖数学可视化、物理实验模拟等五大教学场景,实测教学逻辑媲美一线教师,标志着AI教育从“信息检索工具”升级为“认知协作伙伴”。

  • 企业视频解决方案 | Kaltura 以 2700 万美元收购 eSelf,打造更智能的企业视频解决方案

    纽约Kaltura公司以约2700万美元收购以色列初创公司eSelf.ai,后者专注开发可对话的AI生成数字人。此次收购将助力Kaltura整合生成式AI技术至其企业视频和学习工具中,利用eSelf的语音转视频生成、低延迟语音识别技术,实现数字头像实时互动及理解用户屏幕内容,推动视频服务向个性化、交互式体验升级。

  • Omnilingual ASR系统 | Meta 推出全新 Omnilingual ASR 系统 支持 1600 种语言的语音识别

    Meta基础人工智能研究团队(FAIR)推出Omnilingual ASR自动语音识别系统,支持超1600种语言转录,其中500种为首次被AI覆盖。该系统准确性依赖训练数据,78%语言字符错误率低于10,低资源语言也有36%达标。Meta同步发布含350种欠代表性语言的语料库,并开源系统(Apache2.0许可),支持通过上下文学习扩展至超5400种语言,为低资源语言社区提供解决方案。

  • Mindy(销售AI代理) | 6sense 创始人为新兴 AI 销售公司 1mind 筹集 3000 万美元资金

    Amanda Kahlow创办的AI销售公司1mind完成3000万美元A轮融资,由Battery Ventures领投,总融资额达4000万美元。公司推出销售AI代理Mindy,专注处理客户主动需求,支持销售环节,可替代销售工程师参与电话、负责客户入职等。Mindy基于OpenAI、Google Gemini等大模型及确定性AI构建,已与HubSpot等30余家公司合作,平均合同金额达六位数。

  • Google Finance | 新版 Google Finance 引入 AI 深度搜索与实时财报功能,提升个人投资研究体验

    谷歌推出新版Google Finance,整合AI深度搜索、预测市场数据及实时财报追踪功能。AI深度搜索可处理复杂金融问题并生成带引用报告,支持对话式研究;预测市场数据整合第三方信息,提供事件预测概率;实时财报追踪支持查看日历、收听直播及获取AI分析摘要。该版本已在印度上线,支持英印双语,未来将扩展更多地区,助力用户高效投资研究。

  • AI Integrations | Replit 推出 AI Integrations,一键接入 300+ AI 模型,构建 AI 应用变得轻松

    Replit 推出 AI Integrations 功能,用户无需复杂设置即可一键接入 300+ 顶尖 AI 模型构建应用。通过智能助手互动(如建立聊天机器人或添加 GPT-5),平台自动处理配置凭证、链接计费等后台工作,支持文本生成、图像处理等任务,并能根据需求选择或更换模型。使用情况和费用透明显示在仪表板,简化了 AI 应用构建流程,成为开发快捷之选。


03

硬件&底层技术

Hardware Technology

图片
  • AMD | AMD 收购 MK1,加速布局 AI 推理市场

    近日,AMD宣布收购AI推理初创公司MK1,旨在推动其在AI推理领域的战略发展。MK1专注高速推理技术,其"Flywheel"技术与AMD Instinct GPU深度优化,可日处理超1万亿token。收购后,MK1团队将加入AMD AI事业部,提升企业级AI软件能力,结合Instinct MI300X等硬件,为金融、医疗等领域提供低延迟、高吞吐的推理服务,降低能耗与成本,助力AMD深化"软硬件协同"战略。

  • 字节跳动 | 字节推出 InfinityStar 框架,视频生成速度提升至 58 秒!

    字节跳动推出全新InfinityStar框架,将生成5秒720p视频时间缩短至58秒。该框架采用时空金字塔模型,分开处理空间与时间维度,有效解耦外观与运动信息;引入知识继承策略,利用预训练变分自编码器加速学习,降低计算成本,提升生成质量与效率,推动视觉生成技术进步。

  • Majestic Labs | 初创公司 Majestic Labs 获得 1 亿美元融资,专注于高效 AI 服务器

    由前谷歌和Meta硅片工程师创立的初创公司Majestic Labs,近日获1亿美元A轮融资,用于开发高容量AI服务器。其专利硅片架构设计的服务器内存容量可达传统企业服务器的1000倍,能替代十个现有服务器机架,降低数据中心电力、冷却及空间成本,目标解决内存密集型AI工作负载瓶颈,预购已在商讨中。

  • 约翰・霍普金斯大学 | 约翰・霍普金斯大学发布 EGO-Prompt 框架,助力小型 AI 模型实现大模型性能提升

    约翰・霍普金斯大学近日推出EGO-Prompt框架,可提升小型语言模型在医疗诊断、交通管理等专业领域任务中的表现,性能提升近50%,成本降低83%。该框架通过自动生成优化提示词、结合因果逻辑分步推理,提升模型可解释性,F1分数较此前方法提高7.32%-12.61%,实现小型模型以20%成本达到大模型效果。


04

行业动态&政策

Industry Trends Policies

图片
  • 软银与OpenAI合资成立 “水晶智能”,AI投资模型引发关注

    近日,软银与OpenAI宣布成立50-50合资公司“水晶智能”,旨在向日本市场销售企业级AI工具。作为OpenAI主要投资者,软银此次合作引发对AI行业大规模交易是否创造经济价值的质疑,专家认为当前投资模式或面临可持续性挑战。行业人士既期待其在日本市场的表现,也关注其能否形成良性循环而非资金无效流动。

  • OpenAI深陷90亿美元现金流危机!技术光环难掩财务隐忧,Anthropic已悄然领跑盈利赛道

    据内部文件显示,OpenAI预计面临90亿美元负自由现金流,主因是基础设施扩张、人才成本高企及产品免费策略。其竞争对手Anthropic因聚焦B2B服务、高毛利API等,预计2028年实现正向现金流,被视为更健康投资标的。OpenAI正通过企业版提价、Sora API收费等措施突围,但效果待观察。

  • AI 浪潮冲击翻译界 “哈佛”,蒙特雷国际研究院宣布关闭线下项目

    全球知名翻译学府蒙特雷国际研究院(MIIS)宣布,因招生人数骤降、财务压力及AI翻译技术冲击,将于2027年夏季关闭线下研究生项目。AI翻译效率较传统提升近9倍,成本降90%,行业转向“大模型初译+人工保障”模式,致招聘需求减少、岗位门槛提高,传统翻译人才面临挑战。

  • 软银与OpenAI达成修订协议,追加225亿美元投资

    软银集团与OpenAI达成修订协议,将在未来融资中全额追加225亿美元投资,用于OpenAI Global后续400亿美元融资计划。软银实际投资额预计达300亿美元,通过愿景基金2号实施。首轮已完成100亿美元投资(其中25亿转贷共同投资者,75亿直接投资),共同投资者已认购全部银团贷款;第二轮将延续该模式,推动OpenAI技术发展与市场拓展。

  • 拉美数据中心遭遇环保抗议:社区呼吁透明度与责任

    随着AI发展,拉美数据中心数量激增,尤其在干旱地区,社区对其环境影响担忧上升。智利、巴西大力发展数据中心,智利政府放宽环境评估标准,社区难获环境影响信息;乌拉圭居民曾因缺水质疑谷歌数据中心,通过法律获信息。社区呼吁政府透明度,部分视大科技公司为提升环境标准机会。


05

其他

Other

图片
  • 李飞飞重磅发声:AI的下一战是“空间智能”!没有它,通用人工智能只是空谈

    人工智能先驱李飞飞在最新博客中指出,AI的下一战是“空间智能”,即理解并驾驭物理世界的能力,这是实现通用人工智能的关键。她强调空间智能是人类认知基石,当前大模型在物理常识上存在缺陷,需构建能预测物理环境的新一代世界模型,并提出三阶段落地路径,呼吁共建开放生态以扩展人类能力。



⬇️更多AI资讯关注我们⬇️



【声明】内容源于网络
0
0
久新数智
重塑生产力,开启人机协作新篇章!
内容 0
粉丝 0
久新数智 重塑生产力,开启人机协作新篇章!
总阅读0
粉丝0
内容0