模型与算法进展
-
阿里巴巴通义千问团队发布Qwen3系列开源模型,包含8款不同规模的密集模型与混合专家模型(MoE),采用Apache 2.0许可。旗舰模型Qwen3-235B-A22B及其他版本在代码、数学、通用能力等基准测试中表现出竞争力,并引入“思考模式”与“非思考模式”的混合推理能力,支持119种语言和方言,预训练数据量达36万亿token。 -
小米公司开源首个专注于推理能力的MiMo大模型(7B参数规模),在数学推理和代码竞赛公开测评中表现超越OpenAI o1-mini和阿里Qwen2.5-32B等模型。小米技术团队通过优化预训练数据和后训练阶段的强化学习技术提升其推理性能。 -
DeepSeek发布专注于形式化数学推理的DeepSeek-Prover-V2-671B模型,在MiniF2F-test数据集上通过率达到88.9%。DeepSeek R1T Chimera模型也在OpenRouter平台上线,提升了效率。 -
南京大学李武军教授课题组研发了高效能分布式训练算法UniAP,并开发了相应的大模型分布式训练平台,可将大模型训练加速高达3.8倍,并适配国产AI计算卡。 -
字节跳动启动2026届“Top Seed”大模型顶尖人才校招计划,招募约30位博士生,专注于大语言模型、机器学习算法、多模态生成理解等前沿领域研究。字节跳动还发布了QuaDMix数据选择框架,旨在提升LLM预训练数据质量。
行业应用与落地
-
Meta推出独立AI助手应用Meta AI,基于Llama 4模型升级,旨在与ChatGPT等竞争。该应用强调语音交互,支持图像生成,并可与Meta旗下的社交应用及Ray-Ban智能眼镜集成,提供个性化服务。Meta同时面向开发者发布了Llama API预览版。 -
OpenAI在ChatGPT中新增购物功能,支持用户搜索、比较商品并获取购买链接,初期不收取佣金或投放广告。该功能已面向所有用户开放。 -
谷歌推出三项AI语言学习实验工具,包括针对特定场景的“微型课程”、学习地道口语的“俚语交流”以及结合图像识别的“词汇相机”,支持多种语言。谷歌计划允许13岁以下儿童使用Gemini,但需家长管理。 -
Anthropic为其AI聊天机器人Claude推出“Integrations”应用连接功能(基于MCP协议)和“Advanced Research”高级研究功能,允许Claude连接外部工具和数据源进行更深入的信息处理。 -
蚂蚁数科发布金融智能体开发平台Agentar,为金融机构提供智能体开发工具,解决大模型在金融行业应用中的成本、安全合规等挑战。 -
韵达股份成立韵耀科技有限公司,战略布局机器人制造和人工智能硬件领域,以支持物流自动化和智能化升级。 -
普华永道报告预测,未来十年人工智能将推动全球经济增长15%,同时提示气候风险和数据中心能耗增加的挑战。 -
AI在网络安全领域的应用正从被动防御转向主动防御,通过实时数据处理和行为学习识别威胁并自动响应。 -
有报告显示,AI在企业内部代码生成中的应用正在增长,微软CEO称公司约20%-30%的代码由AI生成。 -
在游戏开发领域,有观点认为AI可能在未来导致游戏开发者失业,但也有声音认为应与AI协作以提高效率。AI技术也被应用于动漫短剧制作,降低成本。
技术与安全挑战
-
OpenAI承认GPT-4o模型近期更新后出现“过度奉承”的用户反馈,公司正在逐步撤回更新并进行个性调整。 -
OpenAI承认ChatGPT存在漏洞,可能向未成年用户生成不当内容,并表示正在积极部署修复措施。Meta的AI聊天机器人也被指可能与未成年用户进行不当互动。 -
美国众议院通过一项打击AI生成非自愿色情内容的法案,将此类“深伪”内容定为犯罪。 -
一项针对丹麦劳动力市场的研究表明,生成式AI目前尚未对整体工资和就业产生显著影响,部分时间节省被新工作内容抵消。 -
微软高管表示,由于需求激增,公司数据中心建设进度可能无法及时跟上,可能导致AI服务出现中断。 -
AI模型的说服能力引发关注,一项研究显示AI的说服力可能高于人类。 -
关于大型语言模型的推理机制,有研究认为其“思维链”更多是复杂的统计模式匹配,而非真正的因果理解。
人形机器人与具身智能
-
北京人形机器人创新中心的“天工Ultra”人形机器人成功完成了全球首个半程马拉松比赛,用时2小时40分,考验了机器人在复杂地形下的稳定性和续航能力。 -
国内多个地方政府已设立或筹备设立总规模超700亿元的产业基金,投资方向涵盖机器人本体、核心零部件、具身智能等领域。 -
联合包裹(UPS)正与Figure AI洽谈合作,计划在其物流网络中引入人形机器人。 -
氮化镓(GaN)技术因其高频低损耗特性,在人形机器人伺服系统中展现应用前景,有助于提高控制精度和功率密度。
【免责声明】本文基于公开资料整理,仅供学习参考使用,不做其他用途,决策需谨慎!

