9agent.ai
点击蓝字 关注我们
每日AI简讯
2025.05.02
01
大模型
LLM
DeepSeek开源Prover-V2强推理模型,网友:奥数从没这么简单过
DeepSeek开源定理证明大模型DeepSeek-Prover-V2,包含7B和671B两个版本。在MiniF2F测试中达到88.9%的通过率,支持32K tokens上下文扩展,采用递归定理证明流程将非形式化数学推理与形式化步骤融合。通过强化学习优化模型,结合冷启动数据生成和专家迭代训练,解决PutnamBench中49个难题。同步发布ProverBench评估数据集,覆盖高中竞赛至本科数学题。
原文链接:https://www.ithome.com/0/850/284.htm
AI技术突破加速AGI进程 多领域创新推动智能革命
DeepSeek通过MLA和MoE架构降低算力需求,GPT-5多模态推理成本骤降150倍。中国团队开源无语言依赖视觉模型VideoWorld,物理预测准确率超GPT-4V 27%。小米开源数学推理大模型MiMo-7B性能超越闭源模型,Meta发布ReasonIR-8B检索模型刷新BRIGHT纪录。
原文链接:http://m.toutiao.com/group/7499325677385859594/
2025年5月1日最新AI资讯
微软30%代码由AI生成,华为交付先进AI芯片集群,谷歌Gemini将集成至iPhone。英伟达CEO称中美AI技术差距极小,呼吁放宽芯片限制。
原文链接:http://m.toutiao.com/group/7499436073362178623/
02
产品应用
Product Application
阿里云全栈AI技术亮相数字中国峰会
展示飞天企业版云平台和百炼大模型专属方案,实现GPU利用率提升20%、推理速度加快3倍。支撑浙江“浙里办”、重庆智能政务等30余部委数字化项目。
原文链接:http://cn.chinadaily.com.cn/a/202505/01/WS6812cf13a31020537703164d.html
Meta 发布 ReasonIR-8B:破解 AI 复杂推理检索难题
基于LLaMA3.1-8B架构开发,采用双编码器技术和合成数据工具生成超长查询训练。在BRIGHT基准测试中计算成本仅为同类模型的1/200,MMLU和GPQA任务分别提升6.4%和22.6%。
原文链接:https://www.ithome.com/0/850/334.htm
03
硬件&底层技术前沿
Hardware Technologies
微软承认数据中心建设进度延迟
AI服务需求激增导致6月前或面临容量短缺问题,已取消多项数据中心租赁项目。全球新增10个国家及4个大陆的数据中心布局,计划投入800亿美元推进建设。
原文链接:https://www.ithome.com/0/850/341.htm
山大地纬申请大模型增强跨社区知识图谱构建专利
通过大语言模型整合Github、StackOverflow和Wikipedia三大社区知识三元组,完成跨领域知识对齐与融合,构建统一知识图谱。
原文链接:http://m.toutiao.com/group/7499325731491545640/
04
其他
Other
2025年5月1日科技热点速递
苹果因未开放App Store外部支付被判违令,Shopify推行全员强制AI使用政策引发全球首轮AI裁员潮,饿了么携百亿补贴加入外卖大战。
原文链接:https://news.sina.cn/2025-05-01/detail-inevafmy0691319.d.html
⬇️更多AI资讯关注我们⬇️

