5月2日丨每日AI简讯- 大数跨境

久新数智

2025-05-02

9agent.ai

点击蓝字关注我们

每日AI简讯

2025.05.02

大模型

LLM

DeepSeek开源Prover-V2强推理模型，网友:奥数从没这么简单过
DeepSeek开源定理证明大模型DeepSeek-Prover-V2，包含7B和671B两个版本。在MiniF2F测试中达到88.9%的通过率，支持32K tokens上下文扩展，采用递归定理证明流程将非形式化数学推理与形式化步骤融合。通过强化学习优化模型，结合冷启动数据生成和专家迭代训练，解决PutnamBench中49个难题。同步发布ProverBench评估数据集，覆盖高中竞赛至本科数学题。
原文链接：https://www.ithome.com/0/850/284.htm
AI技术突破加速AGI进程多领域创新推动智能革命
DeepSeek通过MLA和MoE架构降低算力需求，GPT-5多模态推理成本骤降150倍。中国团队开源无语言依赖视觉模型VideoWorld，物理预测准确率超GPT-4V 27%。小米开源数学推理大模型MiMo-7B性能超越闭源模型，Meta发布ReasonIR-8B检索模型刷新BRIGHT纪录。
原文链接：http://m.toutiao.com/group/7499325677385859594/
2025年5月1日最新AI资讯
微软30%代码由AI生成，华为交付先进AI芯片集群，谷歌Gemini将集成至iPhone。英伟达CEO称中美AI技术差距极小，呼吁放宽芯片限制。
原文链接：http://m.toutiao.com/group/7499436073362178623/

产品应用

Product Application

阿里云全栈AI技术亮相数字中国峰会
展示飞天企业版云平台和百炼大模型专属方案，实现GPU利用率提升20%、推理速度加快3倍。支撑浙江“浙里办”、重庆智能政务等30余部委数字化项目。
原文链接：http://cn.chinadaily.com.cn/a/202505/01/WS6812cf13a31020537703164d.html
Meta 发布 ReasonIR-8B:破解 AI 复杂推理检索难题
基于LLaMA3.1-8B架构开发，采用双编码器技术和合成数据工具生成超长查询训练。在BRIGHT基准测试中计算成本仅为同类模型的1/200，MMLU和GPQA任务分别提升6.4%和22.6%。
原文链接：https://www.ithome.com/0/850/334.htm

硬件&底层技术前沿

Hardware Technologies

微软承认数据中心建设进度延迟
AI服务需求激增导致6月前或面临容量短缺问题，已取消多项数据中心租赁项目。全球新增10个国家及4个大陆的数据中心布局，计划投入800亿美元推进建设。
原文链接：https://www.ithome.com/0/850/341.htm
山大地纬申请大模型增强跨社区知识图谱构建专利
通过大语言模型整合Github、StackOverflow和Wikipedia三大社区知识三元组，完成跨领域知识对齐与融合，构建统一知识图谱。
原文链接：http://m.toutiao.com/group/7499325731491545640/

其他

Other

2025年5月1日科技热点速递
苹果因未开放App Store外部支付被判违令，Shopify推行全员强制AI使用政策引发全球首轮AI裁员潮，饿了么携百亿补贴加入外卖大战。
原文链接：https://news.sina.cn/2025-05-01/detail-inevafmy0691319.d.html

⬇️更多AI资讯关注我们⬇️

【声明】内容源于网络

久新数智

重塑生产力，开启人机协作新篇章！

内容 139

粉丝 0

久新数智重塑生产力，开启人机协作新篇章！

总阅读107

粉丝0

内容139