分享
红杉中国发布新一代AI测试工具xbench
2025-05-26 17:01 星期一
5月26日,红杉中国宣布推出全新的AI基准测试xbench,并发布相关论文《xbench: Tracking Agents Productivity, Scaling with Profession-Aligned Real-World Evaluations》。这是首个由投资机构主导的AI基准测试,联合了国内外十多家高校和研究机构的数十位博士研究生共同参与,采用双轨评估体系和长期持续的评估机制。xbench不仅致力于提升AI系统的性能上限和技术边界,还将重点衡量AI在真实场景中的实际应用效果,并持续追踪Agent产品的重要进展。
新闻推荐
查看更多
大数新闻社群
7x24h跨境新闻推送
加入卖家交流群


