搜索
首页
大数快讯
大数活动
服务超市
文章专题
出海平台
流量密码
出海蓝图
产业赛道
物流仓储
跨境支付
选品策略
实操手册
报告
跨企查
百科
导航
知识体系
工具箱
更多
找货源
跨境招聘
DeepSeek
分享
OpenAI开源BrowseComp重塑Agent浏览器评测
2025-04-11 08:52 星期五
OpenAI开源了测试基准BrowseComp,难度极高,GPT-4o、GPT-4.5准确率仅0.6%和0.9%,带浏览器功能的GPT-4o也仅为1.9%,而Agent模型Deep Research准确率达到51.5%。
新闻推荐
查看更多
大数新闻社群
7x24h跨境新闻推送
加入卖家交流群
查看更多
2025-04-11 08:52 星期五
OpenAI开源BrowseComp重塑Agent浏览器评测
OpenAI开源了测试基准BrowseComp,难度极高,GPT-4o、GPT-4.5准确率仅0.6%和0.9%,带浏览器功能的GPT-4o也仅为1.9%,而Agent模型Deep Research准确率达到51.5%。
下载