大数跨境
0
0

最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅

最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅 金融科技教育网
2024-08-14
0
如果你这几天在𝕏/推特上关注AI消息,那很大概率见过这个“草莓哥”账号。

头像是电影《Her》里的男主,昵称是三颗草莓,要素拉满。知疲倦一天24小时在线水贴,内容多是OpenAI下一代模型爆料消息,时准时不准……

自从OpenAI奥特曼和草莓哥配合互(炒)动(作)过之后,不管你愿意不愿意看,推荐算法都会确保ta出现在你的时间线上。

昨天,草莓哥声称OpenAI将有大动作,大家是非常期待的。

而且刚好又到了谷歌开发布会的时间,OpenAI拿出什么消息来抢头条也是很合理的吧。

但时间到了大家发现,没有GPT-5,也没有草莓/Q*,也没有Sora公测……OpenAI只是发了新版大模型代码能力测试基准。

就在网友们的耐心被耗光的时候,剧情反转来了。

创业公司MultiOn AI的创始人Div Garg现身认领:

草莓哥账号其实是我们家最先进的AI Agent控制的,快来和它在线互动吧。

网友一下子炸锅了:

“要么这就是当前最好的AI Agent,要么这家公司参与炒作,把公司声誉全毁了。

斯坦福博士休学创业,估值7亿元

先来说说MultiOn AI这家公司,专注于构建AI智能体。

旨在自动化日常任务和操作网页,例如从电商平台买手纸或安排日程表。

今年6月,有消息称MultiOn将完成2000万美元(约1.4亿元)融资估值约1亿美元(约7.1亿元)。

创始人Div Garg,斯坦福大学读CS博士期间休学创业,在Uber、谷歌、苹果、英伟达都有实习经历。

他们最新推出的智能体产品Agent Q,号称拥有做计划和纠正自己错误的能力,可以跨站点浏览、填写表单,zero-shot表现比Llama 3基线提升340%。

与此同时,也发布了与斯坦福团队合作的相关研究论文,

关键创新点是AlphaGo同款蒙特卡洛树搜索算法结合DPO微调

总之呢,产品和论文看起来还挺正经的。

就是CEO声称草莓哥账号是AI控制的这一点,网友们还是不太买账。

最近围绕AI的消息太多太乱,大家已经不知道该相信什么了。

不过也有人认为,草莓哥的账号与MultiOn公司成立时间对的上,用户名iruletheworldmo最后的“mo可以是MultiOn的缩写。

但即使是真的,也有很多人批评这家公司的做法,没有带来什么好影响,而是浪费了很多人时间。

AI越狱大师Pliny看不惯这种做法,发出了最后通牒:

给你们15分钟时间,要不拿出决定性的证据,要么坦白真相,不然就把你家智能体的系统提示词公布在GitHub上。

时间到了,Div Garg并没有回应,反而删除了其中一条声称草莓哥账号由AI控制的两条发言,另一条还保留着。

Pliny也如约发布了提示词。

One More Thing

在国内大家睡觉的这段时间,AI圈发生了很多事。

除了MultiOn的闹剧之外,谷歌发布了对标GPT-4o高级语音模式的Gemini Live语音聊天机器人。

OpenAI则出了两招来回应:

发布最新代码能力基准测试SWE-Bench Verified,给“AI程序员”们出了一套更合适的考试题。

OpenAI在测试中发现原版基准中有一些AI不可能或很难解决的任务,从而导致基准普遍低估了当前模型的自主软件工程能力。

此前SWE-Bench原版作者姚班学霸姚顺雨已经毕业入职OpenAI,这次OpenAI也和普林斯顿原始团队进行了合作,在新版本中修正了这些问题,可以提供更准确的评估。

目前新版基准测试已经开源在GitHub上。

同时在大模型竞技场上,GPT-4o的最新版本反超谷歌Gemini-1.5-Pro的试验版本,重新夺回第一的位置。

OpenAI和谷歌的AI大战,还将继续……

参考链接:
[1]
https://x.com/MultiOn_AI/status/1823412701441482959
[2]https://x.com/ai_for_success/status/1823447309008490730
[3]https://openai.com/index/introducing-swe-bench-verified/

来源:
凹非寺
声明:此公号(ID:Fintech_Education)发布内容和图片的目的在于传播更多信息,版权归原作者所有,不为商业用途,如有侵犯,敬请作者与我们联系。

近期活动

Upcoming Activities

为了深入实践“加强金融科技人才队伍建设”和落实“金融与科技复合型人才能力培养与提升”的工作要求,中关村互联网金融研究院、中关村金融科技产业发展联盟,联合多家金融科技头部企业共同推出《金融大数据建模工程师应用能力认证项目》。3年课程研发,学制2个月,共36学时,采取线上学习,通过率92%,扫描下方二维码进行报名,随报随学。   


【声明】内容源于网络
0
0
金融科技教育网
金融科技教育网主要关注如下内容:金融科技人才培养(认证课程、公开课、行业论坛、番钛客大赛、人才对接);内容(学术前沿、创新技术)行业(金融科技、银行科技、保险科技等);技术(人工智能、大数据、区块链、云计算、5G、物联网等)。
内容 883
粉丝 0
金融科技教育网 金融科技教育网主要关注如下内容:金融科技人才培养(认证课程、公开课、行业论坛、番钛客大赛、人才对接);内容(学术前沿、创新技术)行业(金融科技、银行科技、保险科技等);技术(人工智能、大数据、区块链、云计算、5G、物联网等)。
总阅读5
粉丝0
内容883