大数跨境
0
0

炸裂!跑分 95 vs 69,直接吊打 OpenAI、Gemini,这个 FlowithOS 是什么来头?

炸裂!跑分 95 vs 69,直接吊打 OpenAI、Gemini,这个 FlowithOS 是什么来头? AI软件测评说
2025-10-29
2

朋友们,最近聊 AI Agent 的项目,

太多了,真的有点聊不动了。

AutoGen, CrewAI... 各种框架多到看都看不过来。

然后,我看到了 FlowithOS。

新奇的点是。。。

它的野心,居然不在“Agent”,而在“OS”。

一个给 AI 用的操作系统。

操作系统。


简单来说,它不想只当一个“聊天机器人”或者“Siri”。

那它要干嘛呢?

我猜它是想直接上手,来操作你的电脑。

包括但不限于:

浏览网页、点击、文件上传下载、操作命令行、整理文件。

甚至帮你打游戏签到、自动管理你的社交媒体。

官方有个例子。

它能自动接管你的社交媒体账号,比如 TikTok,跑去高流量直播间刷那种“文化洞察力极强”的评论。

然后,刷出了 500 多次互动。


这...

终极营销号?

听着都有点过分了。。。

我们回到正题。

那它凭什么,敢叫自己是“OS”呢?

我发现它有两个东西,很有噱头。

一个是“认知决策”,一个是“进化系统”。

你可以理解为:

「第一,它有“记忆”。」

它能记住你的偏好、你的习惯。

你让它帮你干活,它不是做完事儿立马就忘的“临时工”,它能沉淀经验,提供个性化的服务

「第二,它会“进化”。」

它配备了在线强化学习(online-RL)能力。

意思就是,在你用它的时候,它自己也在学。

而且还越用越聪明。

它还能通过学习新的工作流程,自动给自己转化成新“技能”(Skills)。

然后,最夸张的来了。

在 Online-Mind 2 Web 基准测试里,FlowithOS 跑了 95 分。

作为对比。

OpenAI Atlas 和 Gemini 2.5 Pro CU,平均最高分是 69。


天了噜,直接吊打啊,这您受得了吗?

反正我看到这个数据的第一反应是,真的假的?这步子是不是迈得有点大了。

但它敢这么写出来,就说明它还是有底气的。

我又去看了下它和同类产品的区别,这个更有意思。

比如对比 Manus 1.5。

Manus 1.5 更像一个“全栈程序员”,能力很强,自己闷头在产品内部写代码、搞定复杂任务。

而 FlowithOS。

更像一个“项目经理”或“总指挥”。

它不一定所有事都自己干,但它极度擅长“调度”和“编排”外部的生态和工具(比如调用 Claude Code)来协同完成任务。

格局一下就打开了。

再比如对比 OpenAI 的 Atlas。

我们前几期还介绍过Atlas

它本质上还是个“浏览器”,Agent 是它其中一个很强的模式。

而FlowithOS 是反过来的。

它定义自己是“操作系统”,浏览器界面,只是它提供给 Agent 用来执行任务的一个“图形界面”。

核心。

是 Agent,是那个“智能体”。

所以啊。

这玩意的想象力,一下就拉满了。

我们以前用 AI。

是“你问,它答”。

或者,“你给指令,它出图”。

我们,始终是那个“操作者”。

但 FlowithOS 这类东西,它想当的。

是“执行者”,是“管家”,是“数字劳动力”。

你只需要告诉它一个目标。

比如官方另一个例子:

“帮我完成节日采购,买一套完美的宠物犬礼品套装”。

它自己就能去开浏览器、去搜索、去比价、去下单。

官方说这能帮你省 2 个小时。

我写到这里,已经忍不住去官网下载了。

它现在还是公测阶段,需要邀请码。

据说 AI 工具集那边有互助群,我也准备去蹲一个。

等我拿到了。

第一时间,给你们出测评。

这。

可能才是真·AI 助理的开始。

「以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。」

作者介绍:taskinai(vx:skingko) ——链接我,我将用键盘拯救你的

技术宇宙!


【声明】内容源于网络
0
0
AI软件测评说
专注分享Vibe Coding、独立开发Ai 工具和创业灵感
内容 385
粉丝 0
AI软件测评说 专注分享Vibe Coding、独立开发Ai 工具和创业灵感
总阅读159
粉丝0
内容385