【灵思导读】 光靠模型本身还不够。从凌乱的数据到分析报告再到汇报PPT,中间的自动化链条由谁来完成?GitHub上新开源的SenseNova-Skills提供了一个方案。我们实测了四个真实场景,效果有些惊喜。
最近,第三方榜单Claw-Eval上冒出一个有意思的名字。
SenseNova 6.7 Flash-Lite,这个轻量级模型冲进了前十名。
它排在DeepSeek V4 Pro和GPT-5.4之后,但超过了Gemini 3.1 Pro与DeepSeek V4 Flash。
有意思的是,行业巨头们也在同一周各自出了新招。
ChatGPT for Excel全球上线,由GPT-5.5驱动,直接在Excel里嵌入侧边栏。
两天后,Claude把Excel、Word、PowerPoint三件套转为正式GA版本,Outlook也同步开启公测。对话上下文能在四个Office应用之间不断保持,从邮件到表格再到PPT一路跟着你。
两大巨头为什么急着把大模型塞进办公套件?
实际上,要真正解决工作里的问题,只靠模型远远不够。
要想实现跨环节、全链路的办公自动化——从脏数据到分析报告再到汇报PPT——必须要有专门的Agent和Skills来支撑。大模型要从「会聊天」升级到「会交作业」,靠的就是这层能力。
最近GitHub上一套开源的办公Skills正好踩中了这波趋势,而且很快就拿到了四位数的Star数。
我们抱着试试的心态亲测了一轮,发现效果有点超出预期。
项目地址:https://github.com/OpenSenseNova/SenseNova-Skills
一句话生成一张图,没有乱码
初次出国旅游,签证、机票、海关、转机等一堆流程摆在那里,大多数人的第一反应是去小红书翻攻略。
现在换个做法。
把需求丢给装了Skills的Agent,它会自动生成一张完整的流程图。
步骤清楚,层级分明,中文排版零乱码,风格直接对齐小红书的热门内容。
一句提示词就搞定,不需要抽卡。
从数据到报告再到PPT,三个真实办公场景
开胃菜吃完,来点硬菜。
六家厂商、十三种品类混在一起,抗噪才是真本事
下一个测试任务:存储芯片价格分析。
做过采购或分析的朋友肯定懂这种烂摊子:七个月的报价记录、六家厂商,从DDR4到HBM3e再到企业级SSD,十三个细分品类全搅在同一张表格里。厂商名大小写不统一,空值东一个西一个,离群值占到了13%。
难处理的不仅是数据量大,更烦人的是数据乱。
不同品类的价格量级相差几十倍,要是不分层处理,一算均价结果就是垃圾数据。
换作真人,洗数据加写报告至少得熬一天半。
对于这个任务,Agent的处理显得相当老练。
它先跑了一轮「数据审计」,把厂商命名不规范、报价空值等问题全部清理了一遍。
光是厂商名就揪出四个问题,比如「 sk hynix」前面多了个空格、「 samsung」大小写乱飞。这种脏数据不清掉,后面按厂商聚合时同一家公司会被拆成两条线。
特别值得一提的是它对离群值的处理。
110条数据被标记为离群值,占了13%,比例不小。
但Agent没有一刀切全部删除。
它分析后发现,其中一部分对应真实的业务场景,比如渠道清库存促销带来的低价,以及HBM现货紧缺时的溢价。于是它果断保留了这些数据并单独做了标记,在后续分析中分层处理。
数据审计完之后,紧接着是多维拆解。
按「品类×应用场景×厂商」做交叉分析,准确抓到了2026年2月下旬的价格拐点。HBM3e和企业级SSD的周涨幅明显抬升,消费类的DDR4和eMMC只是温和跟涨。
最后的结论很犀利:这轮上涨是AI服务器需求带动的结构性修复,并非普涨。
数据分析能跑通了,那更长的链路呢?
给Agent一个行业名,它还回来一份调研报告
低空经济行业调研。
只给了一个题目,没有提供任何参考资料。
Agent先锁定了一个核心判断:2025到2026年是中国低空经济商业化的关键窗口期。
然后它开始自主检索国内外主流厂商的最新进展,逐一比对机型、适航进展和订单数据。
这里有个细节值得注意。面对大量口径不一致的公关稿和重复的信息来源,Agent精准提取出了UAM落地节奏、eVTOL核心零部件国产化率以及关键环节的成本占比。
在此基础上,它还自动生成了产业链结构图、成本占比饼图,并用TAM/SAM/SOM框架测算了2025、2027、2030年的市场规模。
最终给出的调研报告,既有判断框架,又有数据支撑和可视化图表,远不是「网上搜一圈拼在一起」的那种信息堆砌。
整个过程是由sn-deep-research这个Skill来编排的。
规划→分维度取证→综合→成稿,并且支持断点续跑。
23页PPT,连配色都替你考虑好了
城市新能源汽车充电基础设施的布局与运营方案。
首先,内容结构上搭好了完整的七段式框架:行业背景、需求测算、选址模型、技术方案、运营模式、投资测算、政策建议。
最终交出来的是一份23页的完整PPT。
其次,每一部分都配上了对应的视觉表达。选址模型这一页自动配置了GIS热力示意图,运营模式页生成了三种模式的对比矩阵,投资测算页则给出了利用率与回收期之间的敏感性分析图。
最后一页还列出了三条具体到行动主体和时间节点的落地建议。
生成即交付,打开就能直接编辑。
重点来了。
这份PPT不仅在OpenClaw里跑通了,把同样的Skill拖进ChatGPT也能用。
把SenseNova-Skills仓库克隆到本地,通过ChatGPT的Skills入口导入,再配上GPT的原生能力,同样能生成高质量的PPT。
四大类任务,不挑模型
到这里该亮出底牌了。
前面四个场景背后跑的是同一套东西:SenseNova-Skills。
来自商汤的团队把办公场景里最高频的能力拆成了四大类任务入口,每个入口下面挂着各自负责的具体Skills。这套工具刚在GitHub上开源,采用MIT协议,覆盖了办公场景里最高频的需求。
1. 数据分析:sn-da-excel-workflow,支持多表读取、大文件(超过1万行)自动触发Parquet优化、清洗聚合导出等全流程编排。还有专门处理图片表格OCR的sn-da-image-caption。
2. 深度研究:sn-deep-research,下面挂了六个子Skills,分别负责规划、取证、综合、成稿、格式发现、HTML转换。中间产物可以持久化保存,支持断点续跑。
3. PPT生成:从sn-ppt-entry统一入口进入,支持标准模式和创意模式。标准模式的流程是:大纲→逐页HTML→逐页VLM评审(不合格会自动重写)→PPTX导出。
4. 搜索:聚合了arXiv、Semantic Scholar、PubMed、GitHub、Stack Overflow、Hacker News、HuggingFace、Reddit、Twitter、YouTube、B站、知乎、抖音。学术、开发者、中英文社交全都覆盖到了。
另外,SenseNova-Skills还可以通过调用SenseNova U1模型,完成高密度复杂的信息图生成,其中包含自动提示词扩写、VLM质检和质量排序。
每个Skill都是独立目录,通过SKILL.md来声明什么时候该触发、什么时候不该触发。
Agent会根据指令自动选择和编排,不需要用户手动指定调用哪个。
这套Skills在Claude Code、Codex CLI、ChatGPT、OpenClaw、Hermes Agent等常见Agent工具里都能跑起来。
Skills提供的是流程知识和工具链编排,模型负责推理和决策。
怎么用,怎么装
模型搭档:SenseNova 6.7 Flash-Lite
虽然说有了好用的Skills搭配任何模型都可以,但最简单的选择还是日日新SenseNova 6.7 Flash-Lite——同量级第一名,专门为Agent场景优化的轻量多模态模型。
Flash-Lite采用原生多模态架构,把视觉信号和文本放在统一的感知链路中。它能看懂网页布局、文档结构、图表关系,之后一步到位做出决策,中间不需要经过文字转译。
这个架构带来了两个直接结果。
1. Token消耗在信息搜索等场景中直降60%。 任务越长省得越多,对于需要跑完整工作流的Agent来说,这是实实在在的成本优势。
2. Agent基准测试的成绩也很能打。PinchBench 92分同量级第一,Deep Planning 66分同量级第一,NovaPPTBench 92.4分第一。还在τ²-bench、GPQA-diamond、AA-LCR、MathVision、OCRBenchV2等多个维度上领先同级别的国内外模型。
项目地址:https://github.com/OpenSenseNova/SenseNova6.7
在接入模型API时,还有一个限时福利可以薅。
商汤通过SenseNova平台发放了Token Plan,活动首月可享受每5小时1500次免费调用的配额,相当于零成本上手。
https://www.sensenova.cn/
模型选好之后,接下来就是部署。
两种方式,看你更喜欢哪个
想用这套Skills,有两条路。
第一条,本地安装,自己配置。
Skills仓库以MIT协议开源,你可以用Agent Pack一键安装。它集成了Hermes Agent和OpenClaw框架以及全套Skills,配合免费Token Plan,装完就能直接跑。
项目地址:https://github.com/OpenSenseNova/agent_pack
也可以更灵活一点,直接克隆Skills仓库,然后把Skills目录拷贝到你自己的Agent框架里就行了。
甚至可以让Agent自己安装,对它说:
请帮我把https://github.com/OpenSenseNova/SenseNova-Skills安装到你的Skills目录。
它自己就能完成克隆、拷贝和加载。
API兼容OpenAI格式,主流开源Agent框架可以平滑接入。
第二条,云端产品,开箱即用。
商汤的办公小浣熊目前已经把商汤全系SenseNova-Skills和U1信息图生成打包好了,有1500万个人用户和数千家企业客户在使用。
https://xiaohuanxiong.com/
本地的好处是自由度高,想怎么魔改都行,适合喜欢折腾的选手。
云端的好处是省心,不用碰代码也不用配环境,适合想直接上手用的人。
大模型竞争,回归到交付
真实的未来不是「Agent取代人」,而是周一早晨这样的场景:
分析师打开电脑,上周840条新报价已经清洗完毕;产品经理刚定完选题,调研报告的草稿已经在桌面上;总监还在路上,下午要讲的PPT已经生成好了,连配色都替他考虑周全。
推动这一切发生的,不是更大的模型,而是模型背后那套已经被打磨过的Skills。
代码就在GitHub上,MIT协议,我们已经装上了。
SenseNova-Skills GitHub仓库。
———— END ————
灵思极智旗下“极智系列”三款AI智能应用
关注后,两步置顶服务号,可第一时间收到灵思极智推文!

