第一眼(别细看),哪个是 即梦 主页?
背景介绍
SOLO Coder 支持调用用户自定义的智能体,这为团队协作开发提供了新的可能。
测试内容
我们尝试创建一个虚拟开发团队,让 SOLO Coder 指挥这些智能体协同完成代码编写任务。
这里我组建了一个开发团队:
(建立自己的智能体,打开 “可被其他智能体调用”)
产品经理
UI 设计师
Vite react 前端工程师
Python FastApi 后端工程师
项目规范文件
在项目中创建 project_rules.md 文件,用于介绍自定义智能体及其调用时机。
计划
项目: 对标 即梦 AI , 开发一个类似的网站
1.1 生成项目文档
直接输入提示词(优化前):
优化后提示词:
完整提示词内容:
开发一个类似 https://jimeng.jianying.com/ai-tool/home/ 即梦AI的智能网站平台,参考 project_rules.md 中定义的智能体使用规则(在合适的时机调用不同的智能体完成任务)。具体要求如下:1. 网站功能需求:- 实现与即梦AI类似的核心AI工具功能- 包含用户注册/登录系统- 提供智能体创建和管理界面- 支持多种AI模型集成2. 技术实现要求:- 采用现代化的Web开发框架- 确保响应式设计,适配不同设备- 实现安全的用户认证机制- 优化前端性能,确保流畅的用户体验3. 开发规范:- 严格遵循 project_rules.md 中定义的智能体使用规则- 编写清晰的代码注释- 实现完善的错误处理和日志记录4. 测试要求:- 进行全面的功能测试- 包括跨浏览器兼容性测试- 性能压力测试- 安全性测试5. 交付物:- 完整的源代码- 部署文档- 用户手册- 测试报告
执行结果:
SOLO Coder 分别调用 4 个智能体,生成了 即梦 AI 风格智能网站平台实现计划。md 文档。
1.2 项目文档评审
SOLO Coder 整合各方意见生成项目文档后,我们让每个智能体进行 review 并提出优化建议。
后端工程师 Review
我们可以检查智能体给出的意见,再结合我们自己的想法,给出一个局部修订意见:
上下滑动查看完整内容
前端工程师 Review
补充意见
上下滑动查看完整内容
UI 设计师 Review
根据 UI 专家的 review,uI 设计这块还需要回炉再优化
补充意见
上下滑动查看完整内容
UI评审意见
**设计系统**
- 问题:UI库栈未完全收敛(Radix UI + Tailwind 或 MUI/AntD);影响:组件风格与交互模式可能不一致、维护成本升高;建议:统一采用“Radix UI + Tailwind +自定义设计令牌”,冻结技术栈并建立兼容策略;优先级:高;评分:4/10
- 问题:缺少设计令牌(颜色/间距/排版/阴影)与版本管理;影响:风格不可复用、难以跨平台一致;建议:建立Figma变量与JSON设计令牌,联动前端(CSS变量)与文档;优先级:高;评分:5/10
- 问题:组件规范与状态矩阵未落地(按钮/表单/面板/Modal/表格);影响:开发实现差异化、质检困难;建议:为核心组件输出“默认/hover/active/disabled/加载/错误”态图与使用准则;优先级:中高;评分:6/10
- 问题:可访问性仅在技术层面提及(Radix/ARIA)缺少系统性规范;影响:WCAG 2.1 AA合规风险;建议:建立a11y检查清单、焦点管理、对比度阈值与读屏标注流程;优先级:高;评分:6/10
- 问题:主题/暗色模式未规划;影响:夜间使用与品牌延展受限;建议:定义主题令牌、语义色与暗色对比度规则(≥4.5:1);优先级:中;评分:5/10
- 综合评分:5.5/10(方向明确但设计系统规范与令牌层缺失,需优先补齐)
**交互体验**
- 问题:MVP关键路径复杂(生成编排/分镜/A/B)但缺少分步引导;影响:认知负荷高、失败率上升;建议:采用向导式流程与渐进披露,提供可编辑预设与回退;优先级:高;评分:6/10
- 问题:长任务反馈仅有技术(WebSocket/SSE)未定义UX模式;影响:等待体验不佳、误操作增多;建议:进度条/队列状态/可重试机制与通知中心统一模式;优先级:高;评分:7/10
- 问题:空状态/错误状态规范缺失;影响:上手成本高、容错性弱;建议:为空态提供教学与示例、错误语义与恢复动作(重试/回滚/联系支持);优先级:高;评分:6/10
- 问题:工作台信息架构复杂(角色/模型/参数版本);影响:发现性与一致性不足;建议:采用标签分组、面板折叠、差分预览与版本比较;优先级:中高;评分:6/10
- 问题:表单校验虽有技术(Zod)但微文案与就地校验策略未说明;影响:提交成功率受影响;建议:就地校验、错误定位、示例占位与快捷键(保存/提交);优先级:中;评分:7/10
- 综合评分:6.5/10(关键路径清晰但需强化引导、反馈与空/错态体验)
**视觉一致性**
- 问题:多UI库混用导致视觉语言不统一;影响:品牌认知与体验一致性下降;建议:统一视觉语言与组件来源,必要时封装样式层消除差异;优先级:高;评分:5/10
- 问题:图标与插画风格未定义;影响:界面风格漂移与信息密度不均衡;建议:选定统一图标集(线性/填充)、插画风格与用法边界;优先级:中;评分:6/10
- 问题:排版层级与栅格系统未明确;影响:层次感弱、阅读效率低;建议:定义字号/行高/字重刻度与8pt栅格/间距系统;优先级:高;评分:6/10
- 问题:资产预览比例与裁剪规则不明;影响:列表/画廊跳动与布局不稳定;建议:统一缩略图比例(如16:9/1:1)与骨架屏加载;优先级:中;评分:6/10
- 问题:语义色(成功/警告/危险)与品牌色区分未到位;影响:状态识别混淆;建议:建立语义色体系与可访问对比度校验;优先级:中;评分:6/10
- 综合评分:6/10(需尽快固化视觉语言、排版与资产规范)
**响应式**
- 问题:生成编排页在移动端风险高(多面板/复杂控件);影响:小屏可用性显著下降;建议:移动优先重排,底部导航+步骤化流程,关键操作置底部固定;优先级:高;评分:5/10
- 问题:仅定义断点(xs/sm/md/lg/xl),缺少容器查询策略;影响:复杂布局在不同容器失衡;建议:采用容器查询与布局模式切换(侧栏→抽屉/底部栏);优先级:中;评分:6/10
- 问题:触控目标与手势未定义;影响:移动端误触与效率低;建议:触控目标≥44px、手势(滑动/长按)与可发现性提示;优先级:中;评分:6/10
- 问题:表格/长列表在小屏的虚拟化与密度调节策略不明;影响:性能与可读性受损;建议:密度切换、列折叠为卡片、分页与虚拟滚动;优先级:中;评分:6/10
- 问题:跨设备测试计划未列页面覆盖;影响:关键路径回归风险;建议:建立设备矩阵与页面用例(登录/工作台/生成/发布)真机抽样;优先级:中;评分:7/10
- 综合评分:6/10(基础意识到位,需针对复杂页面深化移动策略与测试)
**动效性能**
- 问题:动效规范缺失(层级/时长/缓动/适用场景);影响:体验不一致并可能造成卡顿;建议:建立动效级别(微动效/过渡/强调)与时长曲线(150–250ms,ease-out);优先级:高;评分:5/10
- 问题:长任务的占位与渐进反馈未详细定义;影响:等待焦虑与中断风险;建议:骨架屏、分段进度、局部刷新与结果就绪通知;优先级:高;评分:7/10
- 问题:性能约束与实现指南未明确(Layout Thrash/主线程占用);影响:Web Vitals波动;建议:优先`transform/opacity`,避免布局触发,使用FLIP与节流/去抖;优先级:中;评分:7/10
- 问题:未纳入`prefers-reduced-motion`与可选关闭动画;影响:对敏感用户不友好;建议:尊重系统设置、提供动画强度开关;优先级:中;评分:7/10
- 问题:监控提到Web Vitals但缺少动效预算;影响:难以治理动画泛滥;建议:设定交互延迟预算(INP)、关键路径动画数量上限与回归基线;优先级:中;评分:6/10
- 综合评分:6.5/10(技术监控到位,需补充动效规范与长任务反馈策略)
**优先行动建议**
- 统一UI栈与设计令牌,建立设计系统与a11y规范(高)
- 为“生成编排/工作台”设计分步向导、状态与空/错态模式(高)
- 固化视觉语言(排版/图标/语义色)并制定资产比例与骨架屏(中高)
- 强化移动端布局模式与测试矩阵,落实容器查询与触控准则(中)
- 建立动效规范与性能预算,尊重`prefers-reduced-motion`(中)
以上评估基于已提供文档,属于研究结论,不涉及代码实现。
toolName: agent_finish
status: success
**审查概览**
- 范围与依据:对实现计划文档的设计方案进行UI维度审核,对照项目规范(设计系统与可访问性、响应式与性能意识)与即梦AI式复杂交互的特性。
- 结论摘要:方向正确,设计系统与令牌未固化、UI库选择未收敛、复杂流程的引导与反馈需加强,响应式在复杂页面上策略不足,动效规范与性能预算缺失。整体建议优先补齐设计系统与关键路径的UX规范。
**设计系统规范**
- 发现问题
- UI库未收敛,Radix/Tailwind与MUI/AntD并行风险大。
- 缺少设计令牌与版本管理(颜色/间距/排版/阴影/语义色)。
- 核心组件的状态矩阵与使用准则未定义(按钮、表单、Modal、表格)。
- 可访问性仅提到“采用Radix/ARIA”,未形成系统性规范与检查清单。
- 主题/暗色模式未制定(对比度与语义色未校验)。
- 影响分析
- 组件风格与交互模式不一致,维护成本与回归风险升高。
- 无令牌导致品牌延展与跨设备一致性差,对A11y与暗色模式支持薄弱。
- 改进建议
- 统一技术栈为“Radix UI + Tailwind”,冻结并形成兼容策略。
- 建立设计令牌(Figma变量 + JSON/ CSS变量),联动前端主题系统,定义语义色与暗色规则(对比度≥4.5:1)。
- 输出组件状态矩阵与交互准则;建立WCAG 2.1 AA检查清单、焦点管理、读屏标注流程。
- 优先级与评分
- 优先级:高
- 评分:5.5/10
**交互与体验**
- 发现问题
- MVP关键路径过于复杂(生成编排/分镜/A-B),缺少向导式引导与渐进披露。
- 长任务反馈仅有技术(SSE/WebSocket),缺少统一UX模式(进度/队列/通知/可重试)。
- 空状态与错误状态未规范化;工作台信息架构复杂,版本与参数管理易混乱。
- 表单虽用Zod,微文案与就地校验策略未制定。
- 影响分析
- 认知负荷与失败率上升;等待体验差;可发现性与一致性不足;表单提交成功率受影响。
- 改进建议
- 关键页面采用向导式流程,分步呈现复杂配置与参考素材;差分预览与A/B测试在Beta阶段引入。
- 设计统一反馈模式:分段进度条、任务队列、通知中心、可重试与回滚。
- 为空态提供教学指引与模板,错误给出修复路径;工作台采用标签分组、面板折叠、版本比较与差分视图。
- 表单就地校验、错误定位与示例占位;提供快捷键操作(保存/提交)。
- 优先级与评分
- 优先级:高
- 评分:6.5/10
**视觉一致性**
- 发现问题
- 多UI库混用导致视觉语言不统一;图标/插画风格未定义。
- 排版层级与栅格系统未明确;资产预览比例与裁剪规则缺失。
- 语义色与品牌色关系未固化。
- 影响分析
- 品牌认知弱化、界面风格漂移;阅读效率与布局稳定性下降;状态识别混淆。
- 改进建议
- 统一图标集与插画风格,定义字号/行高/字重刻度与8pt栅格;统一缩略图比例(如16:9/1:1),骨架屏加载。
- 建立语义色体系并做可访问对比度校验。
- 优先级与评分
- 优先级:中高
- 评分:6/10
**响应式设计**
- 发现问题
- 生成编排页在移动端复杂,缺少移动优先的结构重排与容器查询策略。
- 触控目标与手势未定义;表格/长列表的虚拟化与密度调节策略不明。
- 设备测试矩阵未覆盖关键页面。
- 影响分析
- 小屏可用性显著下降,误触与性能风险上升;关键路径回归难以保障。
- 改进建议
- 移动优先重排:底部固定操作区、步骤化流程、侧栏转抽屉或底部栏;采用容器查询切换布局模式。
- 触控目标≥44px、手势提示与可发现性;表格在小屏切换卡片视图,密度切换、分页与虚拟滚动。
- 建立设备矩阵与页面用例(登录/工作台/生成/发布)进行真机抽样测试。
- 优先级与评分
- 优先级:中
- 评分:6/10
**动效与性能**
- 发现问题
- 动效规范缺失(层级、时长、缓动与场景);未考虑 `prefers-reduced-motion`。
- 长任务占位与渐进反馈未定义;性能约束与实现指南(避免布局抖动)未明确。
- 监控虽提Web Vitals,但缺少动效预算与回归基线。
- 影响分析
- 体验不一致、卡顿与INP波动;敏感用户体验不友好;难以治理动画泛滥。
- 改进建议
- 建立动效级别(微动效/过渡/强调)、时长150–250ms、ease-out曲线与适用场景;尊重系统设置并提供动画强度开关。
- 使用骨架屏、分段进度、局部刷新与通知;优先 transform/opacity、采用FLIP、节流/去抖。
- 设定动效预算与回归基线(INP阈值、关键路径动画数量上限),纳入监控报表。
- 优先级与评分
- 优先级:中
- 评分:6.5/10
**综合评级**
- 设计系统规范:5.5/10
- 交互与体验:6.5/10
- 视觉一致性:6/10
- 响应式设计:6/10
- 动效与性能:6.5/10
- 综合:6.1/10(方向正确但规范与细节需补齐;优先完善设计系统与关键路径UX)
**优先级评估与行动建议**
- 高优先级
- 统一UI栈与设计令牌,输出组件状态矩阵与WCAG规范。
- 为“生成编排/工作台”设计向导与统一反馈(进度/队列/通知/可重试),完善空/错态。
- 中高优先级
- 固化视觉语言(排版/图标/语义色),统一资产比例与骨架屏。
- 中优先级
- 强化移动端布局模式与容器查询策略,建立设备测试矩阵与触控准则。
- 建立动效规范与性能预算,尊重 `prefers-reduced-motion`,制定INP目标与回归清单。
说明
- 项目规范文件未给出明确评分标准,以上评级依据通行UI设计规范(设计系统、A11y、响应式与性能等维度)进行量化;可按需将评分刻度与阈值纳入团队质量门槛与验收标准。
1.3 项目文档修订
将 1.2 中的【补充意见】发给 TRAE,让它根据评审意见进行修订。
根据 AI 提示,确认产品文档的待确认事项后,项目文档被再次更新。
执行计划之后,项目文档完成最终更新。
1.4 前后端接口规范文档制定
在分别开启前后端开发任务之前,我们先生成一个统一的前后端接口文档。
前后端接口文档生成:
1.5 UI 设计
新开一个任务窗口,召唤 UI 设计师智能体。
截取即梦 AI 主页图片,让 UI 工程师根据截图和项目文档进行主页设计。
UI 设计文档生成完成:
阶段小结
至此,我们已生成以下项目文档:
项目实施
2.1 前端编码
开启一个新任务,进行前端编码。在提示词中引入【阶段小结】部分的 3 个项目文档。
直接召唤对应的智能体开始编码(记得打开 MAX 模式)。
2.2 后端编码
开启一个新任务,进行后端编码。在提示词中引入【阶段小结】部分的 3 个项目文档。
直接召唤对应的智能体开始编码。(记得打开 MAX 模式)。
后端接口第一版完成✅
2.3 多任务并行编码
经过上面 2 个步骤后,可以在 TRAE 左侧看到 2 个并行的编码任务。
主页优化
后端暂时不进行验证和优化,先来看第一版前端页面(左)与竞品(右)的对比:
初步评估:框架已搭建完成,但还需要细化优化 🤔
借助 Google Stitch 生成主页原型
使用 Google 的 Stitch 工具帮助生成主页的大致样式:
将 Google 生成的页面导出,放到项目中。
参考给定的 HTML 生成主页:
第一次 主页优化
效果评估:有点意思了。但由于照片缺失,页面不太美观,需要补充真实照片。
第二次优化:增加图片
从即梦主页获取一些图片,然后放到项目中。
优化后效果:
第三次优化:调整间距
图片之间还有缝隙,让 TRAE 继续优化。
通过【选择元素】功能选中需要修改的组件,去掉图片之间的空隙。
优化后效果:
我们的产出 (左)VS 竞品(右)
评估结论:味道对了,但还需要继续打磨...
实验总结
网站的迭代还有很长的路(后端没调,主页只是初步完成)。
初步体验了多智能体多任务协同,后面感觉可以让 SOLO Coder 生成不同的任务简报,然后新建任务,直接复制粘贴简报,直接运行。
SOLO Coder 如果能够自己创建新的任务窗口并执行,那就更好了。

