大数跨境
0
0

使用Agent制作一个带视频演示的科普教学页面

使用Agent制作一个带视频演示的科普教学页面 路上侠客
2025-06-03
0
导读:今天我们演示如何利用多个 AI 工具协同工作,制作一个包含科普视频的 HTML 教学页面。

今天我们演示如何利用多个 AI 工具协同工作,制作一个包含科普视频的 HTML 教学页面。

先来看一下最终页面的部分效果,在线体验链接:

https://roadheroai.com/科普/为什么蚊子老是追着黑衣服的人跑.html

制作流程

第一步:设计科普页面 HTML 结构 (使用 Deepseek 或 Gemini)

首先,我们需要设计科普页面的基本 HTML 结构和样式。我们可以在 Deepseek 或 Google AI Studio (Gemini) 中输入以下提示词来获取初步的 HTML 框架:

## 角色与目标 (Role & Goal)

你是一位 AI 文档转化与可视化专家

你的 核心目标 是将各类结构化或半结构化源文档(如财务报告、市场分析报告、产品规格手册、研究论文摘要等)高效转换为一个 单一、自包含、高度动态且具备现代设计美学的 HTML 文件

此 HTML 文件需:

  • 设计风格:
     借鉴 Apple 设计语言,追求 简洁、优雅、直观 的视觉体验,注重排版、留白和色彩运用。
  • 信息层级:
     具备 极清晰的信息架构,确保用户能快速理解内容主次和核心观点。
  • 兼容性:
     可在所有现代桌面和移动浏览器中 完美渲染并流畅运行,无需任何外部本地文件依赖(CDN 库除外)。
  • 语言:
     所有输出内容(包括界面文本、注释等)均使用 简体中文

## 核心能力与执行流程 (Core Capabilities & Execution Flow)

请严格按照以下步骤和能力要求执行:

          1. 深度文档解析与多维信息提取 (Deep Document Parsing &             Multi-dimensional Information Extraction)
    • 核心发现 (Core Findings) 与洞察 (Insights)
    • 关键数据点 (Key Data Points): 特别关注财务指标(如收入、利润、增长率)、市场份额、用户数据、KPIs、趋势数据等。
    • 结构化信息 (Structured Information): 表格、定义列表、流程步骤、组织架构等。
    • 图表数据源 (Data for Visualization): 识别并提取适合用图表展示的原始数据系列。
    • 核心结论 (Key Conclusions) 与行动建议 (Actionable Recommendations)
    • 智能读取: 支持多种常见文档格式作为输入源(如 .txt, .md, .json, .csv,或直接粘贴的文本内容)。
    • 内容理解: 深入理解源文档的语义和结构。
    • 精准提取

      2. 智能语义理解与要点原子化 (Intelligent Semantic Understanding & Point Atomization)
    • 上下文感知: 运用强大的自然语言处理 (NLP) 能力,理解段落和列表中的复杂逻辑关系。
    • 要点拆分: 将包含多个并行或层级要点、风险因素、产品特性、操作步骤的段落或列表,智能地拆分成 逻辑独立、语义清晰的“核心要点” (Atomic Core Points)。每个核心要点应尽可能简洁明了。

      3. 动态、响应式与 эстетически привлекательный HTML 生成 (Dynamic, Responsive & Aesthetically Pleasing HTML Generation)
    • 排版: 清晰易读的字体选择(如苹方、思源黑体或系统默认无衬线字体),合适的字号、行高和段间距。
    • 色彩: 使用和谐、专业的调色板,避免色彩过于饱和或刺眼,可参考 Apple 产品页面的用色。
    • 布局: 采用响应式设计,确保在不同屏幕尺寸下均有良好阅读体验。运用卡片式设计、网格布局等现代布局技巧。
    • 图标: 适当使用 SVG 图标(内联或通过 data URI)增强视觉表达。
    • 数据点提示 (Tooltips): 为图表数据点或关键术语提供悬停提示。
    • 可折叠/展开区域 (Collapsible Sections): 用于组织大量信息,允许用户按需查看详情。
    • 平滑滚动导航 (Smooth Scrolling Navigation): 如果文档较长,可考虑添加目录或侧边栏导航。
    • 轻量动画/过渡 (Subtle Animations/Transitions): 增强用户体验,但避免过度使用。
    • 所有 JavaScript 代码需包含在 <script> 标签内。
    • CDN 引入: 明确指出需要通过 CDN 引入的库(如 Chart.js)。提供具体的 CDN 链接。
    • 交互增强:
    • Chart.js 初始化与更新逻辑。
    • 首选方案: 大量使用 Tailwind CSS 的功能类 (utility classes) 直接内联到 HTML 元素中,以实现模块化和高效样式管理。
    • 备用方案: 对于无法通过 Tailwind 类直接实现的复杂或全局样式,可使用单个 <style> 标签包裹。
    • 设计细节:
    • 单一文件输出: 严格生成 单一 .html 文件。所有 HTML 结构、CSS 样式和 JavaScript 逻辑都必须内嵌在该文件中。
    • HTML5 结构: 使用语义化的 HTML5 标签 (e.g., <article>, <section>, <aside>, <figure>, <table>) 构建文档结构,确保可访问性 (Accessibility) 和搜索引擎友好性 (SEO)。

      4. 高级数据可视化与整合 (Advanced Data Visualization & Integration)
    • 清晰的标签: 图表标题、坐标轴标签、图例都需清晰且使用简体中文。
    • 配色: 与整体设计风格一致,确保数据可读性。
    • 交互性: 启用 Chart.js 的内置交互功能(如悬停显示数据点详情)。
    • 图表库: 必须使用 Chart.js(通过 CDN 引入)。
    • 智能图表选择: 根据提取的数据特性(如时间序列、类别比较、占比分布、相关性),自动或推荐选择最合适的图表类型。
    • 无缝嵌入: 将生成的图表自然地嵌入到 HTML 文档的相关内容区域,确保图表响应式,并能适应不同视口大小。

## 输出格式与规范 (Output Format & Specifications)

  • 最终交付物: 一个 独立的、完整的 .html 文件
  • 编码: UTF-8。
  • 语言: 所有可见文本内容均为 简体中文
  • 代码质量: 生成的 HTML, CSS, 和 JavaScript 代码应结构清晰、易于理解,并有适当的注释(尤其是 JS 初始化逻辑)。

## 技术栈与库偏好 (Tech Stack & Library Preferences)

  • 核心可视化库: Chart.js (通过最新稳定版 CDN 引入)。
  • CSS 框架: Tailwind CSS (通过 CDN 引入或直接使用其类名,优先内联类名)。
  • JavaScript: 优先使用原生 JavaScript (Vanilla JS) 实现简单交互。若需复杂功能,可考虑轻量级、无依赖的库 (通过 CDN)。

## 示例场景 (Example Scenarios)

  • 输入一份季度财务报告的文本,输出一个包含关键财务数据摘要、增长趋势折线图、利润构成饼图的动态 HTML 页面。
  • 输入一份产品手册的核心特性列表,输出一个采用卡片式设计、每个特性配有说明和可选图标的交互式 HTML 页面。
  • 输入一份市场调研报告的摘要,输出一个包含市场规模条形图、竞争对手份额雷达图以及核心洞察列表的 HTML 报告。

## 关键成功指标 (Key Success Metrics)

  • 信息准确性: 100% 准确反映源文档的核心信息和数据。
  • 视觉吸引力: 达到专业、现代的(Apple 风格)设计水准。
  • 信息易读性: 用户能轻松理解信息层级和核心要点。
  • 功能完整性: 所有交互元素(如图表、折叠区域)按预期工作。
  • 性能与兼容性: 在主流现代浏览器中快速加载和正确显示。
  • 自包含性: 单一 HTML 文件,易于分发和查看。

第二步:上传科普内容文档

将事先准备好的科普内容文档(例如关于“为什么蚊子喜欢叮穿黑衣服的人”)上传给大模型。

第三步:保存生成的 HTML 页面

大模型会根据科普内容和设计要求,生成包含文本、图表(如果适用)和样式的 HTML 页面代码。将此代码保存为 .html 文件备用。

第四步:使用 Coze 空间嵌入视频

为了让科普页面更生动,我们计划嵌入一段相关的科普视频。这里我们使用字节跳动推出的 Coze 空间 (https://space.coze.cn/) 来辅助完成视频嵌入工作。

在 Coze 空间中新建一个任务或 Bot。

将之前保存的 HTML 页面代码(或直接上传 HTML 文件)和预先制作好的科普视频上传到 Coze 空间。然后输入提示词,要求 Coze 将视频嵌入到 HTML 页面中:

“将上面的视频整合到生成的HTML(或附件中的HTML代码),输出一个带嵌入视频的Html页面”。

Coze 会处理请求,并将视频嵌入到 HTML 页面的适当位置。

第五步:部署与文件结构

将最终生成的包含嵌入视频的 HTML 文件和视频文件(例如 .mp4)放置在同一个文件夹目录下。如果是在网站上部署,确保 HTML 文件中的视频路径指向正确。

例如,如果 HTML 文件和视频文件都放在名为“科普”的文件夹下,HTML 中的视频标签 `

HTML 代码中嵌入视频的示例代码块:

视频制作说明

本示例中的科普视频是使用“豆包”AI 工具生成的。提示词示例:

“1-2分钟的科普动画视频,解释蚊子为什么特别容易被黑色吸引。视频采用明亮活泼的动画风格,结合少量实拍镜头。开头展示一个穿着黑色T恤的人不断被蚊子叮咬的烦恼场景,引发观众共鸣。画面中不要有任何文字出现,比例 「16:9」”。

可能需要生成多段视频,然后使用视频剪辑软件(如剪映)进行后期拼接和编辑。

补充知识:扣子空间 (Coze) 介绍

扣子空间 (space.coze.cn) 是字节跳动推出的通用 AI 智能体 (Agent) 平台,其核心定位是通过 AI 与人类协作来解决办公场景中的复杂任务,并致力于构建一个开放的 Agent 生态系统。

一、核心功能与技术架构

  • 双模式任务执行机制:
    • 探索模式:
       AI 自主快速响应,适用于临时性、相对简单的任务(如文档初步生成、数据快速查询),通常耗时较短(4-10分钟)。
    • 规划模式:
       针对复杂任务(如深度行业报告撰写、复杂数据分析),AI 会先进行任务拆解,并允许用户在关键节点进行干预和调整,耗时相对较长(15-30分钟)。
  • 工具扩展与 MCP 协议:
    • 已内置集成多种实用工具,如飞书文档、高德地图、墨迹天气、语音合成等。
    • 支持通过 MCP (Model Context Protocol) 协议实现标准化的外部工具接口扩展,这有助于降低第三方工具的接入和开发成本。
    • 未来计划开放开发者生态,允许开发者发布和共享自定义插件。
  • 双轨服务矩阵:
    • 通用 Agent:
       处理日常办公中常见的重复性或辅助性任务(如 PPT 初稿生成、简单网页开发),旨在降低普通用户的技术门槛。
    • 专家 Agent:
       针对特定垂直领域提供专业服务,例如已有的“华泰A股观察助手”(金融分析)、“用户研究专家”(调研报告撰写)等。

二、典型应用场景与案例

办公场景

  • 文档生成:
     用户可以通过自然语言指令,让 Coze 生成图文并茂的行业分析报告、PPT 演示文稿等,并支持导出为 Markdown、网页、PDF 等多种格式。
  • 数据处理与分析:
     能够自动从指定来源(如网页)抓取数据(例如股票信息)并整理成表格,或者对用户上传的调研问卷数据进行初步分析并生成报告。
  • 示例:
     用户输入“帮我生成一个关于小米 SU7 的宣传网站”,Coze Agent 可以自动搜索产品信息、设计网页结构并生成初步的网页代码,整个过程可能耗时约 5 分钟。

生活场景

  • 个性化服务:
     结合外部工具(如天气预报),可以提供个性化的建议,例如根据天气推荐合适的穿搭;或者抓取电商网站信息生成商品比价清单。
  • 创意与娱乐工具:
     用户可以利用 Coze 创建一些轻量级的互动内容,如简单的科普学习网页(例如介绍太阳系)、或者基础的小游戏(如贪吃蛇、Flappy Bird 的变种)。

金融垂类突破

  • “华泰A股观察助手”这类专家 Agent,可以根据用户的持仓和关注板块生成定制化的金融市场早报,进行数据分析,并在一定程度上结合定量计算来减少 AI 生成内容的“幻觉”。

三、优势与不足

优势

  • 效率提升:
     能自动化完成许多低价值、重复性的任务,如数据整理、初步的格式转换、基础内容生成等,从而节省用户时间。
  • 开放式架构与可扩展性:
     MCP 协议的引入,理论上可以打破不同工具和服务之间的生态壁垒,支持未来接入更多、更强大的第三方工具。

不足(早期版本可能存在)

  • 内容深度局限:
     对于需要高度专业知识和深度洞察的任务,AI 生成的内容可能仍停留在框架层面,细节和专业性有待提升(例如,生成的融资 PPT 可能缺乏深入的商业模式分析)。
  • 执行稳定性:
     在调用外部工具或执行复杂脚本时,可能会遇到 Python 调用失败、API 权限异常等偶发性技术问题,影响用户体验。

四、未来发展方向

  • 生态构建:
     持续吸引开发者入驻,丰富 MCP 插件库,覆盖更多行业和细分场景。
  • 商业化探索:
     目前部分专家 Agent 标注为“限时免费”,可能为后续的付费订阅模式或增值服务进行铺垫。
  • 技术优化:
     不断提升 AI 对复杂任务的拆解能力、生成内容的深度和准确性,逐步减少对人工干预的依赖。

需要更多免费AI工具、最新Ai信息、详细使用和丰富Ai教程、Ai变现方法的小伙伴可以加入 路上侠客的知识星球

一年会员,原价199元,现在只需 99元

【声明】内容源于网络
0
0
路上侠客
谈讨、研究、实践AI智能和跨境电商之间的联系和应用。旨在和科技浪潮对冲时产生一些火花,提高工作效率。网站:www.roadheroai.com
内容 818
粉丝 0
路上侠客 谈讨、研究、实践AI智能和跨境电商之间的联系和应用。旨在和科技浪潮对冲时产生一些火花,提高工作效率。网站:www.roadheroai.com
总阅读325
粉丝0
内容818