

Lybic 发布 LangChain 版本 Demo

灵臂Lybic

2025-08-22

导读：Lybic 发布 LangChain 版本 Demo

我们又上新啦！

👉 GitHub 地址：https://github.com/lybic/demo-lybic-with-langchain-gradio

今天，我们将教会你如何在LangChain中搭建一个自己的“贾维斯”（可以自主操作界面并完成任务的智能体）。让它能够“看屏幕 → 思考 → 执行操作”，并实时返回执行结果。“帮我订一张下周二洛杉矶飞亚特兰大的机票。”像这样的一句话丢给电脑后，剩下的全部自动完成。

🔧 技术栈组成

1. Lybic SDK

提供 GUI 沙盒环境（LybicSandbox），支持获取桌面截图，执行点击、键盘输入等操作。

2. LangChain

负责LLM的接入和扩展。

3. Gradio

构建轻量级 Web 界面，提供输入框、输出区和实时截图展示。

4. Python

开发Agent循环的语言。

📦 快速启动

启动后，Gradio 界面将会运行在本地：

👉 http://127.0.0.1:7860

如果设置 share=True，还可生成公开链接，便于演示或远程协作。

⚙️ 核心执行流程

在项目中，Agent 的运行机制可以抽象为以下循环：

1. 输入处理

用户在 Gradio 界面输入自然语言指令；

Lybic SDK 捕获当前屏幕截图，作为上下文输入。

2. 推理生成

LangChain接收：

用户输入
桌面截图（Image）
历史对话（History）
系统提示（Prompt Template）

3. 输出：

动作执行

完成后返回新的截图和执行日志。
循环迭代

Agent 继续基于最新状态推理，直到任务完成或用户中断。

🖼️ Gradio 界面优化

为了增强可视化体验，Demo 对 Gradio 聊天组件做了扩展：

Markdown 渲染：将屏幕截图以内联图片的形式展示在聊天记录中；
多输出支持：同时返回文本结果与图片，提高可读性；
实时性：每轮交互均展示 Thought/Action 与截图，方便调试。

界面效果：输入“打开记事本并输入 Hello”，即可看到 Agent 在沙盒中逐步执行，且每一步截图实时出现在界面中。

💡 Lybic可以让你

多模态输入：文本 + 图像同时作为 LLM 输入，提升任务理解能力；
可复现性：标准化 Prompt Template 与 Action Space，便于扩展与研究；
易部署：Gradio 界面极简启动，无需额外前端开发；
开放生态：结合 LangChain，开发者可自定义 Agent 逻辑、记忆和工具调用。

📂 更多玩法

完整源码与使用说明 👉 https://github.com/lybic/demo-lybic-with-langchain-gradio （点击底部的阅读原文可快速到达）

你可以基于此 Demo：

学习AI Agent的原理、langchain，gradio的基本用法，打造属于自己的Agent
替换成自己的 LLM（如 GPT-4o、Claude、国产大模型等）；
接入更多 Gradio 组件（如文件上传、对话历史保存）。

🔭 总结

此次发布的 LangChain 版本Demo，展示了 GUI Agent 的最小可行架构：

LangChain + LLM 负责智能推理
Lybic 提供安全可控的 GUI 沙盒
Gradio 实现可视化交互与调试

Lybic为开发者在自动化、GUI Agent搭建等场景，提供了一个简洁而可扩展的起点。

🎇号外

关注我们，私信留言“关注福利”有惊喜噢。往后我们还会不定期发送福利噢。

【声明】内容源于网络

灵臂Lybic

我是一个专为AI Agent提供「图形界面操作能力」的云端基础设施平台，为开发者提供即开即用的云端工作站——云端电脑、手机、浏览器、开发环境一键启用。

内容 10

粉丝 0

灵臂Lybic 我是一个专为AI Agent提供「图形界面操作能力」的云端基础设施平台，为开发者提供即开即用的云端工作站——云端电脑、手机、浏览器、开发环境一键启用。

总阅读12

粉丝0

内容10