大数跨境
0
0

Lybic 发布 LangChain 版本 Demo

Lybic 发布 LangChain 版本 Demo 灵臂Lybic
2025-08-22
0
导读:Lybic 发布 LangChain 版本 Demo
我们又上新啦!
👉 GitHub 地址:https://github.com/lybic/demo-lybic-with-langchain-gradio

今天,我们将教会你如何在LangChain中搭建一个自己的“贾维斯”(可以自主操作界面并完成任务的智能体)。让它能够“看屏幕 → 思考 → 执行操作”,并实时返回执行结果。“帮我订一张下周二洛杉矶飞亚特兰大的机票。”像这样的一句话丢给电脑后,剩下的全部自动完成。
🔧 技术栈组成
1. Lybic SDK
提供 GUI 沙盒环境(LybicSandbox),支持获取桌面截图,执行点击、键盘输入等操作。
2. LangChain
负责LLM的接入和扩展。
3. Gradio
构建轻量级 Web 界面,提供输入框、输出区和实时截图展示。
4. Python
开发Agent循环的语言。
📦 快速启动
启动后,Gradio 界面将会运行在本地:
 👉 http://127.0.0.1:7860
如果设置 share=True,还可生成公开链接,便于演示或远程协作。
⚙️ 核心执行流程
在项目中,Agent 的运行机制可以抽象为以下循环:
1. 输入处理
 用户在 Gradio 界面输入自然语言指令;
 Lybic SDK 捕获当前屏幕截图,作为上下文输入。
2. 推理生成
 LangChain接收:
  • 用户输入
  • 桌面截图(Image)
  • 历史对话(History)
  • 系统提示(Prompt Template)
3. 输出:
  1. 动作执行
  1. 完成后返回新的截图和执行日志。
  2. 循环迭代
Agent 继续基于最新状态推理,直到任务完成或用户中断。
🖼️ Gradio 界面优化
为了增强可视化体验,Demo 对 Gradio 聊天组件做了扩展:
  • Markdown 渲染:将屏幕截图以内联图片的形式展示在聊天记录中;
  • 多输出支持:同时返回文本结果与图片,提高可读性;
  • 实时性:每轮交互均展示 Thought/Action 与截图,方便调试。

界面效果:输入“打开记事本并输入 Hello”,即可看到 Agent 在沙盒中逐步执行,且每一步截图实时出现在界面中。
💡 Lybic可以让你
  • 多模态输入:文本 + 图像同时作为 LLM 输入,提升任务理解能力;
  • 可复现性:标准化 Prompt Template 与 Action Space,便于扩展与研究;
  • 易部署:Gradio 界面极简启动,无需额外前端开发;
  •  开放生态:结合 LangChain,开发者可自定义 Agent 逻辑、记忆和工具调用。
📂 更多玩法
完整源码与使用说明 👉 https://github.com/lybic/demo-lybic-with-langchain-gradio (点击底部的阅读原文快速到达)
你可以基于此 Demo:
  • 学习AI Agent的原理、langchain,gradio的基本用法,打造属于自己的Agent
  • 替换成自己的 LLM(如 GPT-4o、Claude、国产大模型等);
  • 接入更多 Gradio 组件(如文件上传、对话历史保存)。
🔭 总结
此次发布的 LangChain 版本Demo,展示了 GUI Agent 的最小可行架构:
  • LangChain  + LLM 负责智能推理
  • Lybic 提供安全可控的 GUI 沙盒
  • Gradio 实现可视化交互与调试

Lybic为开发者在自动化、GUI Agent搭建等场景,提供了一个简洁而可扩展的起点。

🎇号外
关注我们,私信留言“关注福利”有惊喜噢。往后我们还会不定期发送福利噢。


【声明】内容源于网络
0
0
灵臂Lybic
我是一个专为AI Agent提供「图形界面操作能力」的云端基础设施平台,为开发者提供即开即用的云端工作站——云端电脑、手机、浏览器、开发环境一键启用。
内容 10
粉丝 0
灵臂Lybic 我是一个专为AI Agent提供「图形界面操作能力」的云端基础设施平台,为开发者提供即开即用的云端工作站——云端电脑、手机、浏览器、开发环境一键启用。
总阅读12
粉丝0
内容10