PondPilot 是一款免费开源、高性能、轻量级的数据探索工具,采用 DuckDB-Wasm 技术,集成 AI 助手,基于浏览器运行,可以用于分析本地或者远程数据集。
PondPilot 使用 TypeScript 语言开发,遵循 AGPL 3.0 开源协议,代码托管在 GitHub:
https://github.com/pondpilot/pondpilot
功能特性
-
• 隐私与安全:所有的数据处理过程都基于客户端浏览器,确保敏感数据的安全;支持 PWA 技术,可以离线使用;采用只读模式访问数据集,保证数据安全与完整性。 -
• 性能与效率:直接访问数据文件,而不是将数据复制到浏览器缓存,可以实时获取外部数据集的变更;采用 DuckDB 引擎,支持秒级分析百万数据行;数据处理和查询语句自动跨 session 保存。 -
• AI 助手:理解数据库结构,提供自然语言转 SQL 查询,自动修复 SQL 错误,支持 Claude、OpenAI 或者兼容 OpenAI 的大语言模型。
-
• 数据分析工具:支持多种数据格式,包括 CSV、Parquet、JSON、Excel、S3、Google Cloud Storage、Azure Blob Storage、DuckDB 数据库等;SQL 编辑器可以编写和执行查询语句,支持语法高亮、代码补全、错误检测等;支持查询结果的查看、过滤、排序。 -
• 数据导出:查询结果可以导出为 CSV、TSV、Excel、SQL、XML、Markdown 等格式文件。
-
• 模式比较:支持比较两个表的结构差异。
在线体验
PondPilot 提供了一个在线体验环境,网址如下:
https://app.pondpilot.io/
点击“Add file”开始加载数据源。
下载安装
使用 Docker 本地部署 PondPilot 的命令如下:
docker run -d -p 4173:80 --name pondpilot ghcr.io/pondpilot/pondpilot:latest
启动服务之后,在浏览中输入以下地址进行访问:
http://localhost:4173

