大数跨境
0
0

在Cherry Studio中使用PaddleOCR

在Cherry Studio中使用PaddleOCR Cherry Studio-千彗科技
2025-12-02
4

PaddleOCR 是百度飞桨推出的文字识别与文档解析开发套件,能够将各类文档与图像高效转换为结构化、AI 友好的数据格式(如 JSON 和 Markdown),并凭借行业领先的识别精度,为全球开发者、初创团队及大型企业的 AI 应用提供强大支持。PaddleOCR 提供覆盖全场景的高精度文字识别能力,其最新的文字识别方案具备以下亮点:

  1. 1. 🌐 单模型支持五种文字:可同时识别简体中文繁体中文中文拼音英文日文
  2. 2. ✍️ 手写体识别能力增强:针对复杂连笔、非规范字迹等场景,识别性能显著提升。
  3. 3. 🎯 整体精度大幅提升:在多种应用场景中达到 SOTA(State-of-the-Art)精度,相比上一代方案,识别准确率提升达 13 个百分点

目前,PaddleOCR 已与 Cherry Studio 深度集成。本文将重点介绍如何在 Cherry Studio 的翻译应用中调用 PaddleOCR 的 PP-OCRv5 文字识别能力,用于提取图像中的文本内容。除了基础的文字识别功能外,PaddleOCR 还支持更复杂的文档解析任务,提供包括流水线式的 PP-StructureV3 以及多模态大模型 PaddleOCR-VL 在内的多种方案。这些高级能力也将陆续集成到 Cherry Studio 中,为用户带来更全面的文档智能处理体验。关于PaddleOCR 的更多信息,可参阅其官方仓库:https://github.com/PaddlePaddle/PaddleOCR

配置与使用步骤

进入 OCR 服务设置

在 Cherry Studio 设置界面中,依次选择「文档处理」→「OCR 服务」。

配置 PaddleOCR 服务

将 OCR 服务提供商设置为 PaddleOCR,并填写对应的 API URL 及飞桨星河社区的访问令牌。API URL 可使用 PaddleOCR 官方服务,也支持用户通过星河社区或本地自行部署的服务地址。以下主要介绍官方服务调用方式。如需自建服务,请参考 PaddleOCR 服务化部署文档

2.1 获取 API URL

  • 访问 PaddleOCR 官网任务页
  • 点击左上角「API」,选择「文字识别(PP-OCRv5)」,复制显示的 API_URL

2.2 获取访问令牌

  • 在 星河社区令牌页面 获取访问令牌。

启动翻译应用

点击 Cherry Studio 界面左上角的「+」按钮,打开「翻译」应用。

上传图像并识别文本

点击左下角的「+」上传待翻译的图像文件,系统将自动调用 PaddleOCR 进行处理。

查看识别结果并翻译

OCR 处理完成后,左侧文本框将显示从图像中提取的文本内容,如下图所示。随后可将其翻译为目标语言。


【声明】内容源于网络
0
0
Cherry Studio-千彗科技
Cherry Studio 是一款简单高效的一站式 AI 应用系统,帮助用户通过 AI 技术提高工作效率,享受 AI 带来的便捷。
内容 92
粉丝 0
Cherry Studio-千彗科技 Cherry Studio 是一款简单高效的一站式 AI 应用系统,帮助用户通过 AI 技术提高工作效率,享受 AI 带来的便捷。
总阅读124
粉丝0
内容92