最好用的开源OCR文字识别项目，没有之一！

2024 年 01 月 05 日

121 次浏览

暂无评论

1475字数

简介

下面是项目在Github上的官方介绍。

项目是基于PaddleOCR开发的，支持截图识别、批量导入识别、个性化识别等功能。

整个项目都是用Python编写的，所以win7系统的朋友们可能用不了。推荐使用Win10 x64及以上版本。

体验

直接在releases中选择合适的版本，下载解压即可。

下面就是工具的界面。

接下来给大家展示一下它的亮点功能：

截图识别

这个功能很适合在一些不能复制的网页上使用，速度很快，准确率也很高。

也就是说，你可以一次性截取所有的图片，然后再从记录板里复制所有识别出来的文字，不需要一张一张地截取和复制。

批量识别

如果有很多图片需要识别，这个功能非常好用。

只需要将所有的图片导入，然后点击开始任务，就可以批量识别了。

完成之后，识别的内容会保存在一个txt文档中。

如果你不喜欢txt，需要md、jsonl 的格式，它一样可以满足你。

自定义识别内容
这个功能是Umi-OCR的一大亮点，可以指定识别的内容区域，或者屏蔽掉不需要识别的区域。

比如说，我有三张和下图类似的图片，我只希望提取出发票号码。

只需要在设置里点击打开忽略区域编辑器，将不需要的内容用红框框起来。

然后点击开始任务即可。

更多细节功能，可以自行去项目地址探索~

GitHub地址：https://github.com/hiroi-sora/Umi-OCR

最好用的开源OCR文字识别项目，没有之一！

TT • 2024 年 01 月 05 日

最好用的开源OCR文字识别项目，没有之一！

简介

体验

截图识别

批量识别

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

PVE自动启动虚拟机 | 容器顺序设置及参数说明

OpenWRT 路由配置技巧(PPTP VPN+断线自动重连+chnroutes国内路由表)

常用VPS脚本【合集-不定期更新】

优选 Cloudflare 官方 / 中转 IP

太强了，推荐7个牛哄哄 Spring Cloud 实战项目，拿来即用（附源码）

Watchtower - 自动更新 Docker 镜像与容器

520表白html页实现3D动态相册

发卡宝自动发卡系统源码最新版

为什么魂斗罗只有128KB却可以实现那么长的剧情？

Linux 命令复习

最好用的开源OCR文字识别项目，没有之一！

简介

体验

截图识别

批量识别

发表评论 取消回复 使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

最好用的开源OCR文字识别项目，没有之一！

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款