Python 有什么无脑 OCR 库能搞定下面这种图片吗？

基本没有噪点的图片,很纯净的数字.

gougou168 1楼

那么规整 mask 套不就完了。。

sinazl 2楼

直接调用 tesseract 就行了，或者用百度的 ocr 也行，这种简单的数字一天能有 5w 次免费额度

phonegap100 3楼

tesseract

nodeper 4楼

tesseract py

gougou168 5楼

tesseract 我试过,没出来…
好惨.

vueper 6楼

mask 是哪个库?

bupafengyu 7楼

😐直接打字符像素点的匹配不就是了……

phonegap100 8楼

这个绝对 tesseract 绝对可以的，甚至不需要训练。
注意一下参数，纯数字，单行，英语。具体参数不记得了。

nodeper 9楼

这种纯数字太简单了，你需要 tessdata，python 用 pytesseract 库就行了

gougou168 10楼

这种程度的 tesseract 绝对可以了，之前弄着玩了一下，比这个复杂多了的也有 70%的正确率。

wuwangju 11楼

百度、腾讯、搜狗的 ocr 都能识别

yuanlaile 12楼

tesseract 参数你没设对吧，这种 100%识别率吧

yibo5220 13楼

分割成相同宽度，取 5 个特征点，搞定

caililin 14楼

这种简单的纯数字可以切片好直接对比像素点，比 OCR 的效率还高

sinazl 15楼

能不能伸手党要个代码…

phonegap100 16楼

这个非常有道理…

htzhanglong 17楼

$ cat test.py

import pytesseract
from PIL import Image

img = Image.open(‘test.jpg’)
print pytesseract.image_to_string(img, lang=‘eng’, config=’-psm 6 digits’)

$ cat digits

tessedit_char_whitelist 0123456789
debug_file /dev/null

$ python test.py
659208134

digits 文件放到 .py 相同目录（也许可以写到代码里，自己研究吧）

vueper 18楼

额，少复制了一个 7，实际结果是对的，你自己试试把

phonegap100 19楼

模板匹配也可以，代码稍微多点，自己写吧

htzhanglong 20楼

https://blog.csdn.net/weixin_39198406/article/details/85808544

tesseract 100%