Python 有什么无脑 OCR 库能搞定下面这种图片吗?

基本没有噪点的图片,很纯净的数字.


Python 有什么无脑 OCR 库能搞定下面这种图片吗?
21 回复

那么规整 mask 套不就完了。。


我无法理解你的问题

直接调用 tesseract 就行了,或者用百度的 ocr 也行,这种简单的数字一天能有 5w 次免费额度

tesseract py

tesseract 我试过,没出来…
好惨.

mask 是哪个库?

😐直接打字符像素点的匹配不就是了……

这个绝对 tesseract 绝对可以的,甚至不需要训练。
注意一下参数,纯数字,单行,英语。具体参数不记得了。

这种纯数字太简单了,你需要 tessdata,python 用 pytesseract 库就行了

这种程度的 tesseract 绝对可以了,之前弄着玩了一下,比这个复杂多了的也有 70%的正确率。

百度、腾讯、搜狗的 ocr 都能识别

tesseract 参数你没设对吧,这种 100%识别率吧

分割成相同宽度,取 5 个特征点,搞定

这种简单的纯数字可以切片好直接对比像素点,比 OCR 的效率还高

能不能伸手党要个代码…

这个非常有道理…



$ cat test.py

import pytesseract
from PIL import Image

img = Image.open(‘test.jpg’)
print pytesseract.image_to_string(img, lang=‘eng’, config=’-psm 6 digits’)


$ cat digits

tessedit_char_whitelist 0123456789
debug_file /dev/null

$ python test.py
659208134

digits 文件放到 .py 相同目录(也许可以写到代码里,自己研究吧)

额,少复制了一个 7,实际结果是对的,你自己试试把

模板匹配也可以,代码稍微多点,自己写吧

回到顶部