Golang Go语言中识别图片中的文字与数字
Golang Go语言中识别图片中的文字与数字
大佬们,我想识别一个图片中的数字,他是网页上的我想给他截图保存下来。然后用程序去识别他里面的数字。请问这个识别率高的库都有什么?
Google mnist PyTorch, 大把代码跑到 9X%+,X 大概是 5678
更多关于Golang Go语言中识别图片中的文字与数字的实战系列教程也可以访问 https://www.itying.com/category-94-b0.html
百度智能云 ocr 识别 api,一天很多次免费额度
试试 PandaOCR 各种 OCR 引擎自个挑
但如果想要离线库那没啥可推荐的,识别效果基本都不如在线的
你放在 go 这个主题下,让我不晓得怎么回答。
第一你这里的截图是什么样的不知道,不晓得识别难度。如果是比较规整的,肯定比歪歪斜斜的好识别。沙发说什么 9X%我觉得可能是微信号看多了。谷歌最赚钱的 youtube 的机器翻译也只能适合慢速不带口音的翻译。稍微复杂一点的情况,错误也会频繁出现。
如果你懂 DL/CV,可以看看 attentionOCR 这种端到端的模型,在歪斜形变的场景也能保持一定的识别率。但是问题是没有中文的训练数据,英文数字应该有。有个同事做过这方面的事情,我有点耳闻。
谷歌有过一个识别规整英文数字验证码的开源方案,比较老了,叫 tesseract (对,就是雷神那个东西)。你可以试试。我们这边做验证码识别不太行。
图片是带有颜色的,绿色黄色橙色等根据数字大小来确定颜色。主要是想用 go 写就发在这里了。识别内容就是数字。到现在我也不会在 V2EX 上发图片。要不就发图了
如果只是英文和数字,github.com/otiai10/gosseract 这个应该是可以的。中文的话,基础的模型识别效果都不太好
在Golang中识别图片中的文字与数字,通常会用到光学字符识别(OCR)技术。虽然Go语言本身不直接提供OCR功能,但你可以借助一些成熟的OCR库或API来实现这一需求。
一个流行的选择是使用Tesseract OCR库,这是一个开源的OCR引擎,支持多种语言的字符识别。为了在Go中使用Tesseract,你可以通过cgo调用C语言接口,或者使用一些Go语言的封装库,如github.com/otiai10/gosseract
。这些库提供了方便的接口来加载图片、执行OCR识别以及获取识别结果。
此外,还有一些云服务提供商提供了OCR API,如Google Cloud Vision、AWS Rekognition和Microsoft Azure Computer Vision等。这些服务通常提供了强大的OCR功能,并支持多种语言和字符集。你可以通过HTTP请求调用这些API,并在Go中处理返回的JSON格式的结果。
选择哪种方法取决于你的具体需求,包括识别的准确性、处理速度、是否需要处理特定语言或字符集,以及你的预算和基础设施。
如果你选择使用Tesseract或类似的开源库,可能需要一些额外的设置和配置工作。而使用云服务API则通常更加简单快捷,但可能会增加你的运营成本。
总之,在Go语言中实现图片中的文字与数字识别是可行的,但需要根据你的具体需求选择合适的OCR技术。