Python中如何将图片转为文本文件的脚本实现

Image transfer to txt

--

Usage

$ python3 img_to_txt.py [file/url] [size]

Example

$ python3 img_to_txt.py http://ocas9civ7.bkt.clouddn.com/jzm.jpg

This command executed, you will get a file in current folder named out.txt, and you will watch a string output in the console:

zz

Github 地址

https://github.com/yaochao/img_to_txt


Python中如何将图片转为文本文件的脚本实现

56 回复

+1,可以搞个 web 版的


要写一个将图片转成文本文件的脚本,主要就是用OCR(光学字符识别)库。Python里最常用的是pytesseract,它是Google Tesseract引擎的封装。

首先,确保你系统上安装了Tesseract OCR引擎。在Ubuntu上可以sudo apt install tesseract-ocr,macOS用brew install tesseract,Windows去官网下安装程序。

然后安装Python包:

pip install pytesseract Pillow

核心脚本很简单:

import pytesseract
from PIL import Image

# 如果你把Tesseract装在了非标准路径(比如Windows),需要指定
# pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'

def image_to_text(image_path, output_txt_path):
    # 打开图片
    img = Image.open(image_path)
    
    # 使用pytesseract提取文本
    text = pytesseract.image_to_string(img, lang='eng')  # 中文用 'chi_sim'
    
    # 写入文本文件
    with open(output_txt_path, 'w', encoding='utf-8') as f:
        f.write(text)
    
    print(f"文本已保存到 {output_txt_path}")

# 使用示例
image_to_text('input.png', 'output.txt')

这个脚本做了三件事:用PIL打开图片,用pytesseract.image_to_string()提取文字,然后把结果写到txt文件里。lang参数指定语言,英文是'eng',简体中文是'chi_sim'(需要额外下载中文训练数据)。

如果图片质量差或者排版复杂,识别效果可能不好。可以先对图片做预处理,比如转灰度、二值化、去噪等,用OpenCV或PIL就能搞定。

总结:用pytesseract配合Pillow就能快速实现图片转文本。

好东西,我选 jp2a

实现原理可以介绍下么?

兄弟要被查水表了

图片转字符画的 Python 项目在 GitHub 上已经有好多好多啦。

这个人缺一副眼镜

原理,很简单,通过图片的像素,转为响应的字符,颜色越深,字符越密集,所谓的密集就是 #一类的字符,不密集就是.,;一类的字符。

可以,下午茶有了,记得来取

月底了本来已经没名额了,楼主我还是想办法帮你弄了个名额,你在四月名单上了

莫不是内个膜法大师?

我之前也写了一个,把视频转换为字符画的:
https://github.com/MeiK-h/Video2Char

本来四月份的枪毙名单已经满了.我已经托关系把你放进去了

这个厉害了

#17 233 试试

curl aoaoao.me:1926

还有动画版的

666,fork 一发

来看照片的。蛤蛤。

借楼问问,有些是用 AV 封面底图拼成的图片是用哪个库实现的?

总想搞个大新闻

这个的实现恐怕太多了,自己在 GitHub 搜 photo mosaic 吧

还可以玩的更高级的,通过 cleartype 的次像素渲染让单色文字玩出彩色效果来

main 里那俩 assert 是干啥用的。。

真正的粉丝

为什么我点进这个帖子之后,我的系统时间走的比平时快

没有人把这个事情做得更极致一些吗。现在的还是太简单了。

你打算用来看电影么?

为什么要造轮子呢,我记得 mplayer 就能将视频转换为字符界面播放。。。。

我只是觉得用灰度匹配几个特定字符的做法太简单了。没想怎么去用它。如果能考虑轮廓曲线就更好了。

哦哦,那个考虑的多了啊

字符画,怎么不能动啊。my heart will go on and on

支持 gif 不。。

讲真,长者是真的有文化,不像我一个乡下土包子,一边上网一边查字典,旁边还得放一本怎样查字典

话说,你的终端还能输出 emoji 表情吗

一看就知道是谁,是不是该治疗了

楼主,五月的枪毙名单了解一下

不過還真可以這麼做,不過用的是 libcaca (

居然还没凉……

作死 哈哈

ffplayer 在没有图形界面下播放视频就是这个效果。偶然发现的。

其实江总还是很不错的,至少那时候成克杰什么得贪污了还能有死刑
至少那时候物价房价 10 年平稳,都没涨过,
至少还能想着要航母,要上天。除了抓轮子,被轮子喊蛤蟆,除了怼香港记者 simple naive,江总还是值得肯定的
对比现在的房价物价,哎。

这是药丸的节奏啊


这个 curl aoaoao.me:1926 厉害了
本人近视,脱了眼镜看,真是高清,哈哈

估计凉了吧

翻车集锦

Excited!

你这个图啊,我看了感觉很 excited !

回到顶部