博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
四行Python代码,你也能从图片上识别文字!
阅读量:4227 次
发布时间:2019-05-26

本文共 888 字,大约阅读时间需要 2 分钟。

图像识别、文字识别,这些都是现在比较火的东西,现在大部分的AI都有在做这些东西,那我们就过来了解一下吧!

只需要四行代码,完成从图片中读取图片中的文字!

准备工作: 

我们需要两个安装包,先来安装一下:

pip install pillow

640?wx_fmt=png

pip install pytesseract

640?wx_fmt=png

安装完之后,我们需要下载Tesseract-OCR这个软件,这里我已经将东西都打包好了放在百度云中,大家可以直接下载:

链接

https://pan.baidu.com/s/1osNf95ScZJYhtzsGFLtxaA

密码

npmn

打开安装包,一路next

640?wx_fmt=png

记录好自己的安装路径

640?wx_fmt=png

安装完之后找到tessdata目录下,将下载的chi_sim.traineddata文件放到该目录下。这样它就能识别中文了。

640?wx_fmt=png

之后,我们只剩下一个东西要配一下了,在pytesseract模块中pytesseract.py文件中去配置一下Tesseract-OCR的工作目录,这个时候我们可以通过刚刚pip安装的位置找到pytesseract.py文件,如下图:

640?wx_fmt=png

进入目录找到pytesseract.py文件并且打开它:

640?wx_fmt=png

将tesseract_cmd这个变量的值改成Tesseract-OCR的安装目录即可。

现在,我们在准备一张图片,用来识别,小编就用微信截图好了,放置在桌面文件夹上:

640?wx_fmt=png

开始代码:

到这里,我们所有的预备环境以及全部搭建好了,下面我们就开始来敲代码咯:

640?wx_fmt=png

from PIL import Image

import pytesseract

pic_content=pytesseract.image_to_string(Image.open('C:\\Users\\yuqing.wu\\Desktop\\all\\3.png'),lang='chi_sim')

print(pic_content)

我们来看看运行结果:

640?wx_fmt=png

结果还是比较准的。

大家也来试试吧!

像这样的图像识别还是挺重要、挺常用的,例如图片验证码等等,都是可以去完成的,就看大家怎么去用了!

640?wx_fmt=jpeg

感兴趣的扫个二维码吧!

转载地址:http://qlnqi.baihongyu.com/

你可能感兴趣的文章
北邮同学面经
查看>>
Effective C++条款16:成对使用new和delete时要采取相同形式
查看>>
sizeof与strlen
查看>>
一个递归+二分法的洗牌程序
查看>>
YUV格式注释
查看>>
一维、二维数组传参
查看>>
判断当前时间的下一秒是多少
查看>>
从文本文件中读取数据排序并输出到文本
查看>>
求一个整数数组中第二大的数
查看>>
删除一个链表中的节点
查看>>
计算机网络面试整理【转】
查看>>
cookie和session区别详解
查看>>
程序员失业第一步?斯坦福研究员用AI从编译器反馈中学习改Bug
查看>>
原创 | 电视广告流量预测中的“常识”陷阱,你掉进去了吗?
查看>>
DeepMind发布最新《神经网络中持续学习》综述论文!
查看>>
本科三篇顶会一作、超算竞赛冠军,2020清华本科特奖结果出炉
查看>>
多语言互通:谷歌发布实体检索模型,涵盖超过100种语言和2000万个实体
查看>>
你的房东可能正用AI筛查你的犯罪记录,决定要不要租房给你
查看>>
AI把爱豆变胖视频火遍B站,我们找到了背后的技术团队:你是怎么把刘亦菲变胖的?...
查看>>
白硕:区块链技术与数据隐私(附视频)
查看>>