python获取图片中的文字

老K博客

2024-03-29 / 0 评论 / 436 阅读 / 正在检测是否收录...

03/29

一、背景

项目中使用中python识别图片中的文字，所以就有了下文

二、依赖环境

1.安装tesseract（我选择了最新的包）

安装包地址：
https://digi.bib.uni-mannheim.de/tesseract/

注意：记住安装路径后面会配置环境变量用到

2.安装中文语言包

安装包地址：
https://tesseract-ocr.github.io/tessdoc/Data-Files

3.配置环境变量

添加用户变量：TESSDATA_PREFIX

添加环境变量

4.测试是否安装成功

终端执行tesseract -v

5.执行代码

# coding=utf-8
"""
    @project: automation_tools
    @Author：gaojs
    @file： test043.py
    @date：2023/7/17 15:07
    @blogs: https://www.gaojs.com.cn
"""
import pytesseract
from PIL import Image


def get_text_from_photo(photo_path):
    """
    从图片中获取文字
    """
    # 读取图片
    im = Image.open(photo_path)
    # 识别文字，并指定语言
    text = pytesseract.image_to_string(im, lang='chi_sim')
    print(text)
    return text


if __name__ == '__main__':
    get_text_from_photo(photo_path='test043.png')

6.错误提示

pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your PATH. See README file for more information.

7.解决报错

在pytesseract库下的pytesseract.py文件中找到tesseract_cmd = 'tesseract'，修改成 tesseract_cmd =r'D:\OCR\tesseract.exe'

8.成功运行

本文共 154 个字数,平均阅读时长 ≈ 1分钟

打赏

注意：本站资源多为网络收集，如涉及版权问题请及时与站长联系，我们会在第一时间内删除资源。

您购买的只是资源，不提供解答疑问和安装服务。

本站用户发帖仅代表本站用户个人观点，并不代表本站赞同其观点和对其真实性负责。

本站资源大多存储在云盘，如发现链接失效，请及时与站长联系，我们会第一时间更新。

转载本网站任何内容，请按照转载方式正确书写本站原文地址

版权属于：老K博客

本文链接： https://laokbk.cn/archives/285/

文章转载：

作品采用：本文版权内容属于《老K博客》转载请标明出处