python简单实现图片文字分割

更新时间：2021年9月6日 00:00 点击：1800

本文实例为大家分享了python简单实现图片文字分割的具体代码，供大家参考，具体内容如下

原图：

图片预处理：图片二值化以及图片降噪处理。

# 图片二值化
def binarization(img,threshold):
    #图片二值化操作
    width,height=img.size
    im_new = img.copy()
    for i in range(width):
        for j in range(height):
            a = img.getpixel((i, j))
            aa = 0.30 * a[0] + 0.59 * a[1] + 0.11 * a[2]
            if (aa <= threshold):
                im_new.putpixel((i, j), (0, 0, 0))
            else:
                im_new.putpixel((i, j), (255, 255, 255))

    # im_new.show()  # 显示图像
    return im_new

# 图片降噪处理
def clear_noise(img):
    # 图片降噪处理

    x, y = img.width, img.height
    for i in range(x-1):
        for j in range(y-1):
            if sum_9_region(img, i, j) < 600:
                # 改变像素点颜色，白色
                img.putpixel((i, j), (255,255,255))
    # img = np.array(img)
    #     # cv2.imwrite('handle_two.png', img)
    #     # img = Image.open('handle_two.png')
    img.show()
    return img

# 获取田字格内当前像素点的像素值
def sum_9_region(img, x, y):
    """
    田字格
    """
    # 获取当前像素点的像素值

    a1 = img.getpixel((x - 1, y - 1))[0]
    a2 = img.getpixel((x - 1, y))[0]
    a3 = img.getpixel((x - 1, y+1 ))[0]
    a4 = img.getpixel((x, y - 1))[0]
    a5 = img.getpixel((x, y))[0]
    a6 = img.getpixel((x, y+1 ))[0]
    a7 = img.getpixel((x+1 , y - 1))[0]
    a8 = img.getpixel((x+1 , y))[0]
    a9 = img.getpixel((x+1 , y+1))[0]
    width = img.width
    height = img.height

    if a5 == 255:  # 如果当前点为白色区域,则不统计邻域值
        return 2550

    if y == 0:  # 第一行
        if x == 0:  # 左上顶点,4邻域
            # 中心点旁边3个点
            sum_1 = a5 + a6 + a8 + a9
            return 4*255 - sum_1
        elif x == width - 1:  # 右上顶点
            sum_2 = a5 + a6 + a2 + a3
            return 4*255 - sum_2
        else:  # 最上非顶点,6邻域
            sum_3 = a2 + a3+ a5 + a6 + a8 + a9
            return 6*255 - sum_3

    elif y == height - 1:  # 最下面一行
        if x == 0:  # 左下顶点
            # 中心点旁边3个点
            sum_4 = a5 + a8 + a7 + a4
            return 4*255 - sum_4
        elif x == width - 1:  # 右下顶点
            sum_5 = a5 + a4 + a2 + a1
            return 4*255 - sum_5
        else:  # 最下非顶点,6邻域
            sum_6 = a5+ a2 + a8 + a4 +a1 + a7
            return 6*255 - sum_6

    else:  # y不在边界
        if x == 0:  # 左边非顶点
            sum_7 = a4 + a5 + a6 + a7 + a8 + a9
            return 6*255 - sum_7
        elif x == width - 1:  # 右边非顶点
            sum_8 = a4 + a5 + a6 + a1 + a2 + a3
            return 6*255 - sum_8
        else:  # 具备9领域条件的
            sum_9 = a1 + a2 + a3 + a4 + a5 + a6 + a7 + a8 + a9
            return 9*255 - sum_9

经过二值化和降噪后得到的图片

对图片进行水平投影与垂直投影：

# 传入二值化后的图片进行垂直投影
def vertical(img):
    """传入二值化后的图片进行垂直投影"""
    pixdata = img.load()
    w,h = img.size
    ver_list = []
    # 开始投影
    for x in range(w):
        black = 0
        for y in range(h):
            if pixdata[x,y][0] == 0:
                black += 1
        ver_list.append(black)
    # 判断边界
    l,r = 0,0
    flag = False
    t=0#判断分割数量
    cuts = []
    for i,count in enumerate(ver_list):
        # 阈值这里为0
        if flag is False and count > 0:
            l = i
            flag = True
        if flag and count == 0:
            r = i-1
            flag = False
            cuts.append((l,r))#记录边界点
            t += 1
    #print(t)
    return cuts,t

# 传入二值化后的图片进行水平投影
def horizontal(img):
    """传入二值化后的图片进行水平投影"""
    pixdata = img.load()
    w,h = img.size
    ver_list = []
    # 开始投影
    for y in range(h):
        black = 0
        for x in range(w):
            if pixdata[x,y][0] == 0:
                black += 1
        ver_list.append(black)
    # 判断边界
    l,r = 0,0
    flag = False
    # 分割区域数
    t=0
    cuts = []
    for i,count in enumerate(ver_list):
        # 阈值这里为0
        if flag is False and count > 0:
            l = i
            flag = True
        if flag and count == 0:
            r = i-1
            flag = False
            cuts.append((l,r))
            t += 1
    return cuts,t

这两段代码目的主要是为了分割得到水平和垂直位置的每个字所占的大小，接下来就是对预处理好的图片文字进行分割。

# 创建获得图片路径并处理图片函数
def get_im_path():

    OpenFile = tk.Tk()#创建新窗口
    OpenFile.withdraw()
    file_path = filedialog.askopenfilename()

    im = Image.open(file_path)
    # 阈值
    th = getthreshold(im) - 16
    print(th)
    # 原图直接二值化
    im_new1 = binarization(im, th)
    im_new1.show()
    # 直方图均衡化
    im1 = his_bal(im)
    im1.show()
    im_new_np = np.array(his_bal(im))

    th1 = getthreshold(im1) - 16
    print(th1)
    # 二值化
    im_new = binarization(im1, th1)
    # 降噪
    im_new_cn = clear_noise(im_new)
    height = im_new_cn.size[1]
    print(height)
    # 算出水平投影和垂直投影的数值
    v, vt = vertical(im_new1)
    h, ht = horizontal(im_new1)
    # 算出分割区域
    a = []
    for i in range(vt):
        a.append((v[i][0], 0, v[i][1], height))
    print(a)

    im_new.show()  # 直方图均衡化后再二值化

    # 切割
    for i, n in enumerate(a, 1):
        temp = im_new_cn.crop(n)  # 调用crop函数进行切割
        temp.show()
        temp.save("c/%s.png" % i)

至此大概就完成了。

接下来是文件的全部代码：

import numpy as np
from PIL import Image
import queue
import  matplotlib.pyplot as plt
import  tkinter as tk
from tkinter import filedialog#导入文件对话框函数库

window = tk.Tk()
window.title('图片选择界面')
window.geometry('400x100')

var = tk.StringVar()


# 创建获得图片路径并处理图片函数
def get_im_path():

    OpenFile = tk.Tk()#创建新窗口
    OpenFile.withdraw()
    file_path = filedialog.askopenfilename()

    im = Image.open(file_path)
    # 阈值
    th = getthreshold(im) - 16
    print(th)
    # 原图直接二值化
    im_new1 = binarization(im, th)
    im_new1.show()
    # 直方图均衡化
    im1 = his_bal(im)
    im1.show()
    im_new_np = np.array(his_bal(im))

    th1 = getthreshold(im1) - 16
    print(th1)
    # 二值化
    im_new = binarization(im1, th1)
    # 降噪
    im_new_cn = clear_noise(im_new)
    height = im_new_cn.size[1]
    print(height)
    # 算出水平投影和垂直投影的数值
    v, vt = vertical(im_new1)
    h, ht = horizontal(im_new1)
    # 算出分割区域
    a = []
    for i in range(vt):
        a.append((v[i][0], 0, v[i][1], height))
    print(a)

    im_new.show()  # 直方图均衡化后再二值化

    # 切割
    for i, n in enumerate(a, 1):
        temp = im_new_cn.crop(n)  # 调用crop函数进行切割
        temp.show()
        temp.save("c/%s.png" % i)

# 传入二值化后的图片进行垂直投影
def vertical(img):
    """传入二值化后的图片进行垂直投影"""
    pixdata = img.load()
    w,h = img.size
    ver_list = []
    # 开始投影
    for x in range(w):
        black = 0
        for y in range(h):
            if pixdata[x,y][0] == 0:
                black += 1
        ver_list.append(black)
    # 判断边界
    l,r = 0,0
    flag = False
    t=0#判断分割数量
    cuts = []
    for i,count in enumerate(ver_list):
        # 阈值这里为0
        if flag is False and count > 0:
            l = i
            flag = True
        if flag and count == 0:
            r = i-1
            flag = False
            cuts.append((l,r))#记录边界点
            t += 1
    #print(t)
    return cuts,t

# 传入二值化后的图片进行水平投影
def horizontal(img):
    """传入二值化后的图片进行水平投影"""
    pixdata = img.load()
    w,h = img.size
    ver_list = []
    # 开始投影
    for y in range(h):
        black = 0
        for x in range(w):
            if pixdata[x,y][0] == 0:
                black += 1
        ver_list.append(black)
    # 判断边界
    l,r = 0,0
    flag = False
    # 分割区域数
    t=0
    cuts = []
    for i,count in enumerate(ver_list):
        # 阈值这里为0
        if flag is False and count > 0:
            l = i
            flag = True
        if flag and count == 0:
            r = i-1
            flag = False
            cuts.append((l,r))
            t += 1
    return cuts,t

# 获得阈值算出平均像素
def getthreshold(im):
    #获得阈值 算出平均像素
    wid, hei = im.size
    hist = [0] * 256
    th = 0
    for i in range(wid):
        for j in range(hei):
            gray = int(0.3 * im.getpixel((i, j))[0] + 0.59 * im.getpixel((i, j))[1] + 0.11 * im.getpixel((i, j))[2])
            th = gray + th
            hist[gray] += 1


    threshold = int(th/(wid*hei))
    return threshold

# 直方图均衡化 提高对比度
def his_bal(im):
    #直方图均衡化 提高对比度

    # 统计灰度直方图
    im_new = im.copy()
    wid, hei = im.size
    hist = [0] * 256
    for i in range(wid):
        for j in range(hei):
            gray = int(0.3*im.getpixel((i,j))[0]+0.59*im.getpixel((i,j))[1]+0.11*im.getpixel((i,j))[2])
            hist[gray] += 1

    # 计算累积分布函数
    cdf = [0] * 256
    for i in range(256):
        if i == 0:
            cdf[i] = hist[i]
        else:
            cdf[i] = cdf[i - 1] + hist[i]

    # 用累积分布函数计算输出灰度映射函数LUT
    new_gray = [0] * 256
    for i in range(256):
        new_gray[i] = int(cdf[i] / (wid * hei) * 255 + 0.5)

    # 遍历原图像，通过LUT逐点计算新图像对应的像素值
    for i in range(wid):
        for j in range(hei):
            gray = int(0.3*im.getpixel((i,j))[0]+0.59*im.getpixel((i,j))[1]+0.11*im.getpixel((i,j))[2])
            im_new.putpixel((i, j), new_gray[gray])
    return im_new

# 图片二值化
def binarization(img,threshold):
    #图片二值化操作
    width,height=img.size
    im_new = img.copy()
    for i in range(width):
        for j in range(height):
            a = img.getpixel((i, j))
            aa = 0.30 * a[0] + 0.59 * a[1] + 0.11 * a[2]
            if (aa <= threshold):
                im_new.putpixel((i, j), (0, 0, 0))
            else:
                im_new.putpixel((i, j), (255, 255, 255))

    # im_new.show()  # 显示图像
    return im_new

# 图片降噪处理
def clear_noise(img):
    # 图片降噪处理

    x, y = img.width, img.height
    for i in range(x-1):
        for j in range(y-1):
            if sum_9_region(img, i, j) < 600:
                # 改变像素点颜色，白色
                img.putpixel((i, j), (255,255,255))
    # img = np.array(img)
    #     # cv2.imwrite('handle_two.png', img)
    #     # img = Image.open('handle_two.png')
    img.show()
    return img

# 获取田字格内当前像素点的像素值
def sum_9_region(img, x, y):
    """
    田字格
    """
    # 获取当前像素点的像素值

    a1 = img.getpixel((x - 1, y - 1))[0]
    a2 = img.getpixel((x - 1, y))[0]
    a3 = img.getpixel((x - 1, y+1 ))[0]
    a4 = img.getpixel((x, y - 1))[0]
    a5 = img.getpixel((x, y))[0]
    a6 = img.getpixel((x, y+1 ))[0]
    a7 = img.getpixel((x+1 , y - 1))[0]
    a8 = img.getpixel((x+1 , y))[0]
    a9 = img.getpixel((x+1 , y+1))[0]
    width = img.width
    height = img.height

    if a5 == 255:  # 如果当前点为白色区域,则不统计邻域值
        return 2550

    if y == 0:  # 第一行
        if x == 0:  # 左上顶点,4邻域
            # 中心点旁边3个点
            sum_1 = a5 + a6 + a8 + a9
            return 4*255 - sum_1
        elif x == width - 1:  # 右上顶点
            sum_2 = a5 + a6 + a2 + a3
            return 4*255 - sum_2
        else:  # 最上非顶点,6邻域
            sum_3 = a2 + a3+ a5 + a6 + a8 + a9
            return 6*255 - sum_3

    elif y == height - 1:  # 最下面一行
        if x == 0:  # 左下顶点
            # 中心点旁边3个点
            sum_4 = a5 + a8 + a7 + a4
            return 4*255 - sum_4
        elif x == width - 1:  # 右下顶点
            sum_5 = a5 + a4 + a2 + a1
            return 4*255 - sum_5
        else:  # 最下非顶点,6邻域
            sum_6 = a5+ a2 + a8 + a4 +a1 + a7
            return 6*255 - sum_6

    else:  # y不在边界
        if x == 0:  # 左边非顶点
            sum_7 = a4 + a5 + a6 + a7 + a8 + a9
            return 6*255 - sum_7
        elif x == width - 1:  # 右边非顶点
            sum_8 = a4 + a5 + a6 + a1 + a2 + a3
            return 6*255 - sum_8
        else:  # 具备9领域条件的
            sum_9 = a1 + a2 + a3 + a4 + a5 + a6 + a7 + a8 + a9
            return 9*255 - sum_9

btn_Open = tk.Button(window,
    text='打开图像',      # 显示在按钮上的文字
    width=15, height=2,
    command=get_im_path)     # 点击按钮式执行的命令

btn_Open.pack()


# 运行整体窗口
window.mainloop()

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持猪先飞。

[!--infotagslink--]

上一篇: python socket多线程实现客户端与服务器连接

下一篇: Python 经典贪心算法之Prim算法案例详解

python opencv 画外接矩形框的完整代码
这篇文章主要介绍了python-opencv-画外接矩形框的实例代码，代码简单易懂，对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下...2021-09-04
Python astype(np.float)函数使用方法解析
这篇文章主要介绍了Python astype(np.float)函数使用方法解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下...2020-06-08
最炫Python烟花代码全解析
2022虎年新年即将来临，小编为大家带来了一个利用Python编写的虎年烟花特效，堪称全网最绚烂，文中的示例代码简洁易懂，感兴趣的同学可以动手试一试...2022-02-14
python中numpy.empty()函数实例讲解
在本篇文章里小编给大家分享的是一篇关于python中numpy.empty()函数实例讲解内容，对此有兴趣的朋友们可以学习下。...2021-02-06
python-for x in range的用法(注意要点、细节)
这篇文章主要介绍了python-for x in range的用法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2021-05-10
Python 图片转数组,二进制互转操作
这篇文章主要介绍了Python 图片转数组,二进制互转操作，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2021-03-09
Python中的imread()函数用法说明
这篇文章主要介绍了Python中的imread()函数用法说明，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2021-03-16
python实现b站直播自动发送弹幕功能
这篇文章主要介绍了python如何实现b站直播自动发送弹幕，帮助大家更好的理解和学习使用python，感兴趣的朋友可以了解下...2021-02-20
python Matplotlib基础--如何添加文本和标注
这篇文章主要介绍了python Matplotlib基础--如何添加文本和标注，帮助大家更好的利用Matplotlib绘制图表，感兴趣的朋友可以了解下...2021-01-26
解决python 使用openpyxl读写大文件的坑
这篇文章主要介绍了解决python 使用openpyxl读写大文件的坑，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2021-03-13
python 计算方位角实例(根据两点的坐标计算)
今天小编就为大家分享一篇python 计算方位角实例(根据两点的坐标计算)，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-04-27
python实现双色球随机选号
这篇文章主要为大家详细介绍了python实现双色球随机选号，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下...2020-05-02
python中使用np.delete()的实例方法
在本篇文章里小编给大家整理的是一篇关于python中使用np.delete()的实例方法，对此有兴趣的朋友们可以学习参考下。...2021-02-01
使用Python的pencolor函数实现渐变色功能
这篇文章主要介绍了使用Python的pencolor函数实现渐变色功能,本文通过实例代码给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下...2021-03-09
python自动化办公操作PPT的实现
这篇文章主要介绍了python自动化办公操作PPT的实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧...2021-02-05
Python getsizeof()和getsize()区分详解
这篇文章主要介绍了Python getsizeof()和getsize()区分详解，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧...2020-11-20
解决python 两个时间戳相减出现结果错误的问题
这篇文章主要介绍了解决python 两个时间戳相减出现结果错误的问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2021-03-12
python实现学生通讯录管理系统
这篇文章主要为大家详细介绍了python实现学生通讯录管理系统，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下...2021-02-25
PyTorch一小时掌握之迁移学习篇
这篇文章主要介绍了PyTorch一小时掌握之迁移学习篇，本文给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下...2021-09-08
Python绘制的爱心树与表白代码(完整代码)
这篇文章主要介绍了Python绘制的爱心树与表白代码,本文通过实例代码给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下...2021-04-06

python简单实现图片文字分割

相关文章

阁下可能感兴趣的内容

推荐阅读