使用openCV去除文字中乱入的线条实例

更新时间：2020年6月3日 07:51 点击：1714

今天上午，朋友发来一张图片如下。没错，这就是原图，他希望可以通过一些简单的算法将图中这条穿过单词间的直线去掉，使得到的结果能够通过他的文字识别算法并得出正确结果——The Techniques of Machine Vision。

乍一看这似乎挺简单，(1)将图像二值化；(2)找出这条直线；(3)将直线区域填成背景色（即白色）；(4)再通过膨胀、腐蚀等操作将单词缺失的部分给补全。以上4步似乎可以满足要求，但测试发现，效果不尽人意。

一、按上述方法实现过程

二值化结果如图1.1所示，可以看到图像并不标准，直线粗细也不一，我们尝试用霍夫变换找一下直线，代码如下

void findLines(IplImage* raw, IplImage* dst)
{
	IplImage* src = cvCloneImage(raw);
	IplImage* canny = cvCreateImage(cvGetSize(src), IPL_DEPTH_8U, 1);
	cvCanny(src, canny, 20, 200, 3);
	CvMemStorage* stor = cvCreateMemStorage(0);
	CvSeq* lines = NULL;
	lines = cvHoughLines2(canny, stor, CV_HOUGH_PROBABILISTIC, 1, CV_PI / 180, 80, 200, 30);
	cvZero(dst);
	CvPoint maxStart, maxEnd;
	int maxDistance = 0;
	for (int i = 0; i < lines->total; i++)
	{
		CvPoint* line = (CvPoint*)cvGetSeqElem(lines, i);
		if (abs(line[0].x - line[1].x) > maxDistance)
		{
			maxDistance = abs(line[0].x - line[1].x);
			maxStart = line[0];
			maxEnd = line[1];
		}
	}
	cvLine(dst, maxStart, maxEnd, cvScalar(255), 1);
	cvReleaseImage(&src);
	cvReleaseMemStorage(&stor);
}

简要解释一下这段代码。函数的功能是在输入图像中找出一条直线，输入的图像是灰度图raw，返回值为dst，返回值是以图片的形式，将找到的直线画上图中。

函数lines = cvHoughLines2(canny, stor, CV_HOUGH_PROBABILISTIC, 1, CV_PI / 180, 80, 200, 30);的参数表明，要求直线长度在200个像素以上，且两条在同一直线上的线段，如果相隔不到30个像素，就把它们连起来【注：图片尺寸为1066×148】。对于找到的多条直线，认为最长的一条是我们要找的那条。找距离时用了abs(line[0].x - line[1].x);是不严格的，严格来讲应该是

sqrt((line[0].x - line[1].x)*(line[0].x - line[1].x)+(line[0].y - line[1].y)*(line[0].x - line[1].x))

不过图中的直线接近水平，这里就简化一下啦。

所以将运行这段代码后，返回的图片dst应该是这样子的

图1.2中直线的粗线可以通过改变cvLine(dst, maxStart, maxEnd, cvScalar(255), 1);最后一个参数来调整，这里用的是1。

接下来步骤就是在二值化图(图1.1)中去掉这条线，代码如下：

void eraseLine(IplImage* src, IplImage* flag)
{// flag为图1.2所示的图片，src为图1.1所示的二值化图片
	for (int row = 0; row < src->height; row++)
		for (int col = 0; col < src->width; col++)
		{	// 如果在白色线段上，则将二值化图片填为白色
			if (cvGet2D(flag, row, col).val[0] == 255)
				cvSet2D(src, row, col, cvScalar(255));
		}
}

当直线的宽度分别为2、3个像素时，二值化图去掉直线后的效果如下

可以看到，效果很差，如果要膨胀（黑色部分减小），单词下边部分都会消失了，直接腐蚀（黑色部分增大），线又不能完全去掉。

后来，我采用的办法是，对图1.3重新找一次直线（减去一次直线后，中间还残留一部分短些的直线），再减掉，再找再减掉。后面再对图像进行腐蚀（黑色部分增长）。最终效果最好这就如下图所示

但这种方法用时长、针对不同的直线，找直线-减直线的重复次数还不一样，不具有可移植性。而且啊，这个图片识别出来的结果是

The Technique_sJ_otMachine Vision

所以需要采用新的办法来解决这个问题。

二、新的办法

源代码如下

#include <cv.h>
#include <highgui.h>
#include <iostream>
using namespace std;
/*
函数功能：在输入图像中找一条直线
输入输出：输入的图像是灰度图raw，返回值为dst，返回值是一条白色的线
lines = cvHoughLines2(canny, stor, CV_HOUGH_PROBABILISTIC, 1, CV_PI / 180, 80, 200, 30);
参数中的200是指要找的直线长度要在200个像素以上；
参数中的30指的是两条在同一直线上的线段，如果相隔不到30，则把它们连起来
*/
void findLines(IplImage* raw, IplImage* dst)
{
 IplImage* src = cvCloneImage(raw); // clone the input image
 IplImage* canny = cvCreateImage(cvGetSize(src), IPL_DEPTH_8U, 1); // create a tmp image head to save gradient image
 cvCanny(src, canny, 20, 200, 3); // Generate its gradient image
 CvMemStorage* stor = cvCreateMemStorage(0);
 CvSeq* lines = NULL;
 // find a line whose length bigger than 200 pixels
 lines = cvHoughLines2(canny, stor, CV_HOUGH_PROBABILISTIC, 1, CV_PI / 180, 80, 200, 30);
 cvZero(dst);
 CvPoint maxStart, maxEnd; // save the coordinate of the head and rear of the line we want
 int maxDistance = 0; // The maximum distance of all lines found by [cvHoughLines2]
 for (int i = 0; i < lines->total; i++) // lines->total: the number of lines 
 {
 // variable 'lines' is a sequence, [cvGetSeqElem] gets the (i)th line, and it returns its head and rear.
 CvPoint* line = (CvPoint*)cvGetSeqElem(lines, i); 
 // line[0] and line[1] is respectively the line's coordinate of its head and rear
 if (abs(line[0].x - line[1].x) > maxDistance)
 {/* It's a trick because the line is almost horizontal.
 strictly, it should be 
 sqrt((line[0].x - line[1].x)*(line[0].x - line[1].x)+(line[0].y - line[1].y)*(line[0].x - line[1].x))
 */
 maxDistance = abs(line[0].x - line[1].x);
 maxStart = line[0];
 maxEnd = line[1];
 }
 }
 cvLine(dst, maxStart, maxEnd, cvScalar(255), 1); // draw the white line[cvScalar(255)] in a black background
 cvReleaseImage(&src); // free the memory
 cvReleaseMemStorage(&stor);
}
/*
函数功能：擦除面积小于【15个像素】的小块儿
输入输出：无返回值，直接对输入的图像进行操作
*/
void erase(IplImage* raw)
{
 IplImage* src = cvCloneImage(raw);
 /*Binarization and inverse the black and white because the function next only find white area while
 the word in image is black.*/
 cvThreshold(src, src, 120, 255, CV_THRESH_BINARY_INV); 
 // create some space to save the white areas but we access it via variable 'cont'
 CvMemStorage* stor = cvCreateMemStorage(0); 
 CvSeq* cont;
 cvFindContours(src, stor, &cont, sizeof(CvContour), CV_RETR_EXTERNAL); // find the white regions
 for (; cont; cont = cont->h_next) // Traversal
 {
 if (fabs(cvContourArea(cont)) < 15) // if its Area smaller than 15, we fill it with white[cvScalar(255)]
 cvDrawContours(raw, cont, cvScalar(255), cvScalar(255), 0, CV_FILLED, 8);
 }
 cvReleaseImage(&src);
}
 
int main()
{
 IplImage* src = cvLoadImage("D:/test.png");
 cvNamedWindow("原图", 1);
 cvShowImage("原图", src);
 IplImage* gray = cvCreateImage(cvGetSize(src), IPL_DEPTH_8U, 1);
 IplImage* canny = cvCreateImage(cvGetSize(src), IPL_DEPTH_8U, 1);
 IplImage* dst = cvCreateImage(cvGetSize(src), IPL_DEPTH_8U, 1);
 IplImage* binary = cvCreateImage(cvGetSize(src), IPL_DEPTH_8U, 1);
 
 cvCvtColor(src, gray, CV_RGB2GRAY);
 cvThreshold(gray, binary, 120, 255, CV_THRESH_OTSU);
 
 findLines(gray, dst);
 cvNamedWindow("dst", 1);
 cvShowImage("dst", dst);
 
 for (int row = 0; row < binary->height; row++)
 for (int col = 0; col < binary->width; col++)
 {
 if (cvGet2D(dst, row, col).val[0] == 255)
 {
 int up = 0, down = 0;
 int white = 0;
 for (int i = row; i >= 0; i--)
 {
 if (cvGet2D(binary, i, col).val[0] == 0)
 {
 up++; 
 white = 0;
 }
 else white++;
 if(white > 2) break;
 }
 white = 0;
 for (int i = row; i < binary->height; i++)
 {
 if (cvGet2D(binary, i, col).val[0] == 0)
 {
 down++;
 white = 0;
 }
 else white++;
 if (white > 2) break;
 }
 if (up + down < 8)
 {
 for (int i = -up; i <= down; i++) cvSet2D(binary, row + i, col, cvScalar(255));
 }
 }
 }
 cvNamedWindow("结果", 1);
 cvShowImage("结果", binary);
 erase(binary);
 //cvDilate(binary, binary, NULL, 1);
 cvErode(binary, binary, NULL, 1);
 cvNamedWindow("膨胀腐蚀", 1);
 cvShowImage("膨胀腐蚀", binary);
 cvSaveImage("D:/result.png", binary);
 cvReleaseImage(&src);
 cvReleaseImage(&canny);
 cvReleaseImage(&gray);
 cvReleaseImage(&dst);
 cvReleaseImage(&binary);
 cvWaitKey(0);
 return 0;
}

这个方法很简单的，就是在找到直线（直线宽度为1）后，沿着直线从左到右对二值化图进行上下扫描，如果这个直线的宽度（黑色的宽度）小于8个像素，则认为它只是直线，而不是文字的一部分，那么将它填成白色；反之，对于直线是文字的一部分这种情况，则不对它进行任何操作。

这样得到的结果如下图2.1所示

当然这个结果有点差强人意，如果你有更好的想法，请在下面留言，我们交流交流。

以上这篇使用openCV去除文字中乱入的线条实例就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持猪先飞。

[!--infotagslink--]

上一篇: 在pycharm中使用matplotlib.pyplot 绘图时报错的解决

下一篇: Python能做什么

python opencv 画外接矩形框的完整代码
这篇文章主要介绍了python-opencv-画外接矩形框的实例代码，代码简单易懂，对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下...2021-09-04
iOS设置UIButton文字显示位置和字体大小、颜色的方法
这篇文章给大家分享了iOS如何设置UIButton的文字显示位置和字体的大小、颜色，文中给出了示例代码，相信对大家的学习和理解很有帮助，有需要的朋友们下面来一起看看吧。...2020-06-30
python opencv通过4坐标剪裁图片
图片剪裁是常用的方法，那么如何通过4坐标剪裁图片，本文就详细的来介绍一下，感兴趣的小伙伴们可以参考一下...2021-06-04
基于JavaScript实现文字超出部分隐藏
这篇文章主要介绍了基于JavaScript实现文字超出部分隐藏的相关资料,需要的朋友可以参考下...2016-03-01
OpenCV如何去除图片中的阴影的实现
这篇文章主要介绍了OpenCV如何去除图片中的阴影的实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧...2021-03-29
解决使用OpenCV中的imread()内存报错问题
这篇文章主要介绍了解决使用OpenCV中的imread()内存报错问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2021-03-16
C#文字换行的实现方法
这篇文章主要介绍了C#文字换行的实现方法,通过自定义函数实现针对特定字符串的换行长度处理,是比较实用的技巧,对于C#的深入学习具有一定的借鉴价值,需要的朋友可以参考下...2020-06-25
python OpenCV学习笔记
这篇文章主要介绍了python OpenCV的相关资料，帮助大家更好的理解和学习使用python的opencv，感兴趣的朋友可以了解下...2021-03-31
使用OpenCV去除面积较小的连通域
这篇文章主要介绍了使用OpenCV去除面积较小的连通域，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-07-05
详解pycharm的python包opencv（cv2）无代码提示问题的解决
这篇文章主要介绍了详解pycharm的python包opencv（cv2）无代码提示问题的解决，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧...2021-01-29
在C#中使用OpenCV（使用OpenCVSharp）的实现
这篇文章主要介绍了在C#中使用OpenCV（使用OpenCVSharp）的实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧...2020-11-15
C#利用GDI+给图片添加文字（文字自适应矩形区域）
这篇文章主要给大家介绍了关于C#利用GDI+给图片添加文字（文字自适应矩形区域）的相关资料，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面来一起看看吧。...2020-06-25
C++ opencv实现车道线识别
这篇文章主要为大家详细介绍了C++ opencv实现车道线识别，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下...2021-02-20
Opencv LBPH人脸识别算法详解
这篇文章主要为大家详细介绍了Opencv LBPH人脸识别算法的相关资料，具有一定的参考价值，感兴趣的小伙伴们可以参考一下...2020-04-25
详解opencv中画圆circle函数和椭圆ellipse函数
这篇文章主要介绍了opencv中画圆circle函数和椭圆ellipse函数,本文通过实例代码给大家介绍的非常详细，具有一定的参考借鉴价值，需要的朋友可以参考下...2020-05-09
python中的opencv和PIL(pillow)转化操作
这篇文章主要介绍了python中的opencv和PIL(pillow)转化操作，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2021-03-16
python基于opencv检测程序运行效率
这篇文章主要介绍了python基于opencv检测程序运行效率,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下...2020-05-09
浅谈OpenCV中的新函数connectedComponentsWithStats用法
这篇文章主要介绍了浅谈OpenCV中的新函数connectedComponentsWithStats用法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-07-05
Opencv实现绿幕视频背景替换功能
这篇文章主要为大家详细介绍了Opencv实现绿幕视频背景替换功能，具有一定的参考价值，感兴趣的小伙伴们可以参考一下...2020-04-25
python基于OpenCV模板匹配识别图片中的数字
这篇文章主要介绍了python基于OpenCV模板匹配识别图片中的数字，帮助大家更好的理解和学习使用python，感兴趣的朋友可以了解下...2021-03-31

使用openCV去除文字中乱入的线条实例

相关文章

阁下可能感兴趣的内容

推荐阅读