如何基于opencv实现简单的数字识别

更新时间：2021年9月9日 12:01 点击：1714

前言

由于自己学识尚浅，不能用python深度学习来识别这里的数字，所以就完全采用opencv来识别数字，然后在这里分享、记录一下自己在学习过程中的一些所见所得和所想

要解决的问题

这是一个要识别的数字，我这里首先是对图像进行一个ROI的提取，提取结果就仅仅剩下数字，把其他的一些无关紧要的要素排除在外，

这是ROI图片，我们要做的就是识别出该照片中的数字，

解决问题的思路

1、先把这个图片中的数字分割，分割成为5张小图片，每张图片包含一个数字，为啥要分割呢？因为我们没办法让计算机知道这个数字是多少，所以只能根据特征，让计算机去识别特征，然后每一个特征对应一个值，首先贴出分割图片的程序，然后在程序下方会有一段思路解释

#include <opencv2/core/core.hpp>
#include <opencv.hpp>
#include <opencv2/highgui/highgui.hpp>
#include <opencv2/features2d/features2d.hpp>
#include <opencv2/imgproc/imgproc.hpp>
#include <iostream>
#include <ctime>
using namespace std ;
using namespace cv;
#include <map>
Mat src_threshold;
Mat src_dil;
int sunImage(Mat &image);
vector<Mat>ROI_image;//待测图片
int main() 
{
	clock_t start ,finish;
	start=clock();
	Mat src;
	src=imread("D:\\vspic\\picture\\number6.jpg");
	resize(src,src,Size(src.cols/7,src.rows/7));
	imshow("src",src);
	Mat src_gray;
	cvtColor(src,src_gray,COLOR_BGR2GRAY);
	//imshow("gsrc_ray",src_gray);
	Mat src_blur;
	blur(src_gray,src_blur,Size(9,9));
	//GaussianBlur(src_gray,src_blur,Size(11,11),1,1);
	Mat src_threshold;
	threshold(src_blur,src_threshold,150,255,THRESH_OTSU);
	//imshow("src_threshold",src_threshold);
	Mat src_canny;
	Canny(src_threshold,src_canny,125,255,3);
	//imshow("src_canny",src_canny);
	vector<vector<Point>>contours_src;
	vector<Vec4i>hierarchy_src(contours_src.size());
	findContours(src_canny,contours_src,hierarchy_src,RETR_EXTERNAL,CHAIN_APPROX_NONE);
	Rect rect_s;
	Rect choose_rect;
	for (size_t i=0;i<contours_src.size();i++)
	{
		rect_s=boundingRect(contours_src[i]);
		double width=rect_s.width;
		double height= rect_s.height;
		double bizhi=width/height;
		if (bizhi>1.5&&height>50)
		{
			/*rectangle(src,rect_s.tl(),rect_s.br(),Scalar(255,255,255),1,1,0);*/
			choose_rect=Rect(rect_s.x+20,rect_s.y+30,rect_s.x-30,rect_s.y-108);
		}
	}
	Mat roi;
	roi=src(choose_rect);
	//imshow("src_",roi);
	Mat img =roi;
	Mat gray_img;
	// 生成灰度图像
	cvtColor(img, gray_img, CV_BGR2GRAY);
	// 高斯模糊
	Mat img_gau;
	GaussianBlur(gray_img, img_gau, Size(3, 3), 0, 0);
	// 阈值分割
	Mat img_seg;
	threshold(img_gau, img_seg, 0, 255, THRESH_BINARY + THRESH_OTSU);
	Mat element;
	element=getStructuringElement(MORPH_RECT,Size(8,8));
	erode(img_seg,src_dil,element);
	//imshow("src_dil",src_dil);
	// 边缘检测，提取轮廓
	Mat img_canny;
	Canny(src_dil, img_canny, 200, 100);
	//imshow("canny",img_canny);
	vector<vector<Point>> contours;
	vector<Vec4i> hierarchy(contours.size());
	findContours(img_canny, contours, hierarchy, CV_RETR_EXTERNAL, CV_CHAIN_APPROX_NONE, Point());//寻找轮廓
	int size = (int)(contours.size());//轮廓的数量
	//cout<<size<<endl;6个
	// 保存符号边框的序号
	vector<int> num_order;//定义一个整型int容器
	map<int, int> num_map;//容器，需要关键字和模板对象两个模板参数，此处定义一个int作为索引，并拥有相关连的指向int的指针
	for (int i = 0; i < size; i++)
   {
		// 获取边框数据
		Rect number_rect = boundingRect(contours[i]);
		int width = number_rect.width;//获取矩形的宽
		int height = number_rect.height;//获取矩形的高
		// 去除较小的干扰边框，筛选出合适的区域
		if (width > img.cols/20 )
		{
			rectangle(img,number_rect.tl(),number_rect.br(),Scalar(255,255,255),1,1,0);//绘制矩形
			imshow("img",img);//显示矩形框
			num_order.push_back(number_rect.x);//把矩形的x坐标放入number_order容器中，将一个新的元素添加到vector的最后面，
			//位置为当前元素的下一个元素
			num_map[number_rect.x] = i;//向map中存入键值对，number_rect.x是关键字，i是值
			/*把矩形框的x坐标与对应的i值一起放入map容器中，形成一一对应的键值对
			*/
		}
	}
	// 按符号顺序提取
	sort(num_order.begin(), num_order.end());/*把number_order容器中的内容按照从小到大的顺序排列,这里面是X的坐标*/
	for (int i = 0; i < num_order.size(); i++) {
		Rect number_rect = boundingRect(contours[num_map.find(num_order[i])->second]);//num_order里面放的是坐标
		//cout<<"num_map的值是："<<num_map.find(num_order[i])->second<<endl;
		Rect choose_rect(number_rect.x, 0, number_rect.width, img.rows);//矩形左上角x,y的坐标以及矩形的宽和高
		Mat number_img = img(choose_rect);
		resize(number_img,number_img,Size(30,100));//归一化尺寸
		ROI_image.push_back(number_img);//保存为待测图片
		//imshow("number" + to_string(i), number_img);
		char name[50];
		sprintf_s(name,"D:\\vs2012\\model\\%d.jpg",i);//保存模板
		imwrite(name, number_img);	
	}
	cout<<"图片分割完毕"<<endl;
	//加载模板
	vector<Mat>temptImage;//存放模板
	for (int i=0;i<4;i++)
	{
		char name[50];
		sprintf_s(name,"D:\\vs2012\\model\\%d.jpg",i);
		Mat temp;
		temp=imread(name);
		//cout<<"加载模板图片通道数："<<temp.channels()<<endl;
		temptImage.push_back(temp);
	}
	vector<int>seq;//存放顺序结果
	for (int i=0;i<ROI_image.size();i++)
	{
		Mat subImage;
		int sum=0;
		int min=50000;
		int seq_min=0;//记录最小的和对应的数字
		for (int j=0;j<4;j++)
		{
			absdiff(ROI_image[i],temptImage[j],subImage);//待测图片像素减去模板图片像素
			sum=sunImage(subImage);//统计像素和
			if (sum<min)
			{
				min=sum;
			    seq_min=j;
			}
			sum=0;
		}
		seq.push_back(seq_min);
	}
	cout<<"输出数字匹配结果:";//endl是换行的意思
	for (int i=0;i<seq.size();i++)//输出结果，小数点固定在第3位
	{
		cout<<seq[i];
		if (i==1)
		{
			cout<<".";
		}
	}
	finish=clock();
	double all_time=double(finish-start)/CLOCKS_PER_SEC;
	/*cout<<"运行总时间是："<<all_time<<endl;*/
	waitKey(0);
	return 0;
}
//计算像素和
int sunImage(Mat &image)
{
	int sum=0;
	for (int i=0;i<image.cols;i++)
	{
		for (int j=0;j<image.rows;j++)
		{
			sum+=image.at<uchar>(j,i);
		}
	}
	return sum;
}

整体思路是这样子的：0-9这10个数字也都是已经被分割好的，并且保存好了，也就是模板，然后我们把待测的图片也分割掉，然后从0-9模板文件夹中去读取模板图片，让待测的分割完毕的图片去和10个模板逐个相减，然后去统计他们相减后的像素和，如果这个在这10个中最低，那么他们就是同一个数字，然后输出值就可以了，分割后的大概是这样

上边是第一种方法，然后还有第二种，是穿针引线的方法，是根据晶体管数字特征来识别的

这是晶体管数字的特征，每个0-9每个数字都是不一样的，我们下一篇文章再做详细的介绍

总结

到此这篇关于如何基于opencv实现简单的数字识别的文章就介绍到这了,更多相关opencv实现数字识别内容请搜索猪先飞以前的文章或继续浏览下面的相关文章希望大家以后多多支持猪先飞！

[!--infotagslink--]

上一篇: 一小时学会TensorFlow2之Fashion Mnist

下一篇: Python结合Selenium简单实现Web自动化测试

python opencv 画外接矩形框的完整代码
这篇文章主要介绍了python-opencv-画外接矩形框的实例代码，代码简单易懂，对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下...2021-09-04
金额阿拉伯数字转换为中文的存储过程
Create Procedure AtoC @ChangeMoney Money as Set Nocount ON Declare @String1 char(20) Declare @String2 char(30) ...2016-11-25
c#中判断字符串是不是数字或字母的方法
这篇文章介绍了C#判断字符串是否数字或字母的实例，有需要的朋友可以参考一下...2020-06-25
金额阿拉伯数字转换为中文的自定义函数
CREATE FUNCTION ChangeBigSmall (@ChangeMoney money) RETURNS VarChar(100) AS BEGIN Declare @String1 char(20) Declare @String2 char...2016-11-25
C#实现猜数字游戏
这篇文章主要为大家详细介绍了C#实现猜数字游戏，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下...2020-06-25
python opencv通过4坐标剪裁图片
图片剪裁是常用的方法，那么如何通过4坐标剪裁图片，本文就详细的来介绍一下，感兴趣的小伙伴们可以参考一下...2021-06-04
安卓开发之设置密码只能输入字母和数字的组合
设置登录密码我们一般会有限制的如由什么组合了，下面我们来看一篇关于安卓开发之设置密码只能输入字母和数字的组合方法，具体的细节如下所示。无论是电脑还是手机...2016-09-20
php导出csv格式数据并将数字转换成文本的思路以及代码分享
php导出csv格式数据实现：先定义一个字符串存储内容，例如 $exportdata = '规则111,规则222,审222,规222,服2222,规则1,规则2,规则3,匹配字符,设置时间,有效期'."/n";然后对需要保存csv的数组进行foreach循环，例如复制代...2014-06-07
C#判断一个字符串是否是数字或者含有某个数字的方法
这篇文章主要介绍了C#判断一个字符串是否是数字或者含有某个数字的方法，本文给大家介绍的非常详细，具有一定的参考借鉴价值,需要的朋友可以参考下...2020-06-25
OpenCV如何去除图片中的阴影的实现
这篇文章主要介绍了OpenCV如何去除图片中的阴影的实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧...2021-03-29
解决使用OpenCV中的imread()内存报错问题
这篇文章主要介绍了解决使用OpenCV中的imread()内存报错问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2021-03-16
python OpenCV学习笔记
这篇文章主要介绍了python OpenCV的相关资料，帮助大家更好的理解和学习使用python的opencv，感兴趣的朋友可以了解下...2021-03-31
php生成唯一数字id的方法汇总
关于生成唯一数字ID的问题，是不是需要使用rand生成一个随机数，然后去数据库查询是否有这个数呢？感觉这样的话有点费时间，有没有其他方法呢？当然不是，其实有两种方法可以解决。 1. 如果你只用php而不用数据库的话，那时间戳+随...2015-11-24
使用OpenCV去除面积较小的连通域
这篇文章主要介绍了使用OpenCV去除面积较小的连通域，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...2020-07-05
C#将数字转换成字节数组的方法
这篇文章主要介绍了C#将数字转换成字节数组的方法,涉及C#字符串操作的技巧,非常具有实用价值,需要的朋友可以参考下...2020-06-25
C++实现数字转换为十六进制字符串的方法
这篇文章主要介绍了C++实现数字转换为十六进制字符串的方法,涉及C++操作数字与字符串转换的相关技巧,需要的朋友可以参考下...2020-04-25
php数字每三位加逗号的功能函数
php实现数字格式化，数字每三位加逗号的功能函数，具体代码如下： function num_format($num){ if(!is_numeric($num)){ return false; } $num = explode('.',$num);//把整数和小数分开 $rl = $num[1];//小数部分的值...2015-10-23
详解pycharm的python包opencv（cv2）无代码提示问题的解决
这篇文章主要介绍了详解pycharm的python包opencv（cv2）无代码提示问题的解决，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧...2021-01-29
在C#中使用OpenCV（使用OpenCVSharp）的实现
这篇文章主要介绍了在C#中使用OpenCV（使用OpenCVSharp）的实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧...2020-11-15
Lua判断变量是否为数字、字符串是否可以转换为数字等
这篇文章主要介绍了Lua判断变量是否为数字、字符串是否可以转换为数字等,本文讲解了Lua 判断是字符还是数字的方法、Lua判断数字的方法、判断可否转换为数字的方法、判断并且准备一个初值的方法,需要的朋友可以参考下...2020-06-30

如何基于opencv实现简单的数字识别

目录

前言

要解决的问题

解决问题的思路

总结

相关文章

阁下可能感兴趣的内容

推荐阅读