C#实现的字符串相似度对比类
更新时间:2020年6月25日 11:28 点击:2172
本类适用于比较2个字符的相似度,代码如下:
using System; using System.Collections.Generic; using System.Text; public class StringCompute { #region 私有变量 /// <summary> /// 字符串1 /// </summary> private char[] _ArrChar1; /// <summary> /// 字符串2 /// </summary> private char[] _ArrChar2; /// <summary> /// 统计结果 /// </summary> private Result _Result; /// <summary> /// 开始时间 /// </summary> private DateTime _BeginTime; /// <summary> /// 结束时间 /// </summary> private DateTime _EndTime; /// <summary> /// 计算次数 /// </summary> private int _ComputeTimes; /// <summary> /// 算法矩阵 /// </summary> private int[,] _Matrix; /// <summary> /// 矩阵列数 /// </summary> private int _Column; /// <summary> /// 矩阵行数 /// </summary> private int _Row; #endregion #region 属性 public Result ComputeResult { get { return _Result; } } #endregion #region 构造函数 public StringCompute(string str1, string str2) { this.StringComputeInit(str1, str2); } public StringCompute() { } #endregion #region 算法实现 /// <summary> /// 初始化算法基本信息 /// </summary> /// <param name="str1">字符串1</param> /// <param name="str2">字符串2</param> private void StringComputeInit(string str1, string str2) { _ArrChar1 = str1.ToCharArray(); _ArrChar2 = str2.ToCharArray(); _Result = new Result(); _ComputeTimes = 0; _Row = _ArrChar1.Length + 1; _Column = _ArrChar2.Length + 1; _Matrix = new int[_Row, _Column]; } /// <summary> /// 计算相似度 /// </summary> public void Compute() { //开始时间 _BeginTime = DateTime.Now; //初始化矩阵的第一行和第一列 this.InitMatrix(); int intCost = 0; for (int i = 1; i < _Row; i++) { for (int j = 1; j < _Column; j++) { if (_ArrChar1[i - 1] == _ArrChar2[j - 1]) { intCost = 0; } else { intCost = 1; } //关键步骤,计算当前位置值为左边+1、上面+1、左上角+intCost中的最小值 //循环遍历到最后_Matrix[_Row - 1, _Column - 1]即为两个字符串的距离 _Matrix[i, j] = this.Minimum(_Matrix[i - 1, j] + 1, _Matrix[i, j - 1] + 1, _Matrix[i - 1, j - 1] + intCost); _ComputeTimes++; } } //结束时间 _EndTime = DateTime.Now; //相似率 移动次数小于最长的字符串长度的20%算同一题 int intLength = _Row > _Column ? _Row : _Column; _Result.Rate = (1 - (decimal)_Matrix[_Row - 1, _Column - 1] / intLength); _Result.UseTime = (_EndTime - _BeginTime).ToString(); _Result.ComputeTimes = _ComputeTimes.ToString(); _Result.Difference = _Matrix[_Row - 1, _Column - 1]; } /// <summary> /// 计算相似度(不记录比较时间) /// </summary> public void SpeedyCompute() { //开始时间 //_BeginTime = DateTime.Now; //初始化矩阵的第一行和第一列 this.InitMatrix(); int intCost = 0; for (int i = 1; i < _Row; i++) { for (int j = 1; j < _Column; j++) { if (_ArrChar1[i - 1] == _ArrChar2[j - 1]) { intCost = 0; } else { intCost = 1; } //关键步骤,计算当前位置值为左边+1、上面+1、左上角+intCost中的最小值 //循环遍历到最后_Matrix[_Row - 1, _Column - 1]即为两个字符串的距离 _Matrix[i, j] = this.Minimum(_Matrix[i - 1, j] + 1, _Matrix[i, j - 1] + 1, _Matrix[i - 1, j - 1] + intCost); _ComputeTimes++; } } //结束时间 //_EndTime = DateTime.Now; //相似率 移动次数小于最长的字符串长度的20%算同一题 int intLength = _Row > _Column ? _Row : _Column; _Result.Rate = (1 - (decimal)_Matrix[_Row - 1, _Column - 1] / intLength); // _Result.UseTime = (_EndTime - _BeginTime).ToString(); _Result.ComputeTimes = _ComputeTimes.ToString(); _Result.Difference = _Matrix[_Row - 1, _Column - 1]; } /// <summary> /// 计算相似度 /// </summary> /// <param name="str1">字符串1</param> /// <param name="str2">字符串2</param> public void Compute(string str1, string str2) { this.StringComputeInit(str1, str2); this.Compute(); } /// <summary> /// 计算相似度 /// </summary> /// <param name="str1">字符串1</param> /// <param name="str2">字符串2</param> public void SpeedyCompute(string str1, string str2) { this.StringComputeInit(str1, str2); this.SpeedyCompute(); } /// <summary> /// 初始化矩阵的第一行和第一列 /// </summary> private void InitMatrix() { for (int i = 0; i < _Column; i++) { _Matrix[0, i] = i; } for (int i = 0; i < _Row; i++) { _Matrix[i, 0] = i; } } /// <summary> /// 取三个数中的最小值 /// </summary> /// <param name="First"></param> /// <param name="Second"></param> /// <param name="Third"></param> /// <returns></returns> private int Minimum(int First, int Second, int Third) { int intMin = First; if (Second < intMin) { intMin = Second; } if (Third < intMin) { intMin = Third; } return intMin; } #endregion } /// <summary> /// 计算结果 /// </summary> public struct Result { /// <summary> /// 相似度 /// </summary> public decimal Rate; /// <summary> /// 对比次数 /// </summary> public string ComputeTimes; /// <summary> /// 使用时间 /// </summary> public string UseTime; /// <summary> /// 差异 /// </summary> public int Difference; }
调用方法:
// 方式一 StringCompute stringcompute1 = new StringCompute(); stringcompute1.SpeedyCompute("对比字符一", "对比字符二"); // 计算相似度, 不记录比较时间 decimal rate = stringcompute1.ComputeResult.Rate; // 相似度百分之几,完全匹配相似度为1 // 方式二 StringCompute stringcompute2 = new StringCompute(); stringcompute2.Compute(); // 计算相似度, 记录比较时间 string usetime = stringcompute2.ComputeResult.UseTime; // 对比使用时间
上一篇: C#文件合并的方法
下一篇: C#使用委托实现的快速排序算法实例
相关文章
- 我们在使用C#做项目的时候,基本上都需要制作登录界面,那么今天我们就来一步步看看,如果简单的实现登录界面呢,本文给出2个例子,由简入难,希望大家能够喜欢。...2020-06-25
- 这篇文章主要介绍了C# 字段和属性的的相关资料,文中示例代码非常详细,供大家参考和学习,感兴趣的朋友可以了解下...2020-11-03
- 这篇文章主要介绍了C#中截取字符串的的基本方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧...2020-11-03
- 本文给大家分享C#连接SQL数据库和查询数据功能的操作技巧,本文通过图文并茂的形式给大家介绍的非常详细,需要的朋友参考下吧...2021-05-17
- 这篇文章主要介绍了C#实现简单的Http请求的方法,以实例形式较为详细的分析了C#实现Http请求的具体方法,需要的朋友可以参考下...2020-06-25
- 本文主要介绍了C#中new的几种用法,具有很好的参考价值,下面跟着小编一起来看下吧...2020-06-25
使用Visual Studio2019创建C#项目(窗体应用程序、控制台应用程序、Web应用程序)
这篇文章主要介绍了使用Visual Studio2019创建C#项目(窗体应用程序、控制台应用程序、Web应用程序),小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧...2020-06-25- 这篇文章主要介绍了C#开发Windows窗体应用程序的简单操作步骤,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...2021-04-12
- 这篇文章介绍了C#判断字符串是否数字或字母的实例,有需要的朋友可以参考一下...2020-06-25
- 这篇文章主要介绍了C#从数据库读取图片并保存的方法,帮助大家更好的理解和使用c#,感兴趣的朋友可以了解下...2021-01-16
- 这篇文章主要介绍了PostgreSQL判断字符串是否包含目标字符串的多种方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下...2021-02-23
- 这篇文章主要介绍了C++ string常用截取字符串方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧...2020-04-25
- 最近做一个小项目不可避免的需要前端脚本与后台进行交互。由于是在asp.net中实现,故问题演化成asp.net中jiavascript与后台c#如何进行交互。...2020-06-25
- 本文通过例子,讲述了C++调用C#的DLL程序的方法,作出了以下总结,下面就让我们一起来学习吧。...2020-06-25
- 轻松学习C#的基础入门,了解C#最基本的知识点,C#是一种简洁的,类型安全的一种完全面向对象的开发语言,是Microsoft专门基于.NET Framework平台开发的而量身定做的高级程序设计语言,需要的朋友可以参考下...2020-06-25
- 本文主要介绍了C#变量命名规则小结,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下...2021-09-09
- 这篇文章主要介绍了C#绘制曲线图的方法,以完整实例形式较为详细的分析了C#进行曲线绘制的具体步骤与相关技巧,具有一定参考借鉴价值,需要的朋友可以参考下...2020-06-25
- 本文主要介绍了C# 中取绝对值的函数。具有很好的参考价值。下面跟着小编一起来看下吧...2020-06-25
- 这篇文章主要介绍了c#自带缓存使用方法,包括获取数据缓存、设置数据缓存、移除指定数据缓存等方法,需要的朋友可以参考下...2020-06-25
- 这篇文章主要介绍了c#中(&&,||)与(&,|)的区别详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧...2020-06-25