C++多线程编程时的数据保护

更新时间：2020年4月25日 17:38 点击：1453

在编写多线程程序时，多个线程同时访问某个共享资源，会导致同步的问题，这篇文章中我们将介绍 C++11 多线程编程中的数据保护。
数据丢失

让我们从一个简单的例子开始，请看如下代码：

#include <iostream>
#include <string>
#include <thread>
#include <vector>
 
using std::thread;
using std::vector;
using std::cout;
using std::endl;
 
class Incrementer
{
  private:
    int counter;
 
  public:
    Incrementer() : counter{0} { };
 
    void operator()()
    {
      for(int i = 0; i < 100000; i++)
      {
        this->counter++;
      }
    }
 
    int getCounter() const
    {
      return this->counter;
    }   
};
 
int main()
{
  // Create the threads which will each do some counting
  vector<thread> threads;
 
  Incrementer counter;
 
  threads.push_back(thread(std::ref(counter)));
  threads.push_back(thread(std::ref(counter)));
  threads.push_back(thread(std::ref(counter)));
 
  for(auto &t : threads)
  {
    t.join();
  }
 
  cout << counter.getCounter() << endl;
 
  return 0;
}

这个程序的目的就是数数，数到30万，某些傻叉程序员想要优化数数的过程，因此创建了三个线程，使用一个共享变量 counter，每个线程负责给这个变量增加10万计数。

这段代码创建了一个名为 Incrementer 的类，该类包含一个私有变量 counter，其构造器非常简单，只是将 counter 设置为 0.

紧接着是一个操作符重载，这意味着这个类的每个实例都是被当作一个简单函数来调用的。一般我们调用类的某个方法时会这样 object.fooMethod()，但现在你实际上是直接调用了对象，如object(). 因为我们是在操作符重载函数中将整个对象传递给了线程类。最后是一个 getCounter 方法，返回 counter 变量的值。

再下来是程序的入口函数 main()，我们创建了三个线程，不过只创建了一个 Incrementer 类的实例，然后将这个实例传递给三个线程，注意这里使用了 std::ref ，这相当于是传递了实例的引用对象，而不是对象的拷贝。

现在让我们来看看程序执行的结果，如果这位傻叉程序员还够聪明的话，他会使用 GCC 4.7 或者更新版本，或者是 Clang 3.1 来进行编译，编译方法：

g++ -std=c++11 -lpthread -o threading_example main.cpp

运行结果：

[lucas@lucas-desktop src]$ ./threading_example
218141
[lucas@lucas-desktop src]$ ./threading_example
208079
[lucas@lucas-desktop src]$ ./threading_example
100000
[lucas@lucas-desktop src]$ ./threading_example
202426
[lucas@lucas-desktop src]$ ./threading_example
172209

但等等，不对啊，程序并没有数数到30万，有一次居然只数到10万，为什么会这样呢？好吧，加1操作对应实际的处理器指令其实包括：

movl  counter(%rip), %eax
addl  $1, %eax
movl  %eax, counter(%rip)

首个指令将装载 counter 的值到 %eax 寄存器，紧接着寄存器的值增1，然后将寄存器的值移给内存中 counter 所在的地址。

我听到你在嘀咕：这不错，可为什么会导致数数错误的问题呢？嗯，还记得我们以前说过线程会共享处理器，因为只有单核。因此在某些点上，一个线程会依照指令执行完成，但在很多情况下，操作系统会对线程说：时间结束了，到后面排队再来，然后另外一个线程开始执行，当下一个线程开始执行时，它会从被暂停的那个位置开始执行。所以你猜会发生什么事，当前线程正准备执行寄存器加1操作时，系统把处理器交给另外一个线程？

我真的不知道会发生什么事，可能我们在准备加1时，另外一个线程进来了，重新将 counter 值加载到寄存器等多种情况的产生。谁也不知道到底发生了什么。

正确的做法

解决方案就是要求同一个时间内只允许一个线程访问共享变量。这个可通过 std::mutex 类来解决。当线程进入时，加锁、执行操作，然后释放锁。其他线程想要访问这个共享资源必须等待锁释放。

互斥(mutex) 是操作系统确保锁和解锁操作是不可分割的。这意味着线程在对互斥量进行锁和解锁的操作是不会被中断的。当线程对互斥量进行锁或者解锁时，该操作会在操作系统切换线程前完成。

而最好的事情是，当你试图对互斥量进行加锁操作时，其他的线程已经锁住了该互斥量，那你就必须等待直到其释放。操作系统会跟踪哪个线程正在等待哪个互斥量，被堵塞的线程会进入 "blocked onm" 状态，意味着操作系统不会给这个堵塞的线程任何处理器时间，直到互斥量解锁，因此也不会浪费 CPU 的循环。如果有多个线程处于等待状态，哪个线程最先获得资源取决于操作系统本身，一般像 Windows 和 Linux 系统使用的是 FIFO 策略，在实时操作系统中则是基于优先级的。

现在让我们对上面的代码进行改进：

#include <iostream>
#include <string>
#include <thread>
#include <vector>
#include <mutex>
 
using std::thread;
using std::vector;
using std::cout;
using std::endl;
using std::mutex;
 
class Incrementer
{
  private:
    int counter;
    mutex m;
 
  public:
    Incrementer() : counter{0} { };
 
    void operator()()
    {
      for(int i = 0; i < 100000; i++)
      {
        this->m.lock();
        this->counter++;
        this->m.unlock();
      }
    }
 
    int getCounter() const
    {
      return this->counter;
    } 
};
 
int main()
{
  // Create the threads which will each do some counting
  vector<thread> threads;
 
  Incrementer counter;
 
  threads.push_back(thread(std::ref(counter)));
  threads.push_back(thread(std::ref(counter)));
  threads.push_back(thread(std::ref(counter)));
 
  for(auto &t : threads)
  {
    t.join();
  }
 
  cout << counter.getCounter() << endl;
 
  return 0;
}

注意代码上的变化：我们引入了 mutex 头文件，增加了一个 m 的成员，类型是 mutex，在operator()() 中我们锁住互斥量 m 然后对 counter 进行加1操作，然后释放互斥量。

再次执行上述程序，结果如下：

[lucas@lucas-desktop src]$ ./threading_example
300000
[lucas@lucas-desktop src]$ ./threading_example
300000

这下数对了。不过在计算机科学中，没有免费的午餐，使用互斥量会降低程序的性能，但这总比一个错误的程序要强吧。

防范异常

当对变量进行加1操作时，是可能会发生异常的，当然在我们这个例子中发生异常的机会微乎其微，但是在一些复杂系统中是极有可能的。上面的代码并不是异常安全的，当异常发生时，程序已经结束了，可是互斥量还是处于锁的状态。

为了确保互斥量在异常发生的情况下也能被解锁，我们需要使用如下代码：

for(int i = 0; i < 100000; i++)
{
 this->m.lock();
 try
  {
   this->counter++;
   this->m.unlock();
  }
  catch(...)
  {
   this->m.unlock();
   throw;
  }
}

但是，这代码太多了，而只是为了对互斥量进行加锁和解锁。没关系，我知道你很懒，因此推荐个更简单的单行代码解决方法，就是使用 std::lock_guard 类。这个类在创建时就锁定了 mutex 对象，然后在结束时释放。

继续修改代码：

void operator()()
{
  for(int i = 0; i < 100000; i++)
  {
  lock_guard<mutex> lock(this->m);
 
  // The lock has been created now, and immediatly locks the mutex
  this->counter++;
 
  // This is the end of the for-loop scope, and the lock will be
  // destroyed, and in the destructor of the lock, it will
  // unlock the mutex
  }
}

上面代码已然是异常安全了，因为当异常发生时，将会调用 lock 对象的析构函数，然后自动进行互斥量的解锁。

记住，请使用放下代码模板来编写：

void long_function()
{
  // some long code
 
  // Just a pair of curly braces
  {
  // Temp scope, create lock
  lock_guard<mutex> lock(this->m);
 
  // do some stuff
 
  // Close the scope, so the guard will unlock the mutex
  }
}

[!--infotagslink--]

上一篇: C语言实现BMP转换JPG的方法

下一篇: C语言之字符串模糊查询方法的实现

C# WinForm多线程解决界面卡死问题的完美解决方案，使用BeginInvoke
问题描述：当我们的界面需要在程序运行中不断更新数据时，当一个textbox的数据需要变化时，为了让程序执行中不出现界面卡死的现像，最好的方法就是多线程来解决一个主线程来创建界...2020-06-24
C++ STL标准库std::vector的使用详解
vector是表示可以改变大小的数组的序列容器，本文主要介绍了C++STL标准库std::vector的使用详解，文中通过示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下...2022-03-06
C++中取余运算的实现
这篇文章主要介绍了C++中取余运算的实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧...2021-02-23
详解C++ string常用截取字符串方法
这篇文章主要介绍了C++ string常用截取字符串方法，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧...2020-04-25
C++调用C#的DLL程序实现方法
本文通过例子，讲述了C++调用C#的DLL程序的方法，作出了以下总结，下面就让我们一起来学习吧。...2020-06-25
C++中四种加密算法之AES源代码
本篇文章主要介绍了C++中四种加密算法之AES源代码，小编觉得挺不错的，现在分享给大家，也给大家做个参考。...2020-04-25
C++ 整数拆分方法详解
整数拆分，指把一个整数分解成若干个整数的和。本文重点给大家介绍C++ 整数拆分方法详解，非常不错，感兴趣的朋友一起学习吧...2020-04-25
C++中 Sort函数详细解析
这篇文章主要介绍了C++中Sort函数详细解析，sort函数是algorithm库下的一个函数，sort函数是不稳定的，即大小相同的元素在排序后相对顺序可能发生改变...2022-08-18
c# 多线程处理多个数据的方法
这篇文章主要介绍了c# 多线程处理多个数据的方法，帮助大家更好的理解和学习使用c#，感兴趣的朋友可以了解下...2021-03-31
C++万能库头文件在vs中的安装步骤(图文)
这篇文章主要介绍了C++万能库头文件在vs中的安装步骤(图文)，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧...2021-02-23
C#基于委托实现多线程之间操作的方法
这篇文章主要介绍了C#基于委托实现多线程之间操作的方法,实例分析了C#的委托机制与多线程交互操作的相关技巧,具有一定参考借鉴价值,需要的朋友可以参考下...2020-06-25
详解C++ bitset用法
这篇文章主要介绍了C++ bitset用法，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧...2020-04-25
浅谈C++中的string 类型占几个字节
本篇文章小编并不是为大家讲解string类型的用法，而是讲解我个人比较好奇的问题，就是string 类型占几个字节...2020-04-25
C#多线程中的异常处理操作示例
这篇文章主要介绍了C#多线程中的异常处理操作,涉及C#多线程及异常的捕获、处理等相关操作技巧,需要的朋友可以参考下...2020-06-25
C++ Eigen库计算矩阵特征值及特征向量
这篇文章主要为大家详细介绍了C++ Eigen库计算矩阵特征值及特征向量，具有一定的参考价值，感兴趣的小伙伴们可以参考一下...2020-04-25
深入分析C#中的异步和多线程
这篇文章主要介绍了C#中异步和多线程的相关资料，帮助大家更好的理解和学习c#，感兴趣的朋友可以了解下...2021-01-16
C#多线程与异步的区别详解
多线程和异步操作两者都可以达到避免调用线程阻塞的目的，从而提高软件的可响应性。甚至有些时候我们就认为多线程和异步操作是等同的概念。但是，多线程和异步操作还是有一些区别的。而这些区别造成了使用多线程和异步操作的时机的区别...2020-06-25
VSCode C++多文件编译的简单使用方法
这篇文章主要介绍了VSCode C++多文件编译的简单使用方法,本文给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下...2021-03-29
C++ pair的用法实例详解
这篇文章主要介绍了C++ pair的用法实例详解的相关资料,需要的朋友可以参考下...2020-04-25
C++中的循环引用
虽然C++11引入了智能指针的，但是开发人员在与内存的斗争问题上并没有解放，如果我门实用不当仍然有内存泄漏问题，其中智能指针的循环引用缺陷是最大的问题。下面通过实例代码给大家介绍c++中的循环引用，一起看看吧...2020-04-25

C++多线程编程时的数据保护

相关文章

阁下可能感兴趣的内容

推荐阅读