文章目录
1.thread线程库
1.1thread类的简单使用
在C++11之前,涉及到多线程问题,都是和平台相关的,比如windows和linux下各有自己的接口,这使得代码的可移植性比较差。
C++11中最重要的特性就是对线程进行支持了,使得C++在并行编程时不需要依赖第三方库,而且在原子操作中还引入了原子类的概念。要使用标准库中的线程,必须包含< thread >头文件。
函数名 | 功能 |
---|---|
thread() | 构造一个线程对象,没有关联任何线程函数,即没有启动任何线程 |
thread(fn, args1, args2, …) | 构造一个线程对象,并关联线程函数fn,args1,args2,…为线程函数的参数 |
get_id() | 获取线程id |
jionable() | 线程是否还在执行,joinable代表的是一个正在执行中的线程。 |
jion() | 该函数调用后会阻塞住线程,当该线程结束后,主线程继续执行 |
detach() | 在创建线程对象后马上调用,用于把被创建线程与线程对象分离开,分离的线程 变为后台线程,创建的线程的"死活"就与主线程无关 |
当创建一个线程对象后,没有提供线程函数,该对象实际没有对应任何线程
int main()
{
thread t1;
cout<<t1.get_id()<<endl;
return 0;
}
输出:thread::id of a non-executing thread
get_id()的返回值类型为id类型,id类型实际为std::thread命名空间下封装的一个类,该类中包含了一个结构体
// vs下查看
typedef struct
{
/* thread identifier for Win32 */
void *_Hnd; /* Win32 HANDLE */
unsigned int _Id;
} _Thrd_imp_t
当创建一个线程对象后,并且给线程关联线程函数,该线程就被启动,与主线程一起运行。线程函数一般情况下可按照以下三种方式提供:
函数指针
lambda表达式
函数对象
void Threadfunc(int a)
{
cout<<"Thread1:"<<a<<endl;
}
class FF
{
public:
void operator()()
{
cout<<"Thread2:"<<endl;
}
};
int main()
{
//传递函数指针
thread t1(Threadfunc,10);
//传递lambda表达式
thread t2( []{ cout<<"Thread2"<<endl; } );
//线程函数为函数对象
FF ff;
thread t3(ff);
t1.join();
t2.join();
t3.join();
cout<<"This is main thread"<<endl;
return 0;
}
- 出现上面的情况是因为,线程是并行的,所以所有的线程是同时执行。
- thread类是防拷贝的,不允许拷贝构造以及赋值,但是可以移动构造和移动赋值,即将一个线程对象关联线程的状态转移给其他线程对象,转移期间不意向线程的执行
- 可以通过jionable()函数判断线程是否是有效的,如果是以下任意情况,则线程无效
- 采用无参构造函数构造的线程对象
- 线程对象的状态已经转移给其他线程对象
- 线程已经调用jion或者detach结束
1.2线程栈
C++多线程程序中,每一个线程都有一个线程栈,它们相互独立,因此在线程栈中的数据,是不会被其他线程影响到。
但是在内存中的数据段的数据,是可以在全局被访问到的。【比如静态变量,全局变量等。】
线程函数的参数是以值拷贝的方式拷贝到线程栈空间中的。因此:即使线程参数为引用类型,在线程中修改后也不能修改为外部实参,因为其实际引用的是线程栈中的拷贝,而不是外部实参。
#include <thread>
void ThreadFunc1(int& x)
{
x += 10;
}
void ThreadFunc2(int* x)
{
*x += 10;
}
int main()
{
int a = 10;
// 在线程函数中对a修改,不会影响外部实参,因为:线程函数参数虽然是引用方式,但其实际引用的是线程栈中的拷贝
thread t1(ThreadFunc1, a);
t1.join();
cout << a << endl;
// 如果想要通过形参改变外部实参时,必须借助std::ref()函数
thread t2(ThreadFunc1, std::ref(a);
t2.join();
cout << a << endl;
// 地址的拷贝
thread t3(ThreadFunc2, &a);
t3.join();
cout << a << endl;
return 0;
}
1.3join与detach
1.3.1join()
启动了一个线程后,当这个线程结束的时候,thread库给我们两种选择去回收线程的资源:
join()方式:
join():主线程被阻塞,当新线程终止时,join()会清理相关的线程资源,然后返回,主线程再继续向下执行,然后销毁线程对象。由于join()清理了线程的相关资源,thread对象与已销毁的线程就没有关系了,因此一个线程对象只能使用一次join(),否则程序会崩溃。
// jion()的误用
void ThreadFunc() { cout<<"ThreadFunc()"<<endl; }
bool DoSomething()
{
return false;
}
int main()
{
std::thread t(ThreadFunc);
if(!DoSomething())
return -1;
t.join();
return 0;
}
/*
如果DoSomething()函数返回false,主线程将会结束,join()没有调用,线程资源没有回收,最后造成资源泄漏。
*/
采用jion()方式结束线程时,jion()的调用位置非常关键。为了避免该问题,**可以采用RAII【资源获取就是初始化】**的方式对线程对象进行封装。
class mythread
{
public:
//构造函数
explicit mythread(std::thread& t):my_t(t){}
//析构函数
~mythread()
{
if(!my_t.joinable())
{
//如果线程没有在运行,就回收线程资源
my_t.join();
}
}
mythread(mythread const&)=delete;
mythread& operator=(const mythread&)=delete;
private:
std:thread& my_t;
}
1.3.2 detach()方式
detach():该函数被调用后,新线程与线程对象分离,不再被线程对象所表达,就不能通过线程对象控制线程了,新线程会在后台运行,其所有权和控制权将会交给c++运行库。同时,C++运行库保证,当线程退出时,其相关资源的能够正确的回收。 【总而言之,调用detach()就是让系统回收资源】
1.4死锁问题
定义:死锁是值两个或者两个以上的进程在执行过程中,由于竞争资源或者由于彼此通信而造成的一种阻塞现象。 若无外力作用,它们都将无法推进下去,此时称系统处于死锁状态或系统产生了死锁,而这些永远在互相等待的进程称为死锁进程。
例如,如果线程A锁住了记录1并等待记录2,而线程B锁住了记录2并等待记录1,这样两个线程就发生了死锁现象。
1.4.1情况一:忘记释放锁
函数调用先于释放锁,锁还没来得及释放进程就退出。
std::mutex m;
void func()
{
//进程报锁
m.lock();
if(1)
{
return ;
}
m.unlock();
}
1.4.2情况二:线程重复申请锁
mutex _mutex;
void func()
{
_mutex.lock();
//do somrthing....
//重复申请锁,第二次申请处于阻塞等待状态
_mutex.lock();
_mutex.unlock();
}
1.4.3双线程多锁申请
下面的例子中,process1和process2先对_mutex1和_mutex2上锁。
然后由于 _ mutex2已经上锁,process1会一直阻塞等待 _ mutex2;同样,由于 _ mutex1上锁,process2会一直阻塞等待 _mutex1
mutex _mutex1;
mutex _mutex2;
void process1() {
_mutex1.lock();
_mutex2.lock();
//do something1...
_mutex2.unlock();
_mutex1.unlock();
}
void process2() {
_mutex2.lock();
_mutex1.lock();
//do something2...
_mutex1.unlock();
_mutex2.unlock();
}
1.5原子性操作库
多线程最主要的问题是共享数据带来的问题(线程安全问题)。当一个或多个线程要修改共享数据时,就会产生很多潜在的麻烦。
#include <iostream>
using namespace std;
#include <thread>
unsigned long sum = 0;
void fun(size_t num)
{
for (size_t i = 0; i < num; ++i)
sum++;
}
int main()
{
cout << "Before joining,sum = " << sum << std::endl;
thread t1(fun, 10000000);
thread t2(fun, 10000000);
t1.join();
t2.join();
cout << "After joining,sum = " << sum << std::endl;
return 0;
}
输出:
Before joining,sum = 0
After joining,sum = 11007837
C++98中的解决方法:对需要修改的共享数据加锁保护
mutex m;
unsigned long sum = 0;
void fun(size_t num)
{
for (size_t i = 0; i < num; ++i)
{
//让进程报锁
m.lock();
sum++;
//进程解锁
m.unlock();
}
}
int main()
{
cout << "Before joining,sum = " << sum << std::endl;
thread t1(fun, 10000000);
thread t2(fun, 10000000);
t1.join();
t2.join();
cout << "After joining,sum = " << sum << std::endl;
return 0;
}
输出:
Before joining,sum = 0
After joining,sum = 20000000
虽然加锁可以解决,但是加锁有一个缺陷就是:只要一个线程在sum++时,其他线程就会被阻塞,会影响程序运行的效率,而且锁如果控制不好,还容易造成死锁 。
因此C++11中引入了原子操作。所谓原子操作:即不可被中断的一个或一系列操作,C++11引入的原子操作类型,使得线程间数据的同步变得非常高效 。
#include <iostream>
using namespace std;
#include <thread>
#include <atomic>
//实现原子操作
atomic_long sum{ 0 };
void fun(size_t num)
{
for (size_t i = 0; i < num; ++i)
sum ++; // 原子操作
}
int main()
{
cout << "Before joining, sum = " << sum << std::endl;
thread t1(fun, 1000000);
thread t2(fun, 1000000);
t1.join();
t2.join();
cout << "After joining, sum = " << sum << std::endl;
return 0;
}
输出:
Before joining, sum = 0
After joining, sum = 2000000
在C++11中,不需要对原子类型变量进行加锁解锁操作,线程能够对原子类型变量互斥的访问。更为普遍的,程序员可以使用atomic类模板,定义出需要的任意原子类型。
atmoic<T> t; //声明一个类型为T的原子类型变量
注意:原子类型通常属于"资源型"数据,多个线程只能访问单个原子类型的拷贝,因此在C++11中,原子类型只能从其模板参数中进行构造,不允许原子类型进行拷贝构造、移动构造以及operator=等,为了防止意外,标准库已经将atmoic模板类中的拷贝构造、移动构造、赋值运算符重载默认删除掉了。
2.lock_guardy与unique_lock
在多线程环境下,如果想要保证某个变量的安全性,只要将其设置成对应的原子类型即可,即高效又不容易出现死锁问题。但是有些情况下,我们可能需要保证一段代码的安全性,那么就只能通过锁的方式来进行控制
//全局变量属于线程共享资源
int number = 0;
mutex g_lock;
int ThreadProc1()
{
for (int i = 0; i < 100; i++)
{
g_lock.lock();
++number;
cout << "thread 1 :" << number << endl;
g_lock.unlock();
}
return 0;
}
int ThreadProc2()
{
for (int i = 0; i < 100; i++)
{
g_lock.lock();
--number;
cout << "thread 2 :" << number << endl;
g_lock.unlock();
}
return 0;
}
int main()
{
thread t1(ThreadProc1);
thread t2(ThreadProc2);
t1.join();
t2.join();
cout << "number:" << number << endl;
system("pause");
return 0;
}
上述代码的缺陷:锁控制不好时,可能会造成死锁,最常见的比如在锁中间代码返回,或者在锁的范围内抛异常。
因此:C++11采用RAII的方式对锁进行了封装,即lock_guard和unique_lock 。
2.1Mutex的种类
在C++11中,Mutex总共包了四个互斥量的种类 :
1.std::mutex
C++11提供的最基本的互斥量,该类的对象之间不能拷贝,也不能进行移动。mutex最常用的三个函数:
函数名 | 函数功能 |
---|---|
lock() | 上锁:锁住互斥量 |
unlock() | 解锁:释放对互斥量的所有权 |
try_lock() | 尝试锁住互斥量,如果互斥量被其他线程占有,则当前线程也不会被阻塞 |
线程函数调用lock()时,可能会发生以下三种情况:
如果该互斥量当前没有被锁住,则调用线程将该互斥量锁住,直到调用 unlock之前,该线程一直拥有该锁
如果当前互斥量被其他线程锁住,则当前的调用线程被阻塞住
如果当前互斥量被当前调用线程锁住,则会产生死锁(deadlock)
线程函数调用try_lock()时,可能会发生以下三种情况:
- 如果当前互斥量没有被其他线程占有,则该线程锁住互斥量,直到该线程调用 unlock释放互斥量。
- 如果当前互斥量被其他线程锁住,则当前调用线程返回 false,而并不会被阻塞掉。
- 如果当前互斥量被当前调用线程锁住,则会产生死锁(deadlock)。
**2.std::recursive_mutex **
允许同一个线程对互斥量多次上锁(即递归上锁),来获得对互斥量对象的多层所有权,释放互斥量时需要调用与该锁层次深度相同次数的unlock(),除此之外,std::recursive_mutex 的特性和std::mutex 大致相同。
3.std::timed_mutex
比 std::mutex 多了两个成员函数,try_lock_for(),try_lock_until()
try_lock_for()
接受一个时间范围,表示在这一段时间范围之内线程如果没有获得锁则被阻塞住(与 std::mutex的 try_lock() 不同,try_lock 如果被调用时没有获得锁则直接返回 false),如果在此期间其他线程释放了锁,则该线程可以获得对互斥量的锁,如果超时(即在指定时间内还是没有获得锁),则返回 false。try_lock_until()
接受一个时间点作为参数,在指定时间点未到来之前线程如果没有获得锁则被阻塞住,如果在此期间其他线程释放了锁,则该线程可以获得对互斥量的锁,如果超时(即在指定时间内还是没有获得锁),则返回 false。
2.2lock_guard
std::lock_gurad 是 C++11 中定义的模板类。定义如下 :
template<class _Mutex>
class lock_guard
{
public:
// 在构造lock_gard时,_Mtx还没有被上锁
explicit lock_guard(_Mutex& _Mtx)
: _MyMutex(_Mtx)
{
MyMutex.lock();
}
// 在构造lock_gard时,如果_Mtx已经被上锁,此处不需要再上锁
lock_guard(_Mutex& _Mtx, adopt_lock_t)
: _MyMutex(_Mtx)
{}
~lock_guard() _NOEXCEPT
{
_MyMutex.unlock();
}
lock_guard(const lock_guard&) = delete;
lock_guard& operator=(const lock_guard&) = delete;
private:
_Mutex& _MyMutex;
};
lock_guard可以简化lock/unlock的写法,同时也更安全,因为lock_guard在构造时会自动锁定互斥量,而在退出作用域后进行析构会自动解锁,从而保证了互斥量的正确操作,避免忘记unlock操作,因此,应尽量用lock_guard。lock_guard用到了RAII技术,这种技术在类的构造函数中分配资源,在析构函数中释放资源,保证了资源在出了作用域之后就释放。
下面是使用lock_guard的简单例子
#include <iostream> // std::cout
#include <thread> // std::thread
#include <mutex> // std::mutex, std::lock_guard, std::adopt_lock
//定义互斥量
std::mutex mtx; // mutex for critical section
void print_thread_id (int id)
{
mtx.lock();
//此时mtx已经上锁,所以需要使用adopt_lock
std::lock_guard<std::mutex> lck(mtx, std::adopt_lock);
std::cout << "thread #" << id << '\n';
}
//析构时,会自动的调用unlock函数
int main ()
{
std::thread threads[10];
// spawn 10 threads:
for (int i=0; i<10; ++i)
threads[i] = std::thread(print_thread_id,i+1);
//回收线程
for (auto& th : threads) th.join();
return 0;
}
输出:
thread #1
thread #2
thread #3
thread #4
thread #5
thread #6
thread #7
thread #8
thread #9
thread #10
2.3unique_lock
与lock_gard类似,unique_lock类模板也是采用RAII的方式对锁进行了封装,并且也是以独占所有权的方式管理mutex对象的上锁和解锁操作,即其对象之间不能发生拷贝。
在构造(或移动(move)赋值)时,unique_lock 对象需要传递一个 Mutex 对象作为它的参数,新创建的 unique_lock 对象负责传入的 Mutex对象的上锁和解锁操作。使用以上类型互斥量实例化unique_lock的对象时,自动调用构造函数上锁,unique_lock对象销毁时自动调用析构函数解锁,可以很方便的防止死锁问题。与lock_guard不同的是,unique_lock更加的灵活,提供了更多的成员函数:
- 上锁/解锁操作:lock、try_lock、try_lock_for、try_lock_until和unlock
- 修改操作:移动赋值、交换(swap:与另一个unique_lock对象互换所管理的互斥量所有权)、释放(release:返回它所管理的互斥量对象的指针,并释放所有权)
- 获取属性:owns_lock(返回当前对象是否上了锁)、operator bool()(与owns_lock()的功能相同)、mutex(返回当前unique_lock所管理的互斥量的指针)