【转】linux服务器开发二(系统编程)--线程相关

发表于 1/18/2017 1:38:27 PM 阅读（4666）

线程概念

什么是线程

LWP：Light Weight Process，轻量级的进程，本质仍是进程（在Linux环境下）。
进程：独立地址空间，拥有PCB。
线程：也有PCB，但没有独立的地址空间（共享）。
进程与线程的区别：在于是否共享地址空间。

独居（进程）。
合租（线程）。

Linux下：

线程：最小的执行单位。
进程：最小分配资源单位，可看成是一个线程的进程。

安装man文档

sudo apt-get install glibc-doc
sudo apt-get install manpages-posix-dev

Linux内核线程实现原理

类Unix系统中，早期是没有“线程”概念的，80年代才引入，借助进程机制实现出了线程的概念。因此在这类系统中，进程和线程关系密切。
1、轻量级进程（light-weight process），也有PCB，创建线程使用的底层函数和进程一样，都是clone。
2、从内核里看进程和线程是一样的，都有各自不同的PCB，但是PCB中指向内存资源的三级页表是相同的。
3、进程可以蜕变成线程。
4、线程可看做寄存器和栈的集合。
5、在Linux下，线程是最小的执行单位；进程是最小的分配资源单位。
察看LWP号：ps -Lf pid，查看指定线程的LWP号。

三级映射

三级映射：进程PCB --> 页目录（可看成数组，首地址位于PCB中） --> 页表 --> 物理页面 --> 内存单元

参考《Linux内核源代码情景分析》 -- 毛德操

进程与线程

对于进程来说，相同的地址（同一个虚拟址）在不同的进程中，反复使用而不冲突。原因是他们虽虚拟址一样，但页目录、页表、物理页面各不相同。相同的虚拟址，映射到不同的物理页面内存单元，最终访问不同的物理页面。
但线程不同！两个线程具有各自独立的PCB，但共享同一个页目录，也就共享同一个页表和物理页面。所以两个PCB共享一个地址空间。
实际上，无论是创建的fork，还是创建线程的pthread_create，底层实现都是调用同一个内核函数clone。
如果复制对方的地址空间，那么就产生一个“进程”；如果共享对方的地址空间，就产生一个“线程”。
因此：Linux内核是不区分进程和线程的。只有用户层面上进行区分。所以，线程所有操作函数pthread_*是库函数，而非系统调用。

线程共享资源

1、文件描述符表
2、每种信号的处理方式。
3、当前工作目录。
4、用户ID和组ID。
5、内存地址空间（.text/.data/.bss/heap/共享库）

线程非共享资源

1、线程ID。
2、处理器现场和栈指针。
3、独立的栈空间（用户空间栈）。
4、errno变量.
5、信号屏蔽字。
6、调度优先级。

线程优点、缺点

优点

1、提高程序并发性。
2、开销小。
3、数据通信、共享数据方便。

缺点

1、库函数，不稳定。
2、调试、编写困难、gdb不支持。
3、对信号支持不好。

优点相对突出，缺点均不是硬伤。Linux下由于实现方法导致进程、线程差别不是很大。

线程控制原语

pthread_self函数

获取线程ID。其作用对应进程中getpid()函数。
pthread_t pthread_self(void); - 返回值：成功：0；失败：无！
线程ID：pthread_t类型，本质：在Linux下为无符号整数（%lu），其他系统中可能是结构体实现。
线程ID是进程内部，识别标志。（两个进程间，线程ID允许相同）。
注意：不应使用全局变量pthread_t tid，在子线程中通过pthread_create传出参数来获取线程ID，而应使用pthread_self。

pthread_create函数

创建一个新线程。其作用，对应进程中fork()函数。
int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg);
返回值：成功：0；失败：错误号。Linux环境下，所有线程特点，失败均直接返回错误号。
参数

pthread_t：当前Linux中可理解为：typedef unsigned long int pthread_t;
参数1：传出参数，保存系统为我们分配好的线程ID。
参数2：通常传NULL，表示使用线程默认属性。若想使用具体属性也可以修改该参数。
参数3：函数指针，指向线程主函数（线程体），该函数运行结束，则线程结束。
参数4：线程主函数执行期间所使用的参数。

在一个线程中调用pthread_create()创建新的线程后，当前线程从pthread_create()返回继续往下执行，而新的线程所执行的代码由我们传给pthread_create的函数指针start_routine决定。start_routine函数接收一个参数，是通过pthread_create的arg参数传递给它的，该参数的类型为void *，这个指针按什么类型解释由调用者自己定义。start_routine返回时，这个线程就退出了，其它线程可以调用pthread_join得到start_routine的返回值，类似于父进程调用wait(2)得到子进程的退出状态，稍后详细介绍pthread_join。
pthread_create成功返回后，新创建的线程ID被填写到thread参数指向的内存单元。我们知道进程ID的类型是pid_t，每个进程的ID在整个系统中是唯一的，调用getpid(2)可以获得当前进程ID，是一个正整数值。线程ID的类型是thread_t，它只是当前进程中保证是唯一的，不同的系统中thread_t这个类型有不同的实现，这可能是一个整数值，也可能是一个结构体，也可能是一个地址，所以不能简单地当成整数用printf打印，调用pthread_self(3)可以获得当前线程的ID。
attr参数表示线程属性，本节不深入讨论线程属性，所有代码例子都传NULL给attr参数，表示线程属性取缺省值，感兴趣的读者可以参考APUE。
【练习】：创建一个新线程，打印线程ID。注意：链接线程库-lpthread

由于pthread_create的错误码不保存在errno中，因此不能直接用perror(3)打印错误信息，可以先用strerror(3)把错误码转换成错误信息再打印。如果任意一个线程调用了exit或_exit，则整个进程的所有线程都会终止，由于从main函数return也相当于调用exit，为了防止新创建的线程还没有得到执行就终止，我们在main函数return之前延时1秒，这只是一种权宜之计，即使主线程等待1秒，内核也不一定会调度新创建的线程执行，下一节我们会看到更好的方法。

示例

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <pthread.h>
#include <string.h>                                                                                   

void *thread_func(void *arg)
{
    printf("In thread: thread id = %lu, pid = %u\n", pthread_self(), getpid());
    return NULL;
}

int main()
{
    pthread_t tid;
    int ret;

    printf("In main1: thread id = %lu, pid = %u\n", pthread_self(), getpid());

    ret = pthread_create(&tid, NULL, thread_func, NULL);
    if(ret != 0){
        fprintf(stderr, "pthread_create error:%s\n", strerror(ret));
        exit(1);
    } 

    sleep(1);
    printf("In main2: thread id = %lu, pid = %u\n", pthread_self(), getpid());
    return 0;
}

【练习】：循环创建多个线程，每个线程打印自己是第几个被创建的线程。（类似于进程循环创建子进程）
拓展思考：将pthread_create函数参数4修改为(void *)&i，将线程主函数内改为i = *((int *)arg)是否可以？不可以。

示例

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <pthread.h>
#include <string.h>

void *thread_func(void *arg)
{
    int i = (int)arg;
    sleep(i);
    printf("%dth thread: thread id = %lu, pid = %u\n", i+1, pthread_self(), getpid());
    return NULL;
}

int main()
{
    pthread_t tid;
    int ret, i;

    for (i = 0; i<5; i++){
        ret = pthread_create(&tid, NULL, thread_func, (void *)i);
        if(ret != 0){ 
            fprintf(stderr, "pthread_create error:%s\n", strerror(ret));
            exit(1);        }   
    }   

    sleep(i);
    return 0;
}

线程与共享

线程间共享全局变量
【牢记】：线程默认共享数据段、代码段等地址空间，常用的是全局变量。而进程不共享全局变量，只能借助mmap。

【练习】：设计程序，验证线程之间共享全局数据。

#include <stdio.h>
#include <pthread.h>
#include <stdlib.h>
#include <unistd.h>

int var = 100;

void *tfn(void *arg)
{
    var = 200;
    printf("thread\n");
    return NULL;
}

int main(void)
{
    printf("At first var = %d\n", var);

    pthread_t tid;
    pthread_create(&tid, NULL, tfn, NULL);
    sleep(1);

    printf("After pthread_create, var = %d\n", var);                                                  
    return 0;
}

pthread_exit函数

将单个线程退出。
void pthread_exit(void *retval);

参数：retval表示线程退出状态，通常传NULL。

思考：使用exit将指定线程退出，可以吗？
结论：线程中，禁止使用exit函数，会导致进程内所有线程全部退出。
在不添加sleep控制输出顺序的情况下，pthread_create在循环中，几乎瞬间创建5个线程，但只有第1个线程有机会输出（或者第2个也有，也可能没有，取决于内核调度），如果第3个线程执行了exit，将整个进程退出了，所以全部线程退出了。
所以，多线程环境中，应尽量少用，或者不使用exit函数，取而代之使用pthread_exit函数，将单个线程退出。任何线程里exit导致进程退出，其他线程未工作结束，主控线程退出时不能return或exit。
另注意：pthread_exit或者return返回的指针所指向的内存单元必须是全局的或者是用malloc分配的，不能在线程函数的栈上分配，因为当其它线程得到这个返回指针时线程函数已经退出了。
【练习】：编写多线程程序，总结exit、return、pthread_exit各自退出效果。

return：返回到调用者那里去。
pthread_exit：将调用该函数的线程退出。
exit：将进程退出。

示例

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <pthread.h>
#include <string.h>

void *thread_func(void *arg)
{
    int i = (int)arg;
    printf("%dth thread: thread id = %lu, pid = %u\n", i+1, pthread_self(), getpid());
    return NULL;
}

int main()
{
    pthread_t tid;
    int ret, i;

    for (i = 0; i<5; i++){
        ret = pthread_create(&tid, NULL, thread_func, (void *)i);
        if(ret != 0){
            fprintf(stderr, "pthread_create error:%s\n", strerror(ret));
            exit(1);
        }
    }                                                                                                 

    pthread_exit(NULL);
}

pthread_join函数

阻塞等待线程退出，获取线程退出状态。其作用，对应进程中waitpid()函数。
int pthread_join(pthread_t thread, void **retval); 成功：0；失败：错误号。
参数：thread：线程ID（【注意】不是指针）； retval：存储线程结束状态。
对比记忆：

进程中：main返回值、exit参数-->int；等待子进程结束, wait函数参数-->int *
线程中：线程主函数返回值、pthread_exit-->void *；等待线程结束 pthread_join函数参数-->void **

【练习】：参数retval非空用法。

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <pthread.h>

typedef struct{
    int a;
    int b;
} exit_t;

void *tfn(void *arg)                                                                                  
{
    exit_t * ret;
    ret = malloc(sizeof(exit_t));

    ret->a = 100;
    ret->b = 300;

    pthread_exit((void *)ret);
}

int main(void)
{
    pthread_t tid;
    exit_t * retval;

    pthread_create(&tid, NULL, tfn, NULL);

    //调用pthread_join可以获取线程的退出状态
    pthread_join(tid, (void **)&retval);
    printf("a = %d, b = %d\n", retval->a, retval->b);

    free(retval);
    return 0;
}

调用该函数的线程将挂起等待，直到ID为thread的线程终止。thread线程以不同的方法终止，通过pthread_join得到的终止状态是不同的，总结如下：

1、如果不thread线程通过return返回，retval所指向的单元里存放的是thread线程函数的返回值。
2、如果thread线程被别的线程调用pthread_cancel异常终止掉，retval所指向的单元里存放的是常数PTHREAD_CALCELED。
3、如果thread线程是自己调用pthread_exit终止的，retval所指向的单元存放的是传给pthread_exit的参数。
4、如果对thread线程的终止状态不感兴趣，可以传NULL给retval参数。

【练习】：使用pthread_join函数将循环创建的多个子线程回收。

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <pthread.h>

int var = 100;

void * tfn(void * arg)
{
    int i;
    i = (int)arg;

    sleep(i);
    if(i == 1){ 
        var = 333;
        printf("var = %d\n", var);
        return var;
    } else if (i == 3)
    {   
        var = 777;
        printf("I'm %dth pthread, pthread_id = %lu\n  var = %d\n", i+1, pthread_self(), var);
        pthread_exit((void *)var);
    } else {
        printf("I'm %dth pthread, pthread_id = %lu\n  var = %d\n", i+1, pthread_self(), var);
        pthread_exit((void *)var);
    }   

    return NULL;
}

int main(void)
{
    pthread_t tid[5];
    int i;
    int *ret[5];

    for(i = 0; i < 5; i++)
        pthread_create(&tid[i], NULL, tfn, (void *)i);

    for(i = 0; i < 5; i++){
        pthread_join(tid[i], (void **)&ret[i]);
        printf("-------%d 's ret = %d\n'", i, (int)ret[i]);
    }

    printf("I'm main pthread tid = %lu\t var = %d\n", pthread_self(), var);

    sleep(i);
    return 0;
}

pthread_detach函数

实现线程分隔
int pthread_detach(pthread_t thread);，成功：0；失败：错误号。
线程分离状态：指定该状态，线程主动与主控线程断开关系。线程结束后，其退出状态不由其他线程获取，而直接自己自动释放。网络、多线程服务器常用。
进程若有该机制，将不会产生僵尸进程。僵尸进程的产生主要由于进程死后，大部分资源被释放，一点残留资源存于系统中，导致内核认为该进程仍存在。
也可以使用pthread_create函数参2(线程属性)来设置线程分离。
【练习】：使用pthread_detach函数实现线程分离。

一般情况下，线程终止后，其终止状态一直保留到其它线程调用pthread_join获取它的状态为止。但是线程也可以被置为detach状态，这样的线程一旦终止就立刻回收它占用的所有资源，而不保留终止状态。不能对一个已经处于detach状态的线程调用pthread_join，这样的调用将返回EINVAL错误。也就是说，如果已经对一个线程调用了pthread_detach就不能再调用pthread_join了。

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <string.h>
#include <pthread.h>

void *tfn(void *arg)
{
    int n = 3;
    while(n--){
        printf("thread count %d\n", n); 
        sleep(1);
    }   

    return (void *)1;
}

int main(void)
{
    pthread_t tid;
    void *tret;
    int err;

#if 0                                                                                                 
    //通过线程属性来设置游离态
    pthread_attr_t attr;
    pthread_attr_init(&attr);
    pthread_attr_setdetachstate(&attr, PTHREAD_CREATE_DETACHED);
    pthread_create(&tid, &attr, tfn, NULL);
#else
    pthread_create(&tid, NULL, tfn, NULL);
    //让线程分离-----自动退出，无系统残留资源
    pthread_detach(tid);
#endif

    while(1){
        err = pthread_join(tid, &tret);
        printf("------------err = %d\n", err);
        if(err != 0)
            fprintf(stderr, "thread_join error : %s\n", strerror(err));
        else
            fprintf(stderr, "thread exit code %d\n", (int)tret);
    }   
}

pthread_cancel函数

杀死（取消）线程。其作用，对应进程中kill()函数。
int pthread_cancel(pthread_t thread);，成功：0；失败：错误号。
【注意】：线程的取消并不是实时的，而有一定的延时。需要等待线程到达某个取消点（检查点）。
类似于玩游戏存档，必须到达指定的场所（存档点，如：客栈、仓库、城里等）才能存储进度。杀死线程也不是立刻就能完成，必须要到达取消点。
取消点：是线程检查是否被取消，并按请求进行动作的一个位置。通常是一些系统调用create、open、pause、close、read、write...执行命令man 7 pthreads可以查看具备这些取消点的系统调用列表。也可参阅APUE.12.7取消选项小节。
可粗略认为一个系统调用（进入内核）即为一个取消点。如线程中没有取消点，可以通过调用pthread_testcancel函数自行设置一个取消点。
被取消的线程，退出值定义在Linux的pthread库中。常数PTHREAD_CANCELED的值是-1。可以头文件pthread.h中找到它的定义：#define PTHREAD_CANCELED((void *)-1)。因此当我们对一个已经被取消的线程使用pthread_join回收时，得到的返回值为-1。

【练习】：终止线程的三种方法。注意“取消点”的概念。

#include <stdio.h>                                                                                    
#include <unistd.h>
#include <pthread.h>
#include <stdlib.h>

void *tfn1(void *arg)
{
    printf("thread 1 returning\n");
    return (void *)111;
}

void *tfn2(void *arg)
{
    printf("thread 2 exiting\n");
    pthread_exit((void *)222);
}

void *tfn3(void *arg)
{
    while(1){
        //printf("thread 3: I'm going to die in 3 seconds ... \n");
        //sleep(1);
        pthread_testcancel(); //自己添加取消点
    }   

    return (void *)666;
}

int main()
{
    pthread_t tid;
    void *tret = NULL;

    pthread_create(&tid, NULL, tfn1, NULL);
    pthread_join(tid, &tret);
    printf("thread 1 exit code = %d\n\n", (int)tret);

    pthread_create(&tid, NULL, tfn2, NULL);
    pthread_join(tid, &tret);
    printf("thread 2 exit code = %d\n\n", (int)tret);

    pthread_create(&tid, NULL, tfn3, NULL);
    sleep(3);
    pthread_cancel(tid);
    pthread_join(tid, &tret);
    printf("thread 3 exit code = %d\n", (int)tret);
}

pthread_equal函数

比较两个线程ID是否相等。
int pthread_equal(pthread_t t1, pthread_t t2);
有可能Linux在未来线程ID pthread_t类型被修改为结构体实现。

控制原语对比

    进程              线程
    fork            pthread_create      创建
    exit            pthread_exit        退出
    wait            pthread_join        等待
    kill            pthread_cancel      杀死
    getpid          pthread_self        取得ID
                    pthread_detach      分离

线程属性

本节作为指引性介绍，Linux下线程的属性是可以根据实际项目需要进行设置，之前我们讨论的线程都是采用线程的默认属性，默认属性已经可以解决绝大多数开发时遇到的问题。如我们对程序的性能提出更高的要求，那么需要设置线程属性，比如可以通过设置线程栈的大小来降低内存的使用，增加最大线程个数。 typedef struct{ int etachstate; //线程的分离状态 int schedpolicy; //线程调度策略 struct sched_param schedparam; //线程的调度参数 int inheritsched; //线程的继承性 int scope; //线程的作用域 size_t guardsize; //线程栈末尾的警戒缓冲区大小 int stackaddr_set; //线程的栈设置 void* stackaddr; //线程的位置 size_t stacksize; //线程的大小 } pthread_attr_t;
主要结构体成员

1、线程分离状态
2、线程栈大小（默认平均分配）
3、线程栈警戒缓冲区大小（位于栈末尾）

属性值不能直接设置，须使用相关函数进行操作，初始化的函数为pthread_attr_init，这个函数必须在pthread_create函数之前调用。之后须用pthread_attr_destroy函数来释放资源。
线程属性主要包括如下属性：作用域（scope）、栈尺寸（stack size）、栈地址（stack address）、优先级（priority）、分离的状态（detached state）、调度策略和参数（scheduling policy and parameters）。默认的属性为非绑定、非分离、缺省的堆栈、与父进程同样级别的优先级。

线程属性初始化

注意：应先初始化线程属性，再pthread_create创建线程。
初始化线程属性。

int pthread_attr_init(pthread_attr_t *attr);，成功：0；失败：错误号。

销毁线程属性所占用的资源。

int pthread_attr_destroy(pthread_attr_t *attr);，成功：0；失败：错误号。

线程的分离状态

线程的分离状态决定一个线程以什么样的方式来终止自己。
非分离状态：线程的默认属性是非分离状态，这种情况下，原有的线程等待创建的线程结束。只有当pthread_join()函数返回时，创建的线程才算终止，才能释放自己占用的系统资源。
分离状态：分离线程没有被其他的线程等待，自己运行结束了，线程也就终止了，马上释放系统资源。应该根据自己的需要，选择适当的分离状态。
线程分离状态的函数：
设置线程属性，分离or非分离。

int pthread_attr_setdetachstate(pthread_attr_t *attr, int detachstate);

获取线程属性，分离or非分离

attr：已经初始化的线程属性
detachstate：
PTHREAD_CREATE_DETACHED（分离线程）
PTHREAD_CREATE_JOINABLE（非分离线程）
int pthread_attr_getdetachstate(pthread_attr_t *attr, int *detachstate);
参数：

这里要注意的一点是，如果设置一个线程为分离线程，而这个线程运行又非常快，它很可能在pthread_create函数返回之前就终止了，它终止以后就可能将线程号和系统资源移交给其他的线程使用，这样调用pthread_create的线程就得到了错误的线程号。要避免这种情况可以采取一定的同步措施，最简单的方法之一是可以在被创建的线程里调用pthread_cond_timedwait函数，让这个线程等待一会儿，留出足够的时间让函数pthread_create返回。设置一段等待时间，是在多线程编程里常用的方法。但是注意不要使用诸如wait()之类的函数，它们是使整个进程睡眠，并不能解决同步的问题。

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <pthread.h>
#include <string.h>

void *thread_func(void *arg)
{
    pthread_exit((void *)11);
}

int main()
{
    pthread_t tid;
    int ret;
    pthread_attr_t attr;

    ret = pthread_attr_init(&attr);
    if(ret != 0){ 
        fprintf(stderr, "pthread_attr_init error:%s\n", strerror(ret));
        exit(1);
    }   

    pthread_attr_setdetachstate(&attr, PTHREAD_CREATE_DETACHED);

    ret = pthread_create(&tid, &attr, thread_func, NULL);
    if(ret != 0){ 
        fprintf(stderr, "pthread_create error:%s\n", strerror(ret));
        exit(1);
    }   

    ret = pthread_join(tid, NULL);
    if(ret != 0){ 
        fprintf(stderr, "pthread_join error:%s\n", strerror(ret));
        exit(1);
    }   

    pthread_exit((void *)1);                                                                          
    return 0;
}

线程的栈地址

POSIX.1 定义了两个常量_POSIX_THREAD_ATTR_STACKADDR和_POSIX_THREAD_ATTR_STACKSIZE
检测系统是否支持栈属性。也可以给sysconf函数传递_SC_THREAD_ATTR_STACKADDR或_SC_THREAD_ATTR_STACKSIZE来进行检测。
当进程栈地址空间不够用时，指定新建线程使用由malloc分配的空间作为自己的栈空间。通过pthread_attr_setstack和pthread_attr_getstack两个函数分别设置和获取线程的栈地址。
int pthread_attr_setstack(pthread_attr_t *attr, void *stackaddr, size_t stacksize);

成功：0；失败：错误号

int pthread_attr_getstack(const pthread_attr_t *attr, void **stackaddr, size_t *stacksize);

成功：0；失败：错误号

参数

attr：指向一个线程属性的指针。
stackaddr：返回获取的栈地址。
stacksize：返回获取的栈大小。

线程的栈大小

当系统中有很多线程时，可能需要减小每个线程栈的默认大小，防止进程的地址空间不够用，当线程调用的函数会分配很大的局部变量或函数调用层次很深时，可能需要增大线程栈的默认大小。
函数pthread_attr_getstacksize和pthread_attr_setstacksize提供设置。
int pthread_attr_setstacksize(pthread_attr_t *attr, size_t stacksize);

成功：0；失败：错误号

int pthread_attr_getstacksize(const pthread_attr_t *attr, size_t *stacksize);

成功：0；失败：错误号

参数

attr：指向一个线程属性的指针。
stacksize：返回线程的栈大小。

线程属性控制示例

#include <stdio.h>
#include <pthread.h>
#include <string.h>
#include <stdlib.h>
#include <unistd.h>

#define SIZE 0X10000

void *th_fun(void *arg)
{
    while(1)
        sleep(1);
}

int main()
{
    pthread_t tid;
    int err, detachstate, i = 1;
    pthread_attr_t attr;
    size_t stacksize;
    void *stackaddr;

    pthread_attr_init(&attr);
    pthread_attr_getstack(&attr, &stackaddr, &stacksize);
    pthread_attr_getdetachstate(&attr, &detachstate);

    //默认是分离态
    if(detachstate == PTHREAD_CREATE_DETACHED)
        printf("thread detached\n");
    //默认是非分离
    else if (detachstate == PTHREAD_CREATE_JOINABLE)
        printf("thread join\n");
    else
        printf("thread un known\n");

    //设置线程分离属性
    pthread_attr_setdetachstate(&attr, PTHREAD_CREATE_DETACHED);

    while(1){
        //在堆上申请内存，指定线程栈的起始地址和大小
        stackaddr = malloc(SIZE);
        if(stackaddr == NULL){
            perror("malloc");
            exit(1);
        }
        stacksize = SIZE;
        //借助线程的属性，修改线程栈空间大小
        pthread_attr_setstack(&attr, stackaddr, stacksize);

        err = pthread_create(&tid, &attr, th_fun, NULL);
        if(err != 0){
            printf("%s\n", strerror(err));
            exit(1);
        }

        printf("%d\n", i++);
    }

    pthread_attr_destroy(&attr);
}

NPTL

1、察看当前pthread库版本getconf GNU_LIBPTHREAD_VERSION
2、NPTL实现机制（POSIX），Native POSIX Thread Library
3、使用线程库时gcc指定-lpthread

线程使用注意事项

1、主线程退出其他线程不退出，主线程退出应调用pthread_exit
2、避免僵尸线程

pthread_join
pthread_detach
pthread_create，指定分离属性
被join线程可能在join函数返回前就释放完自己的所有内存资源，所以不应当返回被回收线程栈中的值。

3、malloc和mmap申请的内存可以被其他线程释放。
4、应避免在多线程模型中调用fork，除非马上exec，子进程中只有调用fork的线程存在，其他线程在子进程中均pthread_exit。
5、信号的复杂语义很难和多线程共存，应避免在多线程引入信号机制。

同步

所谓同步，即同时起步，协调一致。不同的对象，对“同步”的理解方式略有不同。如，设备同步，是指在两个设备之间规定一个共同的时间参考；数据库同步，是指让两个或多个数据库内容保持一致，或者按需要部分保持一致；文件同步，是指让两个或多个文件夹里的文件保持一致。等等
而，编程中、通信中所说的同步与生活中大家印象中的同步概念略有差异。“同”字应是指协同、协助、互相配合。主旨在协同步调，按预定的先后次序运行。

线程同步

同步即协同步调，按预定的先后次序运行。
线程同步，指一个线程发出某一功能调用时，在没有得到结果之前，该调用不返回。同时其它线程为保证数据一致性，不能调用该功能。
举例1：银行存款5000。柜台，折：取3000；提款机，卡：取3000。剩余：2000
举例2：内存中100字节，线程T1欲填入全1，线程T2欲填入全0。但如果T1执行了50个字节失去CPU，T2执行，会将T1写过的内容覆盖。当T1两次获得CPU继续从失去CPU的位置向后写入1，当执行结束，内存中的100字节，既不是全1，也不是全0。
产生的现象叫做“与时间有关的错误”（time related）。为了避免这种数据混乱，线程需要同步。
“同步”的目的，是为了避免数据混乱，解决与时间有关的错误。实际上，不仅线程间需要同步，进程间、信号间等等都需要同步机制。
因此，所有“多个控制流，共同操作一个共享资源”的情况，都需要同步。

数据混乱原因

1、资源共享（独享资源则不会）。
2、调度随机（意味着数据访问会出现竞争）。
3、线程间缺乏必要的同步机制。
以上3点中，前两点不能改变，欲提高效率，传递数据，资源必须共享。只要共享资源，就一定会出现竞争。只要存在竞争关系，数据就很容易出现混乱。
所有只能从第三点着手解决。使多个线程在访问共享资源的时候，出现互斥。

互斥mutex

Linux中提供一把互斥锁mutex(也称之为互斥量)。
每个线程在对资源操作前都尝试先加锁，成功加锁才能操作，操作结束解锁。
资源还是共享的，线程间也还是竞争的，但通过“锁”就将资源的访问变成互斥操作，而后与时间有关的错误也不会再产生了。

但，应注意：同一时刻，只能有一个线程持有该锁。
当A线程对某个全局变量加锁访问，B在访问前尝试加锁，拿不到锁，B阻塞。C线程不去加锁，而直接访问该全局变量，依然能够访问，但会出现数据混乱。
所以，互斥锁实质上是操作系统提供的一把“建议锁”（又称“协同锁”），建议程序中有多线程访问共享资源的时候使用该机制。但并没有强制限定。
因此，即使有了mutex，如果有线程不按规则来访问数据，依然会造成数据混乱。

主要应用函数

基本操作

pthread_mutex_init函数
pthread_mutex_destroy函数
pthread_mutex_lock函数
pthread_mutex_trylock函数
pthread_mutex_unlock函数
以上5个函数的返回值都是：成功返回0，失败返回错误号。
pthread_mutex_t 类型，其本质是一个结构体。为简化理解，应用时可忽略其实现细节，简单当成整数看待。
pthread_mutex_t mutex; 变量mutex只有两种取值1、0。

pthread_mutex_init函数

静态初始化：如果互斥锁mutex是静态分配的（定义在全局，或加了static关键字修饰），可以直接使用宏进行初始化。e.g.pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER;
动态初始化：局部变量应采用动态初始化。e.g.pthread_mutex_init(&mutex, NULL);
初始化一个互斥锁（互斥量） --> 初值可看作1。
int pthread_mutex_init(pthread_mutex_t * restrict mutex, const pthread_mutexattr_t * restrict attr);
参1：传出参数，调用时应传&mutex。
restrict关键字：只用于限制指针，告诉编译器，所有修改该指针指向内存中内容的操作，只能通过本指针完成。不能通过除本指针以外的其他变量或指针修改。
参2：互斥量属性。是一个传入参数，通常传NULL，选用默认属性（线程间共享）。参APUE.12.4同步属性

pthread_mutex_destroy函数

销毁一个互斥锁。
int pthread_mutex_destroy(pthread_mutex_t *mutex);

pthread_mutex_lock函数

加锁。可理解为将mutex--（或1）
int pthread_mutex_lock(pthread_mutex_t *mutex);

pthread_mutex_unlock函数

解锁。可理解为将mutex++(或+1)
int pthread_mutex_unlock(pthread_mutex_t *mutex);

pthread_mutex_trylock函数

尝试加锁。
int pthread_mutex_trylock(pthread_mutex_t *mutex);

加锁与解锁

lock与unlock

lock尝试加锁，如果加锁不成功，线程阻塞，阻塞到持有该互斥量的其他线程锁为止。
unlock主动解锁函数，同时将阻塞在该锁上的所有线程全部唤醒，至于哪个线程先被唤醒，取决于优先级、调度。默认：先阻塞、先唤醒。
例如：T1、T2、T3、T4使用一把mutex锁。T1加锁成功，其他线程均阻塞，直至T1解锁。T1解锁后，T2、T3、T4均被唤醒，并自动再次尝试加锁。
可假想mutex锁init成功初值为1。lock功能是将mutex--，unlock将mutex++。

lock与trylock

lock加锁失败会阻塞，等待锁释放。
trylock加锁失败直接返回错误号（如：EBUSY），不阻塞。

加锁步骤测试

看如下程序：该程序是非常典型的，由于共享、竞争而没有加任何同步机制，导致产生于时间有关的错误，造成数据混乱。

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <pthread.h>
#include <string.h>

void *tfn(void *arg)
{
    srand(time(NULL));
    while(1){
        printf("hello "); 
        //模拟长时间操作共享资源，导致CPU易主，产生与时间有关的错误
        sleep(rand() % 3); 
        printf("world\n");
        sleep(rand() % 3); 
    }

    return NULL;
}

int main(void)
{
    pthread_t tid;
    srand(time(NULL));

    pthread_create(&tid, NULL, tfn, NULL);
    while(1){
        printf("HELLO "); 
        sleep(rand() % 3); 
        printf("WORLD\n");
        sleep(rand() % 3); 
    }

    return 0;
}

【练习】：修改该程序，使用mutex互斥锁进行同步。

线程在操作完共享资源后本应该立即解锁，但修改后，线程抱着锁睡眠。睡醒解锁后又立即加锁，这两个库函数本身不会阻塞。
所以在这两行代码之间失去CPU的概率很小。因此，另外一个线程很难得到加锁的机会。
1、定义全局互斥锁，初始化init(&m, NULL)互斥量，添加对应的destroy。
2、两个线程while中，两次printf前后，分别加lock和unlock。
3、将unlock挪至第二个sleep后，发现交替现象很难出现。
4、main中加flag=5将flag在while中--，这时，主线程输出5次后试图销毁锁，但子线程未将锁释放，无法完成。

5、main中加pthread_cancel()将子线程取消。

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <pthread.h>
#include <string.h>

//定义锁
pthread_mutex_t mutex;

void *tfn(void *arg)
{
    srand(time(NULL));
    while(1){
        //加锁
        pthread_mutex_lock(&mutex);
        printf("hello "); 
        //模拟长时间操作共享资源，导致CPU易主，产生与时间有关的错误
        sleep(rand() % 3); 
        printf("world\n");
        //解锁
        pthread_mutex_unlock(&mutex);
        sleep(rand() % 3); 
        //添加检查点
        pthread_testcancel();
    }

    return NULL;
}

int main(void)
{
    int flag = 5;
    pthread_t tid;
    srand(time(NULL));

    //锁初始化
    pthread_mutex_init(&mutex, NULL);  //mutex = 1

    pthread_create(&tid, NULL, tfn, NULL);
    while(flag--){
        //加锁
        pthread_mutex_lock(&mutex);
        printf("HELLO ");
        sleep(rand() % 3);
        printf("WORLD\n");
        //解锁
        pthread_mutex_unlock(&mutex);
        sleep(rand() % 3);
    }
    //取消子线程
    pthread_cancel(tid);
    pthread_join(tid, NULL);
    //锁销毁
    pthread_mutex_destroy(&mutex);
    return 0;
}

结论：在访问共享资源前加锁，访问结束后立即解锁。锁的“粒度”应越小越好。

死锁

1、线程试图对同一个互斥量A加锁两次。
2、线程1拥有A锁，请求获得B锁；线程2拥有B锁，请求获得A锁。
【作业】：编写程序，实现上述死锁现象。

读写锁

与互斥量类似，但读写锁允许更高的并行性。其特性为：写独占，读共享。

读写锁状态

1、读模式下加锁状态（读锁）。
2、写模式下加锁状态（写锁）。
3、不加锁状态。

读写锁特性

1、读写锁是“写模式加锁”时，解锁前，所有对该锁加锁的线程都会被阻塞。
2、读写锁是“读模式加锁”时，如果线程以读模式对其加锁会成功；如果线程以写模式加锁会阻塞。
3、读写锁是“读模式加锁”时，既有试图以写模式加锁的线程，也有试图以读模式加锁的线程。那么读写锁会阻塞随后的读模式锁请求。优先满足写模式锁。读锁、写锁并行阻塞，写锁优先级高。
读写锁也叫共享-独占锁。当读写锁以读模式锁住时，它是以共享模式锁住的；当它以写模式锁住时，它是以独占模式锁住的。写独占、读共享。
读写锁非常适合于对数据结构读的次数远大于写的情况。

主要应用函数

基本操作

pthread_rwlock_init函数
pthread_rwlock_destroy函数
pthread_rwlock_rdlock函数
pthread_rwlock_wrlock函数
pthread_rwlock_tryrdlock函数
pthread_rwlock_trywrlock函数
pthread_rwlock_unlock函数
以上7个函数的返回值都是：成功返回0，失败直接返回错误号。
pthread_rwlock_t类型，用于定义一个读写锁变量。
pthread_rwlock_t rwlock;

示例

#include <stdio.h>
#include <unistd.h>
#include <pthread.h>

int counter;
pthread_rwlock_t rwlock;

void *th_write(void *arg)
{
    int t;
    int i = (int)arg;

    while(1){
        t = counter;
        usleep(1000);

        pthread_rwlock_wrlock(&rwlock);                                                               
        printf("======write %d: %lu: counter=%d ++counter=%d\n", i, pthread_self(), t, ++counter);
        pthread_rwlock_unlock(&rwlock);

        usleep(5000);
    }   

    return NULL;
}

void *th_read(void *arg)
{
    int i = (int)arg;
    while(1){
        pthread_rwlock_rdlock(&rwlock);
        printf("======read %d: %lu: %d\n", i, pthread_self(), counter);
        pthread_rwlock_unlock(&rwlock);

        usleep(900);
    }   

    return NULL;
}

//3个线程不定时写全局资源，5个线程不定时读同一全局资源
int main()
{
    int i;
    pthread_t tid[8];
    //初始读写锁
    pthread_rwlock_init(&rwlock, NULL);

    for(i = 0; i < 3; i++)
        pthread_create(&tid[i], NULL, th_write, (void *)i);

    for(i = 0; i < 5; i++)
        pthread_create(&tid[i+3], NULL, th_read, (void *)i);

    for(i = 0; i < 8; i++)
        pthread_join(tid[i], NULL);

    //释放读写锁
    pthread_rwlock_destroy(&rwlock);
    return 0;
}

条件变量

条件变量本身不是锁！但它也可以造成阻塞。通常与互斥锁配合使用。给多线程提供一个会合的场所。

主要应用函数

基本操作

pthread_cond_init函数
pthread_cond_destroy函数
pthread_cond_wait函数
pthread_cond_timedwait函数
pthread_cond_signal函数
pthread_cond_broadcast函数
以上6个函数的返回值都是：成功返回0，失败直接返回错误号。
pthread_cond_t类型，用于定义条件变量。
pthread_cond_t cond;

pthread_cond_init函数

初始化一个条件变量
int pthread_cond_init(pthread_cond_t * restrict cond, const pthread_condattr_t * restrict attr);
参2：attr表条件变量属性，通常为默认值，传NULL即可。
也可以使用静态初始化的方法，初始化条件变量：pthread_cond_t cond = PTHREAD_COND_INITIALIZED;

pthread_cond_destroy函数

销毁一个条件变量
int pthread_cond_destroy(pthread_cond_t *cond);

pthread_cond_wait函数

1、阻塞等待条件变更cond（参1）满足
2、释放已掌握的互斥锁（解锁互斥量）相当于pthread_mutex_unlock(&mutex);
1和2两步为同一个原子操作。
3、当被唤醒，pthread_cond_wait函数返回时，解除阻塞并重新申请获取互斥锁pthread_mutex_lock(&mutex);
阻塞等待一个条件变量
int pthread_cond_wait(pthread_cond_t * restrict cond, pthread_mutex_t * restrict mutex);
函数作用：

pthread_cond_timedwait函数

如：time(NULL)返回的就是绝对时间。而alarm(1)是相对时间，相对当前时间定时1秒钟。

struct timespec t = {1,0};
pthread_cond_timedwait(&cond, &mutex, &t);
只能定时到1970年1月1日 00：00：01秒（早已经过去）

正确用法：

在讲解setitimer函数时我们还提到另一种时间类型

struct timeval{
    time_t tv_sec;  /*seconds*/ 秒
    suseconds_t tv_usec;  /*microseconds*/ 微秒
};

time_t cur = time(NULL); 获取当前时间。
struct timespec t; 定义tiemspec结构体变量t
t.tv_sec = cur + 1; 定时1秒
pthread_cond_timedwait(&cond, &mutex, &t); 传参
限时等待一个条件变量
int pthread_cond_timedwait(pthread_cond_t * restrict cond, pthread_mutex_t * restrict mutex, const struct timespec * restrict abstime);

参3：参看man sem_timedwait函数，查看struct timespec结构体。

struct timespec{
    time_t tv_sec;  /*seconds*/ 秒
    long tv_nsec;  /*nanoseconds*/ 纳秒
};

形参abstime：绝对时间。

pthread_cond_signal函数

唤醒至少一个阻塞在条件变量上的线程。
int pthread_cond_signal(pthread_cond_t *cond);

pthread_cond_broadcast函数

唤醒全部阻塞在条件变量上的线程。
int pthread_cond_broadcast(pthread_cond_t *cond);

生产消费者条件变量模型

线程同步典型的案例即为生产消费者模型，而借助条件变量来实现这一模型，是比较常见的一种方法。假定有两个线程，一个模拟生产者行为，一个模拟消费者行为。两个线程同时操作一个共享资源（一般称之为汇聚），生产向其中添加产品，消费者从中消费掉产品。

看如下示例，使用条件变量模拟生产者、消费者问题：

/*借助条件变量模拟，生产者-消费者问题*/                                                               
#include <stdlib.h>
#include <stdio.h>
#include <unistd.h>
#include <pthread.h>

/*链表作为共享数据，需被互斥量保护*/
struct msg {
    struct msg *next;
    int num;
};

struct msg *head;
struct msg *mp;

/*静态初始化一个条件变量和一个互斥量*/
pthread_cond_t has_product = PTHREAD_COND_INITIALIZER;
pthread_mutex_t lock = PTHREAD_MUTEX_INITIALIZER;

void *consumer(void *p)
{
    for(;;){
        pthread_mutex_lock(&lock);
        while(head == NULL){ //头指针为空，说明没有节点
            pthread_cond_wait(&has_product, &lock);
        }
        mp = head;
        head = mp->next; //模拟消费掉一个产品
        pthread_mutex_unlock(&lock);

        printf("-Consume ---%d\n", mp->num);
        free(mp);
        sleep(rand() % 5);
    }
}

void *producer(void *p)
{
    for(;;){
        mp = malloc(sizeof(struct msg));
        //模拟生产一个产品
        mp->num = rand() % 1000 + 1;
        printf("-Produce ---%d\n", mp->num);

        pthread_mutex_lock(&lock);
        mp->next = head;
        head = mp;
        pthread_mutex_unlock(&lock);
        //将等待在该条件变量上的一个线程唤醒
        pthread_cond_signal(&has_product);
        sleep(rand() % 5);
    }
}

int main(int argc, char * argv)
{
    pthread_t pid, cid;
    srand(time(NULL));

    pthread_create(&pid, NULL, producer, NULL);
    pthread_create(&cid, NULL, consumer, NULL);

    pthread_join(pid, NULL);
    pthread_join(cid, NULL);

    return 0;
}

条件变量的优点：

相较于mutex而言，条件变量可以减少竞争。
如直接使用mutex，除了生产者、消费者之间要竞争互斥量以外，消费者之间也要竞争互斥量，但如果汇聚（链表）中没有数据，消费者之间竞争互斥锁是无意义的。有了条件变量机制以后，只有生产者完成生产，才会引起消费者之间竞争。提高了程序效率。

信号量

进化版的互斥锁（1-->N）。
由于互斥锁的粒度比较大，如果我们希望在多个线程间对某一对象的部分数据进行共享，使用互斥锁是没有办法实现的，只能将整个数据对象锁住。这样虽然达到了多线程操作共享数据时保证正确性的目的，却无形中导致线程的并发性下降。线程从并行执行，变成了串行执行。与直接使用单进程无异。
信号量，是相对折中的一种处理方式，既能保证同步，数据不混乱，又能提高线程并发。

主要应用函数

函数列表

sem_init函数
sem_destroy函数
sem_wait函数
sem_post函数
sem_trywait函数
sem_timedwait函数
以上6个函数的返回值都是：成功返回0，失败返回-1，同时设置errno。（注意，它们没有pthread前缀）。
sem_t类型，本质仍是结构体。但应用期间可简单看作为整数，忽略实现细节（类似于使用文件描述符）。
sem_t sem; 规定信号量sem不能<0。头文件<semaphore.h>

信号量基本操作：

将信号量++，同时唤醒阻塞在信号量上的线程。（类比pthread_mutex_unlock）
1、信号量大于0，则信号量--。（类比pthread_mutex_lock）
2、信号量等于0，造成线程阻塞
sem_wait：
sem_post：
但，由于sem_t的实现对用户隐藏，所有所谓的++、--操作只能通过函数来实现，而不能直接++、--符号。
信号量的初值，决定了占用信号量的线程的个数。

sem_init函数

初始化一个信号量。
int sem_init(sem_t *sem, int pshared, unsigned int value);
参1：sem信号量。
参2：pshared取0用于线程间；取非0（一般为1）用于进程间。
参3：value指定信号量初值。

sem_destroy函数

销毁一个信号量。
int sem_destroy(sem_t *sem);

sem_wait函数

给信号量加锁 --
int sem_wait(sem_t *sem);

sem_post函数

给信号量解锁 ++
int sem_post(sem_t *sem);

sem_trywait函数

尝试对信号量加锁 --。（与sem_wait的区别类比lock和trylock）
int sem_trywait(sem_t *sem);

sem_timedwait函数

限时尝试对信号量加锁--
int sem_timedwait(sem_t *sem, const struct timespec *abs_timeout);
参2：abs_timeout采用的是绝对时间。

生产者消费者信号量模型

【练习】：使用信号量完成线程间同步，模拟生产者，消费者问题。

/*信号量实现生产者消费者问题*/
#include <stdio.h>
#include <unistd.h>                                                                                   
#include <pthread.h>
#include <stdlib.h>
#include <semaphore.h>

#define NUM 5

int queue[NUM]; //全局数组实现环形队列
sem_t blank_number, product_number; //空格子信号量，产品信号量

void *producer(void *arg)
{
    int i = 0;
    while(1) {
        sem_wait(&blank_number); //生产者将空格子数--，为0则阻塞等待
        queue[i] = rand() % 1000 + 1; //生产一个产品
        printf("----Produce----%d\n", queue[i]);
        sem_post(&product_number); //将产品数++

        i = (i+1) % NUM; //借助下标实现环形
        sleep(rand() % 3); 
    }   
    return NULL;
}

void *consumer(void *arg)
{
    int i = 0;
    while(1){
        sem_wait(&product_number); //消费者将产品数--，为0则阻塞等待
        printf("--Consume---%d\n", queue[i]);
        queue[i] = 0; //消费一个产品
        sem_post(&blank_number); //消费掉以后，将空格子数++

        i = (i+1) % NUM; //借助下标实现环形
        sleep(rand() % 3); 
    }   
    return NULL;
}

int main()
{
    pthread_t pid, cid;

    sem_init(&blank_number, 0, NUM); //初始化空格子信号量为5
    sem_init(&product_number, 0, 0); //产品数为0

    pthread_create(&pid, NULL, producer, NULL);
    pthread_create(&cid, NULL, consumer, NULL);

    pthread_join(pid, NULL);
    pthread_join(cid, NULL);

    sem_destroy(&blank_number);
    sem_destroy(&product_number);
    return 0;
}

分析

T生1到达，将S空-1，生产，将S满+1
T生2到达，S空已经为0，阻塞
T消到达，将S满-1，消费，将S空+1
如果队列中有数据，生产者不能生产，只能阻塞。
如果队列中没有数据，消费者不能消费，只能等待数据。
规定
定义两个信号量：S满 = 0， S空 = 1（S满代表满格的信号量，S空表示空格的信号量，程序起始，格子一定为空）。

所以有：

T生产者主函数 ｛
    sem_wait(S空);
    生产...
    sem_post(S满)
｝

T消费者主函数 ｛
    sem_wait(S满);
    消费...
    sem_post(S空)
｝

假设：线程到达的顺序是：T生、T生、T消。
那么：
三个线程到达的顺序是：T生1、T生2、T消。而执行的顺序是T生1、T消、T生2
这里，【S空】表示空格子的总数，代表可占用信号量的线程总数-->1。其实这样的话，信号量就等同于互斥锁。
但，如果S空=2、3、4……就不一样了，该信号量同时可以由多个线程占用，不再是互斥的形状。因此我们说信号量是互斥锁的加强版。
【推演练习】：理解上述模型，推演，如果是两个消费者，一个生产者，是怎么样的情况。
【作业】：结合生产者消费者信号量模型，揣摩sem_timedwait函数作用。编程实现，一个线程读用户输入，另一个线程打印“hello world”。如果用户无输入，则每隔5秒向屏幕打印一个“hello world”；如果用户有输入，立刻打印“hello world”到屏幕。

进程间同步

进程间也可以使用互斥锁，来达到同步的目的。但应在pthread_mutex_init初始化之前，修改其属性为进程间共享。mutex的属性修改函数主要有以下几个。

互斥量mutex

主要应用函数

int pthread_mutexattr_setpshared(pthread_mutexattr_t *attr, int pshared);
参2：pshared取值
线程锁：PTHREAD_PROCESS_PRIVATE(mutex的默认属性即为线程锁，进程间私有)
进程锁：PTHREAD_PROCESS_SHARED
int pthread_mutexattr_destroy(pthread_mutexattr_t *attr);
int pthread_mutexattr_init(pthread_mutexattr_t *attr);
pthread_mutexattr_t mattr类型：用于定义mutex锁的【属性】。
pthread_mutexattr_init函数：初始化一个mutex属性对象。
pthread_mutexattr_destroy函数：销毁mutex属性对象（而非销毁锁）。
pthread_mutexattr_setpshared函数：修改mutex属性。

进程间mutex示例

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <string.h>
#include <fcntl.h>
#include <pthread.h>
#include <sys/mman.h>
#include <sys/wait.h>

struct mt {
    int num;
    pthread_mutex_t mutex;
    pthread_mutexattr_t mutexattr;
};

int main()
{
    int i;
    struct mt *mm;
    pid_t pid;

    mm = mmap(NULL, sizeof(*mm), PROT_READ|PROT_WRITE, MAP_SHARED|MAP_ANON, -1, 0);
    memset(mm, 0, sizeof(*mm));

    pthread_mutexattr_init(&mm->mutexattr); //初始化mutex属性对象
    pthread_mutexattr_setpshared(&mm->mutexattr, PTHREAD_PROCESS_SHARED); //修改属性为进程间共享

    pthread_mutex_init(&mm->mutex, &mm->mutexattr); //初始化一把mutex锁

    pid = fork();
    if(pid == 0){
        for(i = 0; i < 10; i++){
            pthread_mutex_lock(&mm->mutex);
            (mm->num)++;
            printf("-Child------------num++   %d\n", mm->num);
            pthread_mutex_unlock(&mm->mutex);
            sleep(1);
        }
    } else if(pid > 0){
        for(i = 0; i < 10; i++){
            sleep(1);
            pthread_mutex_lock(&mm->mutex);
            mm->num+=2;
            printf("-------parent-----num+=2  %d\n", mm->num);
            pthread_mutex_unlock(&mm->mutex);
        }
        wait(NULL);
    }

    pthread_mutexattr_destroy(&mm->mutexattr); //销毁mutex属性对象
    pthread_mutex_destroy(&mm->mutex); //销毁mutex
    munmap(mm,sizeof(*mm)); //释放映射区
    return 0;
}

文件锁

借助fcntl函数来实现锁机制。操作文件的进程没有获得锁时，可以打开，但无法执行read、write操作。
fcntl函数：获取、设置文件访问控制属性。
int fcntl(int fd, int cmd, ... /* arg */ );

F_SETLK(struct flock *)，设置文件锁（trylock）。
F_SETLKW(struct flock *)，设置文件锁（lock）W --> wait
F_GETLK(struct flock *)，获取文件锁
参2：

参3：

struct flock {
   ...
   short l_type;    /* 锁的类型: F_RDLCK, F_WRLCK, F_UNLCK */
   short l_whence;  /* 偏移位置: SEEK_SET, SEEK_CUR, SEEK_END */
   off_t l_start;   /* 起始偏移：1000*/
   off_t l_len;     /* 长度：0表示整个文件加锁 */
   pid_t l_pid;     /* 持有该锁的进程ID：F_GETLK, F_OFD_GETLK */
   ...
};

进程间文件锁示例

#include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>
#include <stdlib.h>

void sys_err(char *str){
    perror(str);
    exit(1);
}

int main(int argc, char *argv[])
{
    int fd;
    struct flock f_lock;

    if(argc < 2){
        printf("./a.out filename\n");
        exit(1);
    }

    if((fd = open(argv[1], O_RDWR)) < 0)
        sys_err("open");

    f_lock.l_type = F_WRLCK; //选用写锁
    //f_lock.l_type = F_RDLCK; //选用读锁

    f_lock.l_whence = SEEK_SET;
    f_lock.l_start = 0;
    f_lock.l_len = 0; //0表示整个文件加锁

    fcntl(fd, F_SETLKW, &f_lock);
    printf("get flock\n");

    sleep(10);

    f_lock.l_type = F_UNLCK;
    fcntl(fd, F_SETLKW, &f_lock);
    printf("un flock\n");

    close(fd);
    return 0;
}

多线程间共享文件夹描述符，而给文件加锁，是通过修改文件描述符所指向的文件结构体中的成员变量来实现的。因此，多线程中无法使用文件锁。
依然遵循”读共享、写独占“特性。但！如若进程不加锁直接操作文件，依然可访问成功，但数据势必出现混乱。
【思考】：多线程中，可以使用文件锁吗？

哲学家用餐模型分析

哲学家吃饭问题图示

多线程版

选用互斥锁mutex，如创建5个，pthread_mutex_t m[5];
模型抽象：

1、当得不到所有所需资源时，放弃已经获得的资源，等待。
2、保证资源的获取顺序，要求每个线程获取资源的顺序一致。如：A获取顺序1、2、3；B顺序应也是1、2、3。若B为3、2、1则易出现死锁现象。
5个哲学家 --> 5个线程； 5支筷子 --> 5把互斥锁； int left（左手）， right（右手）。
5个哲学家使用相同的逻辑，可通用一个线程主函数，void *tfn(void *arg)，使用参数来表示线程编号：int i = (int)arg;
哲学家线程根据编号知道自己第几个哲学家，而后选定锁，锁住，吃饭。否则哲学家thinking。

5支筷子，在逻辑上形成环，分别对应5个哲学家。

    A       B       C       D       E
0       1       2       3       4

哲学家吃饭问题

所以有：

if(i == 4)
    left = i, right = 0;
else
    left = i, right = i + 1;

振荡：如果每个人都攥着自己左手的锁，尝试去拿右手锁，拿不到则将锁释放。过会儿五个人又同时再攥着左手锁尝试拿右手锁，依然拿不到。如此往复形成另外一种极端死锁的现象--振荡。
避免振荡现象：只需5个人中，任意一个人，拿锁的方向与其他人相逆即可（如：E，原来：左：4，右：0；现在：左：0，右：4）。

所以以上if else语句应改为

if(i == 4)
    left = 0, right = i;
else
    left = i, right = i + 1;

而后，首先让哲学家尝试加左手锁：

while(1){
    pthread_mutex_lock(&m[left]); 如果加锁成功，函数返回再加右手锁，如果失败，应立即释放左手锁，等待。
    若左右手都加锁成功 --> 吃 --> 吃完 --> 释放锁（应先释放右手、再释放左手，是加锁顺序的逆序）
}

主线程（main）中，初始化5把锁，销毁5把锁，创建5个线程（并将i传递给线程主函数），回收5个线程。
避免死锁的方法

多进程版

相较于多线程需注意问题：

需注意如何共享信号量（注意：坚决不能使用全局变量sem_t s[5]）

实现：

直接将sem_t s[5]放在全局位置，试图用于子进程间共享是错误的！应将其定义放置与mmap共享映射区中。
main中：
sem_t s = mmap(NULL, sizeof(sem_t)5, PROT_READ|PROT_WRITE, MAP_SHARED|MAP_ANON, -1, 0);
使用方式：将s当成数组首地址看待，与使用数组s[5]没有差异。
循环sem_init(&s[i], 0, 1); 将信号量初始值设为1，信号量变为互斥锁。
循环sem_destroy(&s[i]);
循环创建5个进程。if(i<5)中完成子进程的代码逻辑。
循环回收5个子进程。
main函数中：

子进程中：

if(i == 4)
    left = 0, right = 4;
else
    left = i, right = i + 1;

while(1){
    使用sem_wait(&s[left])锁左手，尝试锁右手，若成功 --> 吃；若不成功 --> 将左手锁释放。
    吃完后，先释放右手锁，再释放左手锁。
}

« 上一篇：【转】输出图案类问题的思路

» 下一篇：谜一样男人的日记贴

James Bryant

【转】linux服务器开发二(系统编程)--线程相关

线程概念

什么是线程

Linux内核线程实现原理

线程共享资源

线程非共享资源

线程优点、缺点

线程控制原语

pthread_self函数

pthread_create函数

pthread_exit函数

pthread_join函数

pthread_detach函数

pthread_cancel函数

pthread_equal函数

控制原语对比

线程属性

线程属性初始化

线程的分离状态

线程的栈地址

线程的栈大小

线程属性控制示例

NPTL

线程使用注意事项

同步

线程同步

数据混乱原因

互斥mutex

主要应用函数

加锁与解锁

加锁步骤测试

死锁

读写锁

读写锁状态

读写锁特性

主要应用函数

条件变量

主要应用函数

生产消费者条件变量模型

条件变量的优点：

信号量

主要应用函数

生产者消费者信号量模型

进程间同步

互斥量mutex

文件锁

哲学家用餐模型分析

多线程版

多进程版

作者

标签

相关文章

相关资料

相关视频

关注微信公众号