c语言pthread线程池 - 穆世明博客

這裡介紹如何在 C 語言中使用開發多執行緒的平行化程式，用多顆 CPU 加速計算。

現在電腦的 CPU 都具備多顆核心，因此在使用 C 語言撰寫計算用的程式時，若能夠善用多核新的 CPU 進行平行運算，可以讓計算速度大幅提昇。

若要將 C 語言的程式平行化，最基本的方式就是使用 POSIX 執行緒（簡稱 pthread）來實做多執行緒的程式，以下是函式庫的用法教學，以及實際的範例程式碼。

的函數可以用來建立新的執行緒，並以函數指標指定子執行緒所要執行的函數，子執行緒在建立之後，就會以平行的方式執行，在子執行緒的執行期間，主執行緒還是可以正常執行自己的工作，最後主執行緒再以函數等待子執行緒執行結束，處理後續收尾的動作。

以下是一個 pthread 的 hello world 範例程式碼：

 * child(* data) { *str = (*) data; ( i = ;i < ;++i) { printf(, str); sleep(); } pthread_exit(); } main() { pthread_t t; pthread_create(&t, , child, ); ( i = ;i < ;++i) { printf(); sleep(); } pthread_join(t, ); ; }

此程式在主執行緒中建立一個子執行緒，並將這個字串傳遞給子執行緒，然後讓兩個執行緒同時輸出文字。

使用編譯時，要加上參數：

gcc hello.c hello

編譯好之後，執行之：

https://blog.gtwang.org/programming/pthread-multithreading-programming-in-c-tutorial/hello

在許多的平行化應用程式中，我們都會需要傳遞一些資料給子執行緒進行計算，而在計算完之後再將結果傳回來，而子執行緒在傳回資料時通常都會以配置記憶體空間來存放傳回的資料，以下是一個典型的範例：

 *child( *arg) { *input = ( *) arg; *result = malloc(() * ); result[] = input[] + input[]; pthread_exit(( *) result); } main() { pthread_t t; *ret; input[] = {, }; pthread_create(&t, , child, (*) input); pthread_join(t, &ret); *result = ( *) ret; printf(, input[], input[], result[]); free(result); ; }

執行的輸出為：

1 + 2 = 3

這個程式中，子執行緒呼叫配置了記憶體空間，而主執行緒在使用完該記憶體空間之後，負責釋放掉不再使用的記憶體。

多執行緒之間的記憶體管理其實很不方便，也很容易不小心寫錯，造成記憶體流失（memory leak）問題，若想避免這個問題，可以統一由主執行緒來管理記憶體，以下是一個範例：

 my_data { a; b; result; } my_data; *child( *arg) { my_data *data=(my_data *)arg; a = data->a; b = data->b; result = a + b; data->result = result; pthread_exit(); } main() { pthread_t t; my_data data; data.a = ; data.b = ; pthread_create(&t, , child, (*) &data); pthread_join(t, ); printf(, data.a, data.b, data.result); ; }

這個例子中，我們使用自己定義的資料結構（struct），將所有的輸入資料與輸出結果欄位都包裝在一個中，以指標的方式傳入子執行緒中，讓子執行緒在計算完成後，將結果直接寫入的欄位，這樣就不需要另外配置記憶體空間，而主執行緒也可以直接取得計算結果。

在平行化的程式中，如果發生多個執行緒需要同時存取同一個位置的資料時，就有可能會因為同時存取而產生錯誤，在下面這個例子中，我們定義一個全域變數，用來紀錄某個量的總和，而我們希望在多個執行緒中同時計算，然後統一將加總的結果放在其中。

 counter = ; * child() { ( i = ;i < ;++i) { tmp = counter; sleep(); counter = tmp + ; printf(, counter); } pthread_exit(); } main() { pthread_t t1, t2; pthread_create(&t1, , child, ); pthread_create(&t2, , child, ); pthread_join(t1, ); pthread_join(t2, ); ; }

在這段程式碼中，我們放了兩個子執行緒，每個子執行緒用迴圈跑了三次計算，所以最後的預期應該是，但由於我們將的值取出來，計算出新的值之後在放回去，兩個子執行緒同時都這樣做的話，計算結果就會不如預期：

這個問題的解決方法就是加入一個互斥鎖（mutex），將那些不可以被多個執行緒同時執行的程式碼片段，用互斥鎖包起來，當一個執行緒執行到該處時，就會先上鎖，避免其他的執行緒進入，若其他的執行緒同時也要執行該處的程式碼時，就必須等待先前的執行緒執行完之後，才能接著進入（也就是排隊輪流使用的概念），這樣就可以避免多個執行緒混雜執行，讓結果出錯的問題。

 counter = ; pthread_mutex_t mutex1 = PTHREAD_MUTEX_INITIALIZER; * child() { ( i = ;i < ;++i) { pthread_mutex_lock( &mutex1 ); tmp = counter; sleep(); counter = tmp + ; pthread_mutex_unlock( &mutex1 ); printf(, counter); } pthread_exit(); } main() { pthread_t t1, t2; pthread_create(&t1, , child, ); pthread_create(&t2, , child, ); pthread_join(t1, ); pthread_join(t2, ); ; }

在與之間的程式碼就是一次只容許一個執行緒執行的部份，也就是說雖然是平行化的程式，但是被包住的這部份只能以單一執行緒來執行，所以在設計程式時，要盡可能減少被互斥鎖包住的程式碼，才能讓程式執行效能更好。

如果我們現在有兩個執行緒，分別負責一份工作的前半段與後半段，也就是說第一個執行緒會把它處理好的資料，發包給第二個執行緒繼續處理，而兩個執行緒的處理速度有可能不同，這種狀況我們就可以使用旗標（Semaphore）的方式來串接。

旗標本身就是一個計數器，也就是紀錄目前尚未處理的工作數量，我們可以使用來判斷是否有尚未處理的工作，當工作數量大於時，就會讓執行緒進入處理，並且把工作數量遞減，而如果工作數量為的時候，則會讓執行緒等待，直到有新的工作來臨時，才讓執行緒進入。

另外在產生工作的執行緒中，可以使用放入新的工作（也就讓將計數器遞增），這樣就可以將多個執行緒串接起來處理大型的工作流程。

以下是一個簡單的範例：

 sem_t semaphore; counter = ; * child() { ( i = ;i < ;++i) { sem_wait(&semaphore); printf(, ++counter); sleep(); } pthread_exit(); } main() { sem_init(&semaphore, , ); pthread_t t; pthread_create(&t, , child, ); printf(); sem_post(&semaphore); sem_post(&semaphore); sleep(); printf(); sem_post(&semaphore); sem_post(&semaphore); sem_post(&semaphore); pthread_join(t, ); ; }

在這個程式中，主執行緒負責派送工作，工作有時候多、有時候少，而子執行緒則是以每秒處理一個工作的速度，消化接收到的工作。

旗標在使用前要先以初始化，其第二個參數是指定是否要讓其他的行程（process）共用旗標，這裡我們是單一行程、多執行緒的程式，所以第二個參數設定為即可；第三個參數則是設定旗標的初始值。

旗標本身只是紀錄工作的數量，並且控制執行緒的執行，並沒有負責資料的配送，通常我們可以自己實做一個資料佇列（queue），配合旗標來計算索引，讓子執行緒從佇列中取得資料進行處理。

參考資料：YoLinux.com、Gribble Lab、開源筆記倉庫區、The Geek Stuff

上一篇： c语言结构体指针定义

下一篇： js中如何给数组添加数据

版权声明：
本文来源网络，所有图片文章版权属于原作者，如有侵权，联系删除。

本文网址：https://www.mushiming.com/mjsbk/15716.html

相关文章：