進程訪問機制_如何利用信號量機制實現多進程訪問臨界資源

1. Linux 進程間通信方式有哪些

1、無名管道通信
無名管道(pipe)：管道是一種半雙工的通信方式，數據只能單向流動，而且只能在具有親緣關系的進程間使用，進程的親緣關系通常是指父子進程關系。
2、高級管道通信
高級管道(popen)：將另一個程序當做一個新的進程在當前程序進程中啟動，則它算是當前程序的子進程，這種方式我們稱為高級管道方式。
3、有名管道通信
有名管道(named pipe)：有名管道也是半雙工的通信方式，但是它允許無親緣關系進程間的通信。
4、消息隊列通信
消息隊列(message
queue)：消息隊列是由消息的鏈表，存放在內核中並由消息隊列標識符標識，消息隊列克服了信號傳遞信息少、管道只能承載無格式位元組流以及緩沖區大小受限等缺點。
5、信號量通信
信號量(semophore)：信號量是一個計數器，可以用來控制多個進程對共享資源的訪問，它常作為一種鎖機制，防止某進程正在訪問共享資源時，其他進程訪問該資源。因此，主要作為進程間以及同一進程內不同線程之間的同步手段。
6、信號
信號(sinal)：信號是一種比較復雜的通信方式，用於通知接收進程某個事件已經發生。
7、共享內存通信
共享內存(shared
memory)：共享內存就是映射一段能被其他進程所訪問的內存，這段共享內存由一個進程創建，但多個進程都可以訪問。共享內存是最快的IPC方式，它是針對其他進程間通信方式運行效率低而專門設計的。它往往與其他通信機制，如信號量，配合使用，來實現進程間的同步和通信。
8、套接字通信
套接字(socket)：套接字也是一種進程間通信機制，與其他通信機制不同的是，它可用於不同機器間的進程通信。

2. 進程間通信方式

在操作系統中，一個進程可以理解為是關於計算機資源集合的一次運行活動，其就是一個正在執行的程序的實例。從概念上來說，一個進程擁有它自己的虛擬CPU和虛擬地址空間，任何一個進程對於彼此而言都是相互獨立的，這也引入了一個問題 —— 如何讓進程之間互相通信？

由於進程之間是互相獨立的，沒有任何手段直接通信，因此我們需要藉助操作系統來輔助它們。舉個通俗的例子，假如A與B之間是獨立的，不能彼此聯系，如果它們想要通信的話可以藉助第三方C，比如A將信息交給C，C再將信息轉交給B —— 這就是進程間通信的主要思想 —— 共享資源。

這里要解決的一個重要的問題就是如何避免競爭，即避免多個進程同時訪問臨界區的資源。

共享內存是進程間通信中最簡單的方式之一。共享內存允許兩個或更多進程訪問同一塊內存。當一個進程改變了這塊地址中的內容的時候，其它進程都會察覺到這個更改。

你可能會想到，我直接創建一個文件，然後進程不就都可以訪問了？

是的，但這個方法有幾個缺陷：

Linux下採用共享內存的方式來使進程完成對共享資源的訪問，它將磁碟文件復制到內存，並創建虛擬地址到該內存的映射，就好像該資源本來就在進程空間之中，此後我們就可以像操作本地變數一樣去操作它們了，實際的寫入磁碟將由系統選擇最佳方式完成，例如操作系統可能會批量處理加排序，從而大大提高IO速度。

如同上圖一樣，進程將共享內存映射到自己的虛擬地址空間中，進程訪問共享進程就好像在訪問自己的虛擬內存一樣，速度是非常快的。

共享內存的模型應該是比較好理解的：在物理內存中創建一個共享資源文件，進程將該共享內存綁定到自己的虛擬內存之中。

這里要解決的一個問題是如何將同一塊共享內存綁定到自己的虛擬內存中，要知道在不同進程中使用 malloc 函數是會順序分配空閑內存，而不會分配同一塊內存，那麼要如何去解決這個問題呢？

Linux操作系統已經想辦法幫我們解決了這個問題，在 #include <sys/ipc.h> 和 #include <sys/shm.h> 頭文件下，有如下幾個shm系列函數：

通過上述幾個函數，每個獨立的進程只要有統一的共享內存標識符便可以建立起虛擬地址到物理地址的映射，每個虛擬地址將被翻譯成指向共享區域的物理地址，這樣就實現了對共享內存的訪問。

還有一種相像的實現是採用mmap函數，mmap通常是直接對磁碟的映射——因此不算是共享內存，存儲量非常大，但訪問慢； shmat與此相反，通常將資源保存在內存中創建映射，訪問快，但存儲量較小。

不過要注意一點，操作系統並不保證任何並發問題，例如兩個進程同時更改同一塊內存區域，正如你和你的朋友在線編輯同一個文檔中的同一個標題，這會導致一些不好的結果，所以我們需要藉助信號量或其他方式來完成同步。

信號量是迪傑斯特拉最先提出的一種為解決同步不同執行線程問題的一種方法，進程與線程抽象來看大同小異，所以 信號量同樣可以用於同步進程間通信 。

信號量 s 是具有非負整數值的全局變數，由兩種特殊的 原子操作 來實現，這兩種原子操作稱為 P 和 V ：

信號量並不用來傳送資源，而是用來保護共享資源，理解這一點是很重要的，信號量 s 的表示的含義為 同時允許最大訪問資源的進程數量 ，它是一個全局變數。來考慮一個上面簡單的例子：兩個進程同時修改而造成錯誤，我們不考慮讀者而僅僅考慮寫者進程，在這個例子中共享資源最多允許一個進程修改資源，因此我們初始化 s 為1。

開始時，A率先寫入資源，此時A調用P(s)，將 s 減一，此時 s = 0，A進入共享區工作。

此時，進程B也想進入共享區修改資源，它調用P(s)發現此時s為0，於是掛起進程，加入等待隊列。

A工作完畢，調用V(s)，它發現s為0並檢測到等待隊列不為空，於是它隨機喚醒一個等待進程，並將s加1，這里喚醒了B。

B被喚醒，繼續執行P操作，此時s不為0，B成功執行將s置為0並進入工作區。

此時C想要進入工作區......

可以發現，在無論何時只有一個進程能夠訪問共享資源，這就是信號量做的事情，他控制進入共享區的最大進程數量，這取決於初始化s的值。此後，在進入共享區之前調用P操作，出共享區後調用V操作，這就是信號量的思想。

在Linux下並沒有直接的P&V函數，而是需要我們根據這幾個基本的sem函數族進行封裝：

正如其名，管道就如同生活中的一根管道，一端輸送，而另一端接收，雙方不需要知道對方，只需要知道管道就好了。

管道是一種最 基本的進程間通信機制。 管道由pipe函數來創建：調用pipe函數，會在內核中開辟出一塊緩沖區用來進行進程間通信，這塊緩沖區稱為管道，它有一個讀端和一個寫端。管道被分為匿名管道和有名管道。

匿名管道通過pipe函數創建，這個函數接收一個長度為2的Int數組，並返回1或0表示成功或者失敗：

int pipe(int fd[2])

這個函數打開兩個文件描述符，一個讀端文件，一個寫端，分別存入fd[0]和fd[1]中，然後可以作為參數調用 write 和 read 函數進行寫入或讀取，注意fd[0]只能讀取文件，而fd[1]只能用於寫入文件。

你可能有個疑問，這要怎麼實現通信？其他進程又不知道這個管道，因為進程是獨立的，其他進程看不到某一個進程進行了什麼操作。

是的，『其他』進程確實是不知道，但是它的子進程卻可以！這里涉及到fork派生進程的相關知識，一個進程派生一個子進程，那麼子進程將會復制父進程的內存空間信息，注意這里是復制而不是共享，這意味著父子進程仍然是獨立的，但是在這一時刻，它們所有的信息又是相等的。因此子進程也知道該全局管道，並且也擁有兩個文件描述符與管道掛鉤，所以 匿名管道只能在具有親緣關系的進程間通信。

還要注意，匿名管道內部採用環形隊列實現，只能由寫端到讀端，由於設計技術問題，管道被設計為半雙工的，一方要寫入則必須關閉讀描述符，一方要讀出則必須關閉寫入描述符。因此我們說 管道的消息只能單向傳遞。

注意管道是堵塞的，如何堵塞將依賴於讀寫進程是否關閉文件描述符。如果讀管道，如果讀到空時，假設此時寫埠還沒有被完全關閉，那麼操作系統會假設還有數據要讀，此時讀進程將會被堵塞，直到有新數據或寫埠被關閉；如果管道為空，且寫埠也被關閉，此時操作系統會認為已經沒有東西可讀，會直接退出，並關閉管道。

對於寫一個已經滿了的管道同理而言。

管道內部由內核管理，在半雙工的條件下，保證數據不會出現並發問題。

了解了匿名管道之後，有名管道便很好理解了。在匿名管道的介紹中，我們說其他進程不知道管道和文件描述符的存在，所以匿名管道只適用於具有親緣關系的進程，而命名管道則很好的解決了這個問題 —— 現在管道有一個唯一的名稱了，任何進程都可以訪問這個管道。

注意，操作系統將管道看作一個抽象的文件，但管道並不是普通的文件，管道存在於內核空間中而不放置在磁碟(有名管道文件系統上有一個標識符，沒有數據塊)，訪問速度更快，但存儲量較小，管道是臨時的，是隨進程的，當進程銷毀，所有埠自動關閉，此時管道也是不存在的，操作系統將所有IO抽象的看作文件，例如網路也是一種文件，這意味著我們可以採用任何文件方法操作管道，理解這種抽象是很重要的，命名管道就利用了這種抽象。

Linux下，採用mkfifo函數創建，可以傳入要指定的『文件名』，然後其他進程就可以調用open方法打開這個特殊的文件，並進行write和read操作(那肯定是位元組流對吧)。

注意，命名管道適用於任何進程，除了這一點不同外，其餘大多數都與匿名管道相同。

消息隊列亦稱報文隊列，也叫做信箱，是Linux的一種通信機制，這種通信機制傳遞的數據會被拆分為一個一個獨立的數據塊，也叫做消息體，消息體中可以定義類型與數據，克服了無格式承載位元組流的缺陷(現在收到void*後可以知道其原本的格式惹):

同管道類似，它有一個不足就是每個消息的最大長度是有上限的，整個消息隊列也是長度限制的。

內核為每個IPC對象維護了一個數據結構struct ipc_perm，該數據結構中有指向鏈表頭與鏈表尾部的指針，保證每一次插入取出都是O(1)的時間復雜度。

一個進程可以發送信號給另一個進程，一個信號就是一條消息，可以用於通知一個進程組發送了某種類型的事件，該進程組中的進程可以採取處理程序處理事件。

Linux下 unistd.h 頭文件下定義了如圖中的常量，當你在shell命令行鍵入 ctrl + c 時，內核就會前台進程組的每一個進程發送 SIGINT 信號，中止進程。

我們可以看到上述只有30個信號，因此操作系統會為每一個進程維護一個int類型變數sig，利用其中30位代表是否有對應信號事件，每一個進程還有一個int類型變數block，與sig對應，其30位表示是否堵塞對應信號(不調用處理程序)。如果存在多個相同的信號同時到來，多餘信號會被存儲在一個等待隊列中等待。

我們要理解進程組是什麼，每個進程屬於一個進程組，可以有多個進程屬於同一個組。每個進程擁有一個進程ID，稱為 pid ，而每個進程組擁有一個進程組ID，稱為 pgid ，默認情況下，一個進程與其子進程屬於同一進程組。

軟體方面(諸如檢測鍵盤輸入是硬體方面)可以利用kill函數發送信號，kill函數接受兩個參數，進程ID和信號類型，它將該信號類型發送到對應進程，如果該pid為0，那麼會發送到屬於自身進程組的所有進程。

接收方可以採用signal函數給對應事件添加處理程序，一旦事件發生，如果未被堵塞，則調用該處理程序。

Linux下有一套完善的函數用以處理信號機制。

Socket套接字是用與網路中不同主機的通信方式，多用於客戶端與伺服器之間，在Linux下也有一系列C語言函數，諸如socket、connect、bind、listen與accept，我們無需花太多時間研究這些函數，因為我們可能一輩子都不會與他們打交道，對於原理的學習，後續我會對Java中的套接字socket源碼進行剖析。

對於工作而言，我們可能一輩子都用不上這些操作，但作為對於操作系統的學習，認識到進程間是如何通信還是很有必要的。

面試的時候對於這些方法我們不需要掌握到很深的程度，但我們必須要講的來有什麼通信方式，這些方式都有什麼特點，適用於什麼條件，大致是如何操作的，能說出這些，基本足以讓面試官對你十分滿意了。

3. 如何利用信號量機制實現多進程訪問臨界資源

進程互斥定義:兩個或兩個以上的進程,不能同時進入關於同一組共享變數的臨界區域,否則可能發生與時間有關的錯誤,這種現象被稱作進程互斥.
在多道程序環境下，存在著臨界資源，它是指多進程存在時必須互斥訪問的資源。也就是某一時刻不允許多個進程同時訪問，只能單個進程的訪問。我們把這些程序的片段稱作臨界區或臨界段，它存在的目的是有效的防止競爭條件又能保證最大化使用共享數據。而這些並發進程必須有好的解決方案，才能防止出現以下情況：多個進程同時處於臨界區，臨界區外的進程阻塞其他的進程，有些進程在臨界區外無休止的等待。除此以外，這些方案還不能對CPU的速度和數目做出任何的假設。只有滿足了這些條件，才是一個好的解決方案。
訪問臨界資源的循環進程可以這樣來描述：
Repeat
entry section
Critical sections;
exit section
Remainder sectioni;
Until false
為實現進程互斥，可以利用軟體的方法，也可以在系統中設置專門的同步機制來協調多個進程，但是所有的同步機制應該遵循四大准則：
1.空閑讓進當臨界資源處於空閑狀態，允許一個請求進入臨界區的進程立即進入臨界區，從而有效的利用資源。
2.忙則等待已經有進程進入臨界區時，意味著相應的臨界資源正在被訪問，所以其他准備進入臨界區的進程必須等待，來保證多進程互斥。
3.有限等待對要求訪問臨界資源的進程，應該保證該進程能在有效的時間內進入臨界區，防止死等狀態。
4.讓權等待當進程不能進入臨界區，應該立即釋放處理機，防止進程忙等待。
早期解決進程互斥問題有軟體的方法和硬體的方法，如：嚴格輪換法，Peterson的解決方案，TSL指令，Swap指令都可以實現進程的互斥，不過它們都有一定的缺陷，這里就不一一詳細說明，而後來Kijkstra提出的信號量機制則更好的解決了互斥問題。

進程訪問機制

與進程訪問機制相關的內容