无码专区—va亚洲v天堂麻豆-国产成人亚洲综合app网站-亚洲大尺度专区无码浪潮av-无码国产成人午夜视频在线播放-国产精品亚洲аv无码播放

美國服務器Linux系統多核并行編程技術介紹

目前主流的美國服務器 Linux 系統主機都是馮諾依曼架構,即共享內存的計算模型,這種過程計算模型對并行計算并不友好。這種架構中,有如下設計特點: 1 )多個美國服務器 CPU 核改

美國服務器Linux系統多核并行編程技術介紹

來源:美國服務器 作者:美聯科技小編Zoe 瀏覽量:155
2020-02-27
0

目前主流的美國服務器Linux系統主機都是馮諾依曼架構,即共享內存的計算模型,這種過程計算模型對并行計算并不友好。這種架構中,有如下設計特點:

1)多個美國服務器CPU核改善處理器的計算處理能力

2)多級cache改善美國服務器CPU訪問主存的效率

3)各個CPU都有本地內存(NUMA(非一致性內存訪問)),進一步改善CPU訪問主存的效率

4store buffer模塊改善cache write由于應答延遲而造成的寫停頓問題

5invalidate queue模塊改善使無效應答的時延,把使無效命令放入queue后就立即發送應答

6)外設DMA支持直接訪問主存,改善美國服務器CPU使用效率

這些硬件體系設計特點也引入很多問題,最大的問題就是cache一致性問題和亂序執行問題。cache一致性問題由cache一致性協議MESI解決,MESI由硬件保證,對軟件來說是透明的。

MESI協議保證所有CPU對單個cache line中單個變量修改的順序保持一致,但不保證不同變量的修改在所有CPU上看到的是相同順序。這就造成了亂序。不僅如此,亂序的原因還有很多:

1store buffer引起的延遲處理,會造成亂序

2invalidate queue引起的延遲處理,會造成亂序

3)編譯優化,會造成亂序

4)分支預測、多流水線等CPU硬件優化技術,會造成亂序

5)外設DMA,會造成數據亂序

這種情況造成,就連簡單的++運算操作的原子性都無法保證,而這些問題必須采用多核并行編程新的技術手段來解決。

多核并行編程關鍵技術

1、鎖技術

美國服務器Linux kernel提供了多種鎖機制,如自旋鎖、信號量、互斥量、讀寫鎖、順序鎖等。各種鎖的簡單比較如下:

1)自旋鎖,不休眠,無進程上下文切換開銷,可以用在中斷上下文和臨界區小的場合

2)信號量,會休眠,支持同時多個并發體進入臨界區,可以用在可能休眠或者長的臨界區的場合

3)互斥量,類似與信號量,但只支持同時只有一個并發體進入臨界區

4)讀寫鎖,支持讀并發,寫寫/讀寫間互斥,讀會延遲寫,對讀友好,適用讀側重場合

5)順序鎖,支持讀并發,寫寫/讀寫間互斥,寫會延遲讀,對寫友好,適用寫側重場合

鎖技術雖然能有效地提供并行執行下的競態保護,但鎖的并行可擴展性很差,無法充分發揮多核的性能優勢。鎖的粒度太粗會限制擴展性,粒度太細會導致巨大的系統開銷,而且設計難度大,容易造成死鎖。以下技術手段或指導原則能解決或減輕這些問題的風險:

1)按統一的層次順序使用鎖,解決死鎖問題

2)指數后退,解決活鎖/饑餓問題

3)范圍鎖,解決鎖驚群問題

4)優先級繼承,解決優先級反轉問題

2、原子技術

原子技術主要是解決cache不一致性和亂序執行對原子訪問的破壞問題。主要的原子原語有:

1ACCESS_ONECE():只限制編譯器對內存訪問的優化

2)barrier():只限制編譯器的亂序優化

3)smb_wmb():寫內存屏障,刷新store buffer,同時限制編譯器和美國服務器CPU的亂序優化

4smb_rmb():讀內存屏障,刷新invalidate queue,同時限制編譯器和美國服務器CPU的亂序優化

5smb_mb():讀寫內存屏障,同時刷新store bufferinvalidate queue,同時限制編譯器和CPU的亂序優化

6atomic_inc()/atomic_read()美國服務器整型原子操作

3、無鎖技術

原子技術是無鎖技術中的一種,除此之外,無鎖技術還包括RCUHazard pointer等,這些無鎖技術都基于內存屏障實現的:

1Hazard pointer主要用于對象的生命周期管理,類似引用計數,但比引用計數有更好的并行可擴展性。

2RCU適用的場景很多,其可以替代:讀寫鎖、引用計數、垃圾回收器、等待事物結束等,而且有更好的并行擴展性。但RCU也有一些不適用的場景,如寫側重、臨界區長、臨界區內休眠等場景。

不過,所有的無鎖原語也只能解決讀端的并行可擴展性問題,寫端的并行可擴展性只能通過數據分割技術來解決。

4、數據分割技術

分割數據結構,減少共享數據,是解決并行可擴展性的根本辦法。對分割友好(即并行友好)的數據結構有:

1)數組

2)哈希表

3)基樹/稀疏數組

4)跳躍列表

使用這些便于分割的數據結構,有利于通過數據分割來改善并行可擴展性。除了使用合適的數據結構外,合理的分割指導規則也很重要:

1)讀寫分割:把以讀為主的數據與以寫為主的數據分開

2)路徑分割:按獨立的代碼執行路徑來分割數據

3)專項分割:把經常更新的數據綁定到指定的CPU/線程中

4)所有權分割:按美國服務器CPU/線程個數對數據結構進行分割,把數據分割到per-cpu/per-thread

以上這些美國服務器Linux系統多核并行編程內容,基本上涵蓋了Linux kernel中所有的并發編程關鍵技術。當然并行編程還有很多其他技術沒有應用到Linux kernel中的,如無副作用的并行函數式編程技術、消息傳遞、MapReduce等等。

關注美聯科技,了解更多IDC資訊!

部分文章來源與網絡,若有侵權請聯系站長刪除!
主站蜘蛛池模板: 99国内精品久久久久久久| 香蕉视频在线观看亚洲| 欧美激情一区二区三区高清视频| 亚洲a∨精品永久无码| 一区二区三区在线 | 欧| 亚洲中文字幕aⅴ无码天堂| 成人天堂资源www在线| 亚洲精品1卡2卡三卡4卡乱码| 在线精品亚洲观看不卡欧| 亚洲国产精品久久艾草纯爱| 高清粉嫩无套内谢国语播放 | 久久亚洲国产成人精品性色| 国产精品资源一区二区| 欧美在线看片a免费观看| 亚洲成av人片不卡无码| 免费的美女色视频网站| 国产精品视频免费播放| 99久久久无码国产精品aaa| 成人av片在线观看免费| 少妇的肉体k8经典| 欧美日韩精品人妻狠狠躁免费视频 | 国产深夜福利视频在线| 777奇米四色成人影视色区| 欧美婷婷六月丁香综合色| 日韩亚洲产在线观看| 欧美日韩国产va另类| av天堂久久天堂av| 欧美日韩在线亚洲综合国产人| 13小箩利洗澡无码视频网站免费| 精品国模一区二区三区| 国自产拍偷拍精品啪啪一区二区| 少妇精品揄拍高潮少妇| 法国啄木乌av片在线播放| 亚洲国产精品无码一区二区三区| 日本不卡三区| 精品国产一区二区av片| 成人免费视频无码专区| 成人久久精品一区二区三区| 国产av无码精品色午夜| 久久人妻天天av| 蜜臀av在线观看|