欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

C++性能剖析教程之循環(huán)展開

 更新時間:2018年06月16日 08:50:43   作者:Root lee  
這篇文章主要給大家介紹了關于C++性能剖析教程之循環(huán)展開的相關資料,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧

什么是循環(huán)展開?

循環(huán)展開,英文中稱Loop unwinding或loop unrolling,是一種犧牲程序的尺寸來加快程序的執(zhí)行速度的優(yōu)化方法??梢杂沙绦騿T完成,也可由編譯器自動優(yōu)化完成。循環(huán)展開最常用來降低循環(huán)開銷,為具有多個功能單元的處理器提供指令級并行。也有利于指令流水線的調度。

循環(huán)展開能從兩方面改進程序的性能:

  • 減少了不直接有助于程序結果的操作的數量,例如循環(huán)索引計算和分支條件。
  • 提供了一些方法,可以進一步變化代碼,減少整個計算中關鍵路徑上的操作數量。

循環(huán)展開對程序性能的影響

我們直接以實際代碼向大家展示循環(huán)展開的作用,首先看未經過循環(huán)展開優(yōu)化的代碼:

#include <iostream>
#include <chrono>

int main(){
 auto start = std::chrono::system_clock::now();
 int sum = 0;
 int count = 10000;
 //循環(huán)10000次累加
 for(int i = 0;i < count;i++){ 
 sum += i;
 }
 auto end = std::chrono::system_clock::now();
 std::chrono::duration<double> dura = end - start;
 std::cout <<"共耗時:"<< dura.count() << "s" << std::endl;
 return 0;
}

類似于上面的這段代碼是我們平常工作中經常見到的,函數目的就是求得1+2+……+9998+9999的累加和,每次循環(huán)把i累加到sum變量上,循環(huán)次數一共10000次。代碼運行結果如下:


可以看出代碼運行耗時0.0000279秒。

下面我們將循環(huán)展開一次,即把上述代碼中的循環(huán)改為如下代碼:

for(int i = 0;i < count;i += 2){
 sum += i;
 sum += i+1;
}

即每次循環(huán)將i和i+1一起累加到sum變量上,這樣可以把循環(huán)次數從10000次降低到5000次,由于CPU的高度流水線化,連續(xù)兩個加法指令增加耗時很低,所以此版本代碼可以一定程度上提高程序運行速度,運行結果如下:


代碼運行耗時0.0000159秒,相較于未優(yōu)化代碼速度快了將近一倍。

當然,我們可以繼續(xù)增加循環(huán)展開次數以進一步提高程序運行速度,但是這個增加循環(huán)展開次數也是有限度的,當達到了CPU的最高吞吐量之后,繼續(xù)增加循環(huán)展開次數是沒有意義的。

上述循環(huán)展開后的代碼依然有進一步優(yōu)化的空間,那就是消除連續(xù)指令的相關性,以達到指令級并行,我們可以看到循環(huán)展開后的代碼,循環(huán)體中有兩條語句:sum += i 和 sum += i+1,第二條語句sum += i+1依賴于第一條命來sum += i的執(zhí)行結果,所以這兩條語句只能依次執(zhí)行,限制了CPU進一步提高性能的可能。如果我們將循環(huán)體改為如下代碼:

int sum1=0,sum2=0;
for(int i=0;i < count;i+=2){
 sum1 += i;
 sum2 += i+1;
}
sum = sum1 + sum2;

我們新建了兩個變量sum1和sum2用于存儲循環(huán)展開時兩個累加語句的累加結果,最后在循環(huán)體外將兩部分結果相加得到最終結果。該代碼中兩個累加語句之間是互不相關的,所以CPU可以并行執(zhí)行這兩條指令,以達到性能的進一步提高。下面是運行結果:


代碼運行耗時0.0000073秒,相較于只進行循環(huán)展開的代碼速度又快了將近一倍。

總結

由上面三段代碼的運行速度對比可以看出,循環(huán)展開對程序性能有著很重要的影響,可以減少分支預測錯誤次數,增加取消數據相關進一步利用并行執(zhí)行提高速度的機會。但是,并不建議大家進行手動的循環(huán)展開,在代碼中進行循環(huán)展開會導致程序的可讀性下降,代碼膨脹。為了直觀感受循環(huán)展開對性能的影響,上述代碼運行結果均是在不開編譯器優(yōu)化的情況下進行的測試,其實在我們開啟了編譯器優(yōu)化的時候,編譯器會自動對我們的循環(huán)代碼進行循環(huán)展開,讓我們可以在保持了代碼可讀性的同時,又能享受到循環(huán)展開對我們程序性能的提高。

好了,以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,如果有疑問大家可以留言交流,謝謝大家對腳本之家的支持。

相關文章

  • C++?system()函數的常用用法(全網最新)

    C++?system()函數的常用用法(全網最新)

    system()用于從C?/C++程序調用操作系統命令,這里給大家講解下C++?system()函數的常用用法,感興趣的朋友跟隨小編一起看看吧
    2023-01-01
  • C語言共用體union作用使用示例教程

    C語言共用體union作用使用示例教程

    這篇文章主要為大家介紹了C語言共用體union作用的使用示例教程,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
    2022-02-02
  • c語言中形參與實參的關系解讀

    c語言中形參與實參的關系解讀

    這篇文章主要介紹了c語言中形參與實參的關系,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2023-07-07
  • C語言深入講解宏的定義與使用方法

    C語言深入講解宏的定義與使用方法

    在 C 語言中,可以采用命令 #define 來定義宏。該命令允許把一個名稱指定成任何所需的文本,例如一個常量值或者一條語句。在定義了宏之后,無論宏名稱出現在源代碼的何處,預處理器都會把它用定義時指定的文本替換掉
    2022-04-04
  • C語言數據結構中數制轉換實例代碼

    C語言數據結構中數制轉換實例代碼

    這篇文章主要介紹了C語言數據結構中數制轉換實例代碼的相關資料,需要的朋友可以參考下
    2017-03-03
  • Qt使用SQLite數據庫存儲管理圖片文件

    Qt使用SQLite數據庫存儲管理圖片文件

    這篇文章主要為大家詳細介紹了Qt如何使用SQLite數據庫實現存儲管理圖片文件的功能,文中的示例代碼講解詳細,感興趣的小伙伴可以了解一下
    2023-04-04
  • C++ 淺談emplace_back及使用誤區(qū)

    C++ 淺談emplace_back及使用誤區(qū)

    這篇文章主要介紹了C++ 淺談emplace_back及使用誤區(qū),具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-12-12
  • C語言 數據結構中求解迷宮問題實現方法

    C語言 數據結構中求解迷宮問題實現方法

    這篇文章主要介紹了C語言 數據結構中求解迷宮問題實現方法的相關資料,需要的朋友可以參考下
    2017-03-03
  • c語言中用位運算實現加法技巧介紹

    c語言中用位運算實現加法技巧介紹

    用位運算實現加法也就是計算機用二進制進行運算,32位的CPU只能表示32位內的數,這里先用1位數的加法來進行,需要的朋友可以參考下
    2012-11-11
  • c語言通過opencv實現輪廓處理與切割

    c語言通過opencv實現輪廓處理與切割

    這篇文章主要介紹了c語言通過opencv實現輪廓處理與切割,具有一定借鑒價值,需要的朋友可以參考下
    2018-01-01

最新評論