欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

C中實現(xiàn)矩陣乘法的一種高效的方法

 更新時間:2013年05月04日 17:14:03   作者:  
本篇文章介紹了,在C中實現(xiàn)矩陣乘法的一種高效的方法。需要的朋友參考下

如何計算矩陣乘法,這個大家都知道。通常情況下,我們都是用以下代碼實現(xiàn)的

復(fù)制代碼 代碼如下:

for(i=0;i<n;++i)
    for(j=0;j<n;++j){
        sum=0;
        for(k=0;k<n;++k)
            sum+=A[i][k]*B[k][j];
        C[i][j]+=sum;
}

但是考慮了高速緩存的問題后,其實有一種更好的實現(xiàn)方式:
復(fù)制代碼 代碼如下:


for(i=0;i<n;++i)
    for(k=0;k<n;++k){
        r=A[i][k];
        for(j=0;j<n;++j)
            C[i][j]+=r*B[k][j];
}



細(xì)看一番就會發(fā)現(xiàn)這兩種實現(xiàn)語義是等價的,但是后者的實際運行效率卻比前者高。

那為什么會如此呢?

那是因為CPU讀數(shù)據(jù)時,并不是直接訪問內(nèi)存,而是先查看緩存中是否有數(shù)據(jù),有的話直接從緩存讀取。而從緩存讀取數(shù)據(jù)比從內(nèi)存讀數(shù)據(jù)快很多。

當(dāng)數(shù)據(jù)不在緩存中時,CPU會將包含數(shù)據(jù)在內(nèi)的一個數(shù)據(jù)塊讀到緩存,如果程序具有良好空間局部性,那么第一次cache miss后,之后的幾次數(shù)據(jù)訪問就可以直接在緩存中完成。除了空間局部性(程序傾向于引用與當(dāng)前數(shù)據(jù)鄰近的數(shù)據(jù))之外,還有時間局部性(程序傾向于引用最近被引用過的數(shù)據(jù))。

回到矩陣乘法。(我們只考慮內(nèi)循環(huán))

前者對矩陣A,有良好的空間局部性,假設(shè)一次能緩存四個元素,則每次迭代對于A只有0.25次miss,但是對于B,則不然,因此B是按列訪問的,每次訪問都會miss,因此每次迭代總的miss數(shù)是1.25。

后者對于矩陣C和矩陣B都有良好的局部性,每次迭代都只有0.25詞miss,因此總的miss數(shù)是0.5。后者每次迭代多了一次存儲(對C[i][j]寫入),但是即便如此,后者的運行效率也比前者高。

總而言之,要想程序跑得快,就要在程序中多利用局部性,讓緩存hold住你的數(shù)據(jù),減少訪存次數(shù)。要知道CPU可以在3個時鐘周期內(nèi)訪問到L1 cache,10個時鐘周期左右的時間訪問到L2 cache。訪問內(nèi)存卻要上百個時鐘周期,孰快孰慢,很清楚了吧?

相關(guān)文章

  • 使用C++繪制GDI位圖的基本編寫實例

    使用C++繪制GDI位圖的基本編寫實例

    這篇文章主要介紹了使用C++繪制GDI位圖的基本編寫實例,一般來說適用于Windwos下的C++的GUI編程,需要的朋友可以參考下
    2015-12-12
  • 二分法求多項式在-10 10間值的實現(xiàn)代碼

    二分法求多項式在-10 10間值的實現(xiàn)代碼

    以下實例是介紹了二分法求多項式在-10 10間值的實現(xiàn)代碼。需要的朋友參考下
    2013-05-05
  • C語言之格式化屏幕輸出詳解

    C語言之格式化屏幕輸出詳解

    這篇文章主要介紹了C語言之格式化屏幕輸出的相關(guān)資料,需要的朋友可以參考下,小編覺得這篇文章寫的還不錯,希望能夠給你帶來幫助
    2021-11-11
  • Linux C 獲取進程退出值的實現(xiàn)代碼

    Linux C 獲取進程退出值的實現(xiàn)代碼

    本篇文章是對在Linux下使用c語言獲取進程退出值的方法進行了詳細(xì)的分析介紹,需要的朋友參考下
    2013-05-05
  • C語言使用openSSL庫AES模塊實現(xiàn)加密功能詳解

    C語言使用openSSL庫AES模塊實現(xiàn)加密功能詳解

    這篇文章主要介紹了C語言使用openSSL庫AES模塊實現(xiàn)加密功能,詳細(xì)分析了C語言加密的相關(guān)概念、原理及AES模塊加密具體實現(xiàn)技巧,需要的朋友可以參考下
    2017-05-05
  • C語言進階教程之字符串&內(nèi)存函數(shù)

    C語言進階教程之字符串&內(nèi)存函數(shù)

    對于字符,在計算機內(nèi)部都是用數(shù)字(字符編碼)來表示的,而字符串是“字符連續(xù)排列”的一種表現(xiàn),這篇文章主要給大家介紹了關(guān)于C語言進階教程之字符串&內(nèi)存函數(shù)的相關(guān)資料,需要的朋友可以參考下
    2021-09-09
  • QT窗口/控件置頂方法舉例詳解

    QT窗口/控件置頂方法舉例詳解

    我們使用QT進行界面開發(fā)時,可能會遇到需要將窗口置頂?shù)那闆r,下面這篇文章主要給大家介紹了關(guān)于QT窗口/控件置頂方法的相關(guān)資料,文中通過代碼介紹的非常詳細(xì),需要的朋友可以參考下
    2024-01-01
  • C語言實現(xiàn)在數(shù)組A上有序合并數(shù)組B的方法

    C語言實現(xiàn)在數(shù)組A上有序合并數(shù)組B的方法

    這篇文章主要介紹了C語言實現(xiàn)在數(shù)組A上有序合并數(shù)組B的方法,包含了數(shù)組操作的完整實現(xiàn)過程以及相應(yīng)的代碼分析與改進,具有不錯的借鑒價值,需要的朋友可以參考下
    2014-09-09
  • C++類中三大函數(shù)詳解(構(gòu)造、析構(gòu)和拷貝)

    C++類中三大函數(shù)詳解(構(gòu)造、析構(gòu)和拷貝)

    c++三大函數(shù)指的是拷貝構(gòu)造、拷貝賦值、析構(gòu)函數(shù),下面這篇文章主要給大家介紹了關(guān)于C++類中三大函數(shù)(構(gòu)造、析構(gòu)和拷貝)的相關(guān)資料,文中通過實例代碼介紹的非常詳細(xì),需要的朋友可以參考下
    2023-03-03
  • C++異步數(shù)據(jù)交換實現(xiàn)方法介紹

    C++異步數(shù)據(jù)交換實現(xiàn)方法介紹

    這篇文章主要介紹了C++異步數(shù)據(jù)交換實現(xiàn)方法,異步數(shù)據(jù)交換,除了阻塞函數(shù) send() 和 recv() 之外,Boost.MPI 還支持與成員函數(shù) isend() 和 irecv() 的異步數(shù)據(jù)交換
    2022-11-11

最新評論