欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

VS2022 CUDA環(huán)境配置的實現(xiàn)步驟

 更新時間:2023年05月26日 10:45:42   作者:微小冷  
本文主要介紹了VS2022 CUDA環(huán)境配置的實現(xiàn)步驟,文中通過圖文示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧

安裝準備

配置Cuda環(huán)境主要分為以下幾個步驟

  • 安裝VS 這個應該不用太說,直接裝最新版
  • 安裝CUDA 下載地址:Cuda Toolkit
  • 安裝cuDNN 下載地址:cuDNN archieve

這個安裝順序非常重要,一定是先裝VS后裝CUDA Toolkit,否則CUDA不可能未卜先知地在VS目錄中創(chuàng)建項目模板。

為了確認Cuda的安裝版本,可在命令行中輸入nvidia-smi,其返回值如下,表頭中的CUDA Version便是Cuda版本,我這里是12.1,所以選擇CUDA Toolkit 12.1.0,cuDNN選擇最新的v8.8.1 for CUDA 12.x

>nvidia-smi
Tue Apr 25 11:52:50 2023
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 531.14                 Driver Version: 531.14       CUDA Version: 12.1     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                      TCC/WDDM | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf            Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  NVIDIA GeForce RTX 4060 L...  WDDM | 00000000:01:00.0  On |                  N/A |
| N/A   36C    P8                3W /  N/A|    250MiB /  8188MiB |      1%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+
+---------------------------------------------------------------------------------------+
| Processes:                                                                            |
|  GPU   GI   CI        PID   Type   Process name                            GPU Memory |
|        ID   ID                                                             Usage      |
|=======================================================================================|
|    0   N/A  N/A     10556    C+G   ...auncher\PowerToys.PowerLauncher.exe    N/A      |
|    0   N/A  N/A     10980    C+G   ...rPicker\PowerToys.ColorPickerUI.exe    N/A      |
+---------------------------------------------------------------------------------------+

Cuda toolkit安裝的第一步是解壓,可以選擇一個臨時地址,直到NVIDIA安裝程序的界面彈出后,才開始真正安裝。在安裝過程中,選擇自定義可以自行選擇安裝路徑,剩下沒什么好說的,安裝成功之后,在命令行中輸入nvcc -V可返回版本呢信息。

>nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2023 NVIDIA Corporation
Built on Wed_Feb__8_05:53:42_Coordinated_Universal_Time_2023
Cuda compilation tools, release 12.1, V12.1.66
Build cuda_12.1.r12.1/compiler.32415258_0

cuDNN在安裝時需要注冊,下載完成后將壓縮包中的三個文件夾解壓到Cuda安裝目錄中,然后就能用了。

新建項目

安裝成功之后,打開VS2022,就可以看到CUDA12.1的項目模板,點進去之后就能創(chuàng)建CUDA程序了

CUDA,或者說GPU的編程邏輯是,先將內(nèi)存中的數(shù)組寫入到顯存中,然后再執(zhí)行操作。

其自帶的模板程序非常簡單,就是對兩個數(shù)組進行并行求和,用到的是一個自定義函數(shù)

__global__ void addKernel(int *c, const int *a, const int *b)
{
    int i = threadIdx.x;
    c[i] = a[i] + b[i];
}

但在具體調(diào)用時,用到了<<<>>>這個語法,表示GPU調(diào)用的線程塊,示例程序在調(diào)用自定義函數(shù)addKernel時,用到了下面的代碼,表示調(diào)用1個線程塊,每個線程塊中有5個線程。

//size=5
addKernel<<<1, size>>>(dev_c, dev_a, dev_b);

到此這篇關(guān)于VS2022 CUDA環(huán)境配置的實現(xiàn)步驟的文章就介紹到這了,更多相關(guān)VS2022 CUDA環(huán)境配置內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

最新評論