VS2022 CUDA環(huán)境配置的實現(xiàn)步驟
安裝準備
配置Cuda環(huán)境主要分為以下幾個步驟
- 安裝VS 這個應該不用太說,直接裝最新版
- 安裝CUDA 下載地址:Cuda Toolkit
- 安裝cuDNN 下載地址:cuDNN archieve
這個安裝順序非常重要,一定是先裝VS后裝CUDA Toolkit,否則CUDA不可能未卜先知地在VS目錄中創(chuàng)建項目模板。
為了確認Cuda的安裝版本,可在命令行中輸入nvidia-smi
,其返回值如下,表頭中的CUDA Version
便是Cuda
版本,我這里是12.1,所以選擇CUDA Toolkit 12.1.0
,cuDNN
選擇最新的v8.8.1 for CUDA 12.x
>nvidia-smi Tue Apr 25 11:52:50 2023 +---------------------------------------------------------------------------------------+ | NVIDIA-SMI 531.14 Driver Version: 531.14 CUDA Version: 12.1 | |-----------------------------------------+----------------------+----------------------+ | GPU Name TCC/WDDM | Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |=========================================+======================+======================| | 0 NVIDIA GeForce RTX 4060 L... WDDM | 00000000:01:00.0 On | N/A | | N/A 36C P8 3W / N/A| 250MiB / 8188MiB | 1% Default | | | | N/A | +-----------------------------------------+----------------------+----------------------+ +---------------------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=======================================================================================| | 0 N/A N/A 10556 C+G ...auncher\PowerToys.PowerLauncher.exe N/A | | 0 N/A N/A 10980 C+G ...rPicker\PowerToys.ColorPickerUI.exe N/A | +---------------------------------------------------------------------------------------+
Cuda toolkit
安裝的第一步是解壓,可以選擇一個臨時地址,直到NVIDIA安裝程序
的界面彈出后,才開始真正安裝。在安裝過程中,選擇自定義
可以自行選擇安裝路徑,剩下沒什么好說的,安裝成功之后,在命令行中輸入nvcc -V
可返回版本呢信息。
>nvcc -V nvcc: NVIDIA (R) Cuda compiler driver Copyright (c) 2005-2023 NVIDIA Corporation Built on Wed_Feb__8_05:53:42_Coordinated_Universal_Time_2023 Cuda compilation tools, release 12.1, V12.1.66 Build cuda_12.1.r12.1/compiler.32415258_0
cuDNN
在安裝時需要注冊,下載完成后將壓縮包中的三個文件夾解壓到Cuda安裝目錄中,然后就能用了。
新建項目
安裝成功之后,打開VS2022,就可以看到CUDA12.1
的項目模板,點進去之后就能創(chuàng)建CUDA
程序了
CUDA
,或者說GPU的編程邏輯是,先將內(nèi)存中的數(shù)組寫入到顯存中,然后再執(zhí)行操作。
其自帶的模板程序非常簡單,就是對兩個數(shù)組進行并行求和,用到的是一個自定義函數(shù)
__global__ void addKernel(int *c, const int *a, const int *b) { int i = threadIdx.x; c[i] = a[i] + b[i]; }
但在具體調(diào)用時,用到了<<<>>>
這個語法,表示GPU調(diào)用的線程塊,示例程序在調(diào)用自定義函數(shù)addKernel
時,用到了下面的代碼,表示調(diào)用1個線程塊,每個線程塊中有5個線程。
//size=5 addKernel<<<1, size>>>(dev_c, dev_a, dev_b);
到此這篇關(guān)于VS2022 CUDA環(huán)境配置的實現(xiàn)步驟的文章就介紹到這了,更多相關(guān)VS2022 CUDA環(huán)境配置內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
仿現(xiàn)代C++智能指針實現(xiàn)引用計數(shù)
這篇文章主要為大家詳細介紹了如何仿現(xiàn)代C++智能指針實現(xiàn)引用計數(shù),文中的示例代碼講解詳細,具有一定的借鑒價值,有需要的小伙伴可以了解下2024-03-03Opencv下載和導入Visual studio2022的實現(xiàn)步驟
本文主要介紹了Opencv下載和導入Visual studio2022的實現(xiàn)步驟,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2022-05-05基于matlab對比度和結(jié)構(gòu)提取的多模態(tài)解剖圖像融合實現(xiàn)
這篇文章主要介紹了多模態(tài)醫(yī)學圖像配準與融合的概念、方法及意義,最后簡單介紹了小波變換分析方法。感興趣的小伙伴可以跟隨小編一起學習一下2021-11-11