使用LibTorch進行C++調用pytorch模型方式

更新時間：2022年12月17日 16:49:00 作者：sq_damowang

這篇文章主要介紹了使用LibTorch進行C++調用pytorch模型方式，具有很好的參考價值，希望對大家有所幫助。如有錯誤或未考慮完全的地方，望不吝賜教

環(huán)境

PyTorch1.6.0
cuda10.2
opencv4.4.0
VS2017

具體過程

下載LibTorch

去PyTorch官網(wǎng)下載LibTorch包，選擇對應的版本，這里我選擇Stable(1.6.0)，Windows，LibTorch，C++/JAVA，10.2，然后我選擇release版本下載，如下圖

下載完后先不用管它，之后再用

用pytorch生成模型文件

我先創(chuàng)建了一個python文件，加載resnet50預訓練模型，用來生成模型文件，代碼如下

import torch
import torchvision.models as models
from PIL import Image
import numpy as np
from torchvision import transforms

model_resnet = models.resnet50(pretrained=True).cuda()

# model_resnet.load_state_dict(torch.load("resnet_Epoch_4_Top1_99.75845336914062.pkl"))
model_resnet.eval()
# 自己選擇任意一張圖片，并將它的路徑寫在open方法里，用來讀取圖像，我這里路徑就是‘111.jpg'了
image = Image.open("111.jpg").convert('RGB')

tf = transforms.Compose([
        transforms.Resize((224, 224)),
        transforms.ToTensor(),
        # transforms.Normalize(mean=[0.5]*3, std=[0.5]*3)
])

img = tf(image)
img = img.unsqueeze(dim=0)
print(img.shape)
input = torch.rand(1, 3, 224, 224).cuda()

traced_script_module_resnet = torch.jit.trace(model_resnet, input)

output = traced_script_module_resnet(img.cuda())
print(output.shape)
pred = torch.argmax(output, dim=1)
print(pred)
traced_script_module_resnet.save("model_resnet_jit_cuda.pt")

最后可以生成一個model_resnet_jit_cuda.pt文件，產(chǎn)生的輸出如下所示

第一行是我們讀取圖像的shape，我們讀取圖片之后經(jīng)過各種resize，增加維度，把圖片數(shù)據(jù)的shape修改成模型接受的格式，可以看到預測的結果是921，之后我們將用到生成的model_resnet_jit_cuda.pt文件。

VS創(chuàng)建工程并進行環(huán)境配置

我在這個python文件路徑下創(chuàng)建了這個vs工程Project1

創(chuàng)建完成之后我們打開Project1文件夾，里面內(nèi)容如下

現(xiàn)在創(chuàng)建VS工程先告一段落，開始進行工程環(huán)境配置。把之前下載的LibTorch，解壓到當前目錄，解壓后會出現(xiàn)一個libtorch的文件夾，文件夾目錄里的內(nèi)容為

這里將我框選的文件夾路徑配置到工程屬性當中，打開剛才新建的VS工程，選擇項目為relaese的×64版本

然后點擊項目->Project1屬性，彈出屬性頁

在屬性頁同樣注意是release的×64平臺，點擊VC++目錄，在包含目錄下加載我之前框出來的include文件夾路徑，在庫目錄下加載框出來的lib文件夾路徑，同時，我們也要用到opencv，所以也需要在包含目錄下加載opencv的include文件夾與opencv2文件夾，在庫目錄下加載opencv\build\x64\vc14\lib，如下圖

然后在屬性頁的鏈接器->輸入，添加附加依賴項，首先先把opencv的依賴項添加了

opencv_world440.lib，（如果一直用的Debug模式，就添加opencv_world440d.lib)，然后將libtorch/lib里所有后綴為.lib的文件全添加進來，打開這個文件夾

全都寫進去，再點擊確定，如下圖所示

然后點擊鏈接器->命令行，加上/INCLUDE:?warp_size@cuda@at@@YAHXZ 這一句，加上這一句是因為我們要用cuda版本的，如果是cpu版本可以不加。

最后點擊C/C++ ->常規(guī)的SDL檢查，設置為否

點擊C/C++ ->語言的符合模式，設置為否

到此我們的配置就全部結束了！最后！復制libtorch/lib文件夾下所有文件，粘貼到工程文件夾Project1/×64/release文件夾里（點擊此處的Project1文件夾可以發(fā)現(xiàn)里面也有一個×64/release，之前我也糾結是放在哪，然后我都試了一下，發(fā)現(xiàn)這個里面是可以不放的）

運行VS2017工程文件

然后我運行VS工程下一個空的main文件，沒有報錯，配置大致是沒問題的，最后添加完整代碼，如下

#include <torch/script.h> // One-stop header.
#include <opencv2/opencv.hpp>
#include <iostream>
#include <memory>

//https://pytorch.org/tutorials/advanced/cpp_export.html

std::string image_path = "../../111.jpg";

int main(int argc, const char* argv[]) {

	// Deserialize the ScriptModule from a file using torch::jit::load().
	//std::shared_ptr<torch::jit::script::Module> module = torch::jit::load("../../model_resnet_jit.pt");
	using torch::jit::script::Module;
	Module module = torch::jit::load("../../model_resnet_jit_cuda.pt");
	module.to(at::kCUDA);

	//assert(module != nullptr);
	//std::cout << "ok\n";

	//輸入圖像
	auto image = cv::imread(image_path, cv::ImreadModes::IMREAD_COLOR);
	cv::cvtColor(image, image, cv::COLOR_BGR2RGB);
	cv::Mat image_transfomed;
	cv::resize(image, image_transfomed, cv::Size(224, 224));

	// 轉換為Tensor
	torch::Tensor tensor_image = torch::from_blob(image_transfomed.data,
		{ image_transfomed.rows, image_transfomed.cols,3 }, torch::kByte);
	tensor_image = tensor_image.permute({ 2,0,1 });
	tensor_image = tensor_image.toType(torch::kFloat);
	tensor_image = tensor_image.div(255);
	tensor_image = tensor_image.unsqueeze(0);
	tensor_image = tensor_image.to(at::kCUDA);

	// 網(wǎng)絡前向計算
	at::Tensor output = module.forward({ tensor_image }).toTensor();
	//std::cout << "output:" << output << std::endl;

	auto prediction = output.argmax(1);
	std::cout << "prediction:" << prediction << std::endl;

	int maxk = 3;
	auto top3 = std::get<1>(output.topk(maxk, 1, true, true));

	std::cout << "top3: " << top3 << '\n';

	std::vector<int> res;
	for (auto i = 0; i < maxk; i++) {
		res.push_back(top3[0][i].item().toInt());
	}
	for (auto i : res) {
		std::cout << i << " ";
	}
	std::cout << "\n";

	system("pause");
}

得到最終輸出為921，可以看到和之前的python文件下輸出一致，這里還輸出了它的top前三，分別是921，787，490。

注意到，我的這兩個輸出相同的前提條件是：

1、確定加載的是由對應python文件生成的模型！

2、輸入的圖片是同一張！并且在python下和C++下進行了同樣的轉換，這里我在python下，將它進行了RGB模型的轉換，resize（224， 224），并且將它的每一個元素值除以255.0，轉換到0~1之間（ToTensor（）方法），最后維度轉換為1， 3， 224， 224，在C++中同樣需要將BGR模型轉化為RGB模型，進行圖像縮放至224，224，并且將像素值除以255，將類型轉化為float類型，最后維度同樣轉換為1，3，224，224，再進行網(wǎng)絡前向計算。