快捷導(dǎo)航

本地搭建DeepSeek-R1、WebUI的完整過程及訪問

更新時間：2025年02月10日 09:10:33 作者：Stay?Passion

這篇文章主要介紹了本地搭建DeepSeek-R1、WebUI的完整過程及訪問的相關(guān)資料,DeepSeek-R1是一個開源的人工智能平臺,主要用于大語言模型的本地部署和管理,通過Docker和Ollama工具,用戶可以在自己的服務(wù)器上運行DeepSeek-R1,并通過WebUI交互和測試,需要的朋友可以參考下

背景

最近幾年，人工智能技術(shù)的發(fā)展勢頭愈發(fā)強(qiáng)勁。無論是大型語言模型的突破，如美國OpenAI公司開發(fā)的ChatGPT，還是中國諸家企業(yè)在自主學(xué)習(xí)系統(tǒng)領(lǐng)域的快速進(jìn)步，都展現(xiàn)了人工智能技術(shù)的前所未有的潛力和變革力量。這不僅僅是技術(shù)本身的飛速發(fā)展，更是人類對知識邊界與認(rèn)知極限的一次深度探索。從自然語言處理到計算機(jī)視覺，從強(qiáng)化學(xué)習(xí)到生成式AI，技術(shù)創(chuàng)新層出不窮，為人類社會帶來了前所未有的變革。

在這場技術(shù)革命中，我們欣喜地看到AI系統(tǒng)能夠以接近或超越人類水平的能力，完成復(fù)雜的知識推理、多任務(wù)處理以及創(chuàng)造性思考。例如，DeepSeek等中國公司開發(fā)的智能搜索引擎，不僅在信息檢索方面取得了顯著進(jìn)展，還展現(xiàn)出獨特的領(lǐng)域適應(yīng)能力。此外，AI技術(shù)的應(yīng)用已經(jīng)滲透到各個行業(yè)，從醫(yī)療、教育到金融，每一個領(lǐng)域都在經(jīng)歷著前所未有的數(shù)字化與智能化轉(zhuǎn)型。在這個充滿挑戰(zhàn)與機(jī)遇的時代，我們需要以更加開放和包容的心態(tài)，擁抱人工智能帶來的變革，同時也要保持對未知未來的一種敬畏與謹(jǐn)慎。

本文旨在詳細(xì)介紹如何離線搭建DeepSeek-R1，主要為企業(yè)級開發(fā)使用。另外官方線上環(huán)境因火爆的訪問量及持續(xù)遭受每秒上億次的Dos惡意請求，導(dǎo)致訪問體驗感不好的小伙伴也可以進(jìn)行離線搭建使用。

僅需線上體驗的朋友可以直接跳轉(zhuǎn)官網(wǎng)鏈接。

搭建準(zhǔn)備

下載安裝：ollama
下載安裝：docker

基礎(chǔ)概念

Ollama 是一個開源的人工智能平臺，專注于大語言模型（Large Language Model, LLM）的本地部署和管理。它允許開發(fā)者在自己的服務(wù)器上運行多種預(yù)訓(xùn)練語言模型，如 GPT-3 或 ChatGPT，并通過 RESTful API 提供服務(wù)。Ollama 的核心優(yōu)勢在于其高效的本地推理能力，能夠在資源有限的環(huán)境下快速響應(yīng)用戶查詢。如下附上Ollama基礎(chǔ)指令。

#1.啟動ollama服務(wù)
ollama serve
#2.創(chuàng)建模型 (create)；使用 Modelfile 來創(chuàng)建一個新模型。你需要提供一個包含模型信息的 Modelfile。
ollama create /path/to/Modelfile
#3.顯示模型信息 (show)；查看特定模型的詳細(xì)信息，例如模型名稱、版本等。
ollama show model_name
#4.列出所有模型 (list)；列出本地所有可用的模型,可以在這里查找模型名稱。
ollama list
ollama ls
#5.運行模型 (run)；運行一個已安裝的模型，執(zhí)行某些任務(wù)。
ollama run model_name
#6.列出正在運行的模型 (ps)；顯示當(dāng)前正在運行的模型列表。
ollama ps
#7.刪除模型 (rm)；刪除一個已安裝的模型。
ollama rm model_name
#8.查看版本 (version)；顯示當(dāng)前 ollama 工具的版本信息。
ollama -v
ollama --version
#9.復(fù)制模型 (cp)；復(fù)制一個模型到另一個位置或給定名稱的地方。
ollama cp old_model new_model
#10.從注冊表拉取模型 (pull)；從模型注冊表中拉取一個模型，供本地使用。
ollama pull model_name
#11.推送模型到注冊表 (push)；將本地模型推送到模型注冊表中，以便他人或其他系統(tǒng)使用。
ollama push model_name

Docker是一種開源的容器化平臺，用于將軟件及其所有依賴環(huán)境打包到鏡像文件中，以便于在任何環(huán)境下輕松運行。此處使用docker主要用于運行open-webui，以便于更方便的使用DeepSeek-R1。

搭建過程

上述安裝產(chǎn)品安裝成功之后，便可以開始著手搭建DeepSeek-R1。

首先在ollama官網(wǎng)查詢 deepseek 或者 deepseek-r1

如下圖目前存在28個tag，按照我們自身電腦配置選擇對應(yīng)的版本，同時復(fù)制右側(cè)命令。

數(shù)字后面的b代表著算力參數(shù)，隨著參數(shù)增加，訓(xùn)練和 inference 的計算量也顯著增加，但也要選擇和本地硬件相匹配。

配置對照表

MAC用戶打開終端（Windows用戶打開CMD）輸入上述復(fù)制命令

下載結(jié)束且成功之后（出現(xiàn)三個箭頭），則可以進(jìn)行問答。前期下載速度還是蠻快的，后面速度會越來越慢（FQ可有效提高下載速度），可以手動 control c 結(jié)束之后重新運行（會接著進(jìn)行下載）。

下載成功之后可以查詢到下載的模型信息

安裝WebUI

如上小黑框中的交互方式顯然不能滿足我們的要求，我們需要一個友好的交互頁面（如ChatGpt一樣），還可以記錄下我們對話的內(nèi)容。此時引入open web ui。

登錄docker客戶端并點擊terminal輸入如下命令：

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

步驟解釋：

docker run ：使用命令啟動一個新的Docker容器。
-d ：表示運行容器時在后臺，避免終端被占據(jù)。
-p 3000:8080 ：將宿主機(jī)的端口3000映射到容器內(nèi)的端口8080。這樣，外部訪問的請求會被轉(zhuǎn)發(fā)到容器內(nèi)的8080端口，以供WebUI服務(wù)提供響應(yīng)。
--add-host=host.docker.internal:host-gateway ：為Docker容器網(wǎng)絡(luò)配置添加一個宿主名。host.docker.internal 是Docker默認(rèn)配置的一個虛擬IP地址，允許容器訪問主機(jī)網(wǎng)絡(luò)中的其他服務(wù)，如本地服務(wù)器或數(shù)據(jù)庫等。
--name open-webui ：指定容器的名稱為 open-webui，方便在后續(xù)操作中通過名稱管理和停止容器。
ghcr.io/open-webui/open-webui:main ：從GitHub Container Registry（GHCR）拉取鏡像。open-webui:main 表示使用倉庫中的 open-webui 項目的主分支鏡像。如果沒有權(quán)限訪問該鏡像，Docker命令將失敗。
--restart always ：設(shè)置容器重啟策略，當(dāng)容器退出時自動啟動新實例，以確保服務(wù)持續(xù)運行，避免應(yīng)用程序故障導(dǎo)致服務(wù)中斷。
-v open-webui:/app/backend/data ：創(chuàng)建一個匿名卷，將宿主機(jī)的文件夾 open-webui 掛載到容器內(nèi)的路徑 /app/backend/data。這允許容器在運行期間生成或修改數(shù)據(jù)，而這些數(shù)據(jù)會被保存到宿主機(jī)的指定文件夾中，方便后續(xù)管理和持久化。