華為昇騰920b服務(wù)器部署DeepSeek翻車現(xiàn)場(chǎng)演示
最近到禍一臺(tái)HUAWEI Kunpeng 920 5250,先看看配置。之前是部署的訊飛大模型,發(fā)現(xiàn)資源利用率太低了。把5臺(tái)減少到3臺(tái),就出了他
硬件配置信息
基本硬件信息
按照慣例先來(lái)看看配置。一共3塊盤,500G的系統(tǒng)盤,+ 2塊3T固態(tài),后面把固態(tài)硬盤也組合成了邏輯卷
內(nèi)存是1.5T的,比我電腦硬盤都大
[root@localhost ~]# lsblk NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINTS sda 8:0 0 446.6G 0 disk ├─sda1 8:1 0 600M 0 part /boot/efi ├─sda2 8:2 0 1G 0 part /boot └─sda3 8:3 0 445G 0 part ├─openeuler-root 253:0 0 70G 0 lvm / ├─openeuler-swap 253:1 0 4G 0 lvm [SWAP] └─openeuler-home 253:2 0 371G 0 lvm /home nvme1n1 259:0 0 2.9T 0 disk └─nvme1n1p1 259:4 0 2.9T 0 part └─vg_data01-lv_data01 253:3 0 5.8T 0 lvm /data nvme0n1 259:1 0 2.9T 0 disk └─nvme0n1p1 259:3 0 2.9T 0 part └─vg_data01-lv_data01 253:3 0 5.8T 0 lvm /data [root@localhost ~]# df -Th | awk '$2 !~ /overlay/ && $2 !~ /tmpfs/' 文件系統(tǒng) 類型 容量 已用 可用 已用% 掛載點(diǎn) /dev/mapper/openeuler-root ext4 69G 45G 21G 69% / /dev/sda2 ext4 974M 72M 835M 8% /boot /dev/sda1 vfat 599M 5.8M 594M 1% /boot/efi /dev/mapper/openeuler-home ext4 365G 4.6G 342G 2% /home /dev/mapper/vg_data01-lv_data01 ext4 5.8T 4.3T 1.3T 78% /data
[root@localhost ~]# cat /etc/os-release NAME="openEuler" VERSION="22.03 LTS" ID="openEuler" VERSION_ID="22.03" PRETTY_NAME="openEuler 22.03 LTS" ANSI_COLOR="0;31" [root@localhost ~]# uname -a Linux localhost.localdomain 5.10.0-60.18.0.50.oe2203.aarch64 #1 SMP Wed Mar 30 02:43:08 UTC 2022 aarch64 aarch64 aarch64 GNU/Linux [root@localhost ~]# lscpu 架構(gòu): aarch64 CPU 運(yùn)行模式: 64-bit 字節(jié)序: Little Endian CPU: 192 在線 CPU 列表: 0-191 廠商 ID: HiSilicon BIOS Vendor ID: HiSilicon 型號(hào)名稱: Kunpeng-920 BIOS Model name: HUAWEI Kunpeng 920 5250 型號(hào): 0 每個(gè)核的線程數(shù): 1 每個(gè)座的核數(shù): 48 座: 4 步進(jìn): 0x1 Frequency boost: disabled CPU 最大 MHz: 2600.0000 CPU 最小 MHz: 200.0000 BogoMIPS: 200.00 標(biāo)記: fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp cpuid asimdrdm jscvt fcma dcpop asimddp asimdfhm ssbs Caches (sum of all): L1d: 12 MiB (192 instances) L1i: 12 MiB (192 instances) L2: 96 MiB (192 instances) L3: 192 MiB (8 instances) NUMA: NUMA 節(jié)點(diǎn): 8 NUMA 節(jié)點(diǎn)0 CPU: 0-23 NUMA 節(jié)點(diǎn)1 CPU: 24-47 NUMA 節(jié)點(diǎn)2 CPU: 48-71 NUMA 節(jié)點(diǎn)3 CPU: 72-95 NUMA 節(jié)點(diǎn)4 CPU: 96-119 NUMA 節(jié)點(diǎn)5 CPU: 120-143 NUMA 節(jié)點(diǎn)6 CPU: 144-167 NUMA 節(jié)點(diǎn)7 CPU: 168-191 Vulnerabilities: Itlb multihit: Not affected L1tf: Not affected Mds: Not affected Meltdown: Not affected Spec store bypass: Mitigation; Speculative Store Bypass disabled via prctl Spectre v1: Mitigation; __user pointer sanitization Spectre v2: Not affected Srbds: Not affected Tsx async abort: Not affected [root@localhost ~]# free -h total used free shared buff/cache available Mem: 1.5Ti 12Gi 26Gi 20Mi 1.4Ti 1.5Ti Swap: 4.0Gi 12Mi 4.0Gi
NPU/GPU信息
由于沒有部署任何AI、模型,所以空載著
[root@localhost ~]# npu-smi info +------------------------------------------------------------------------------------------------+ | npu-smi 24.1.rc1 Version: 24.1.rc1 | +---------------------------+---------------+----------------------------------------------------+ | NPU Name | Health | Power(W) Temp(C) Hugepages-Usage(page)| | Chip | Bus-Id | AICore(%) Memory-Usage(MB) HBM-Usage(MB) | +===========================+===============+====================================================+ | 0 910B3 | OK | 89.7 35 0 / 0 | | 0 | 0000:C1:00.0 | 0 0 / 0 3159 / 65536 | +===========================+===============+====================================================+ | 1 910B3 | OK | 88.6 38 0 / 0 | | 0 | 0000:C2:00.0 | 0 0 / 0 3159 / 65536 | +===========================+===============+====================================================+ | 2 910B3 | OK | 91.8 36 0 / 0 | | 0 | 0000:81:00.0 | 0 0 / 0 3159 / 65536 | +===========================+===============+====================================================+ | 3 910B3 | OK | 87.2 36 0 / 0 | | 0 | 0000:82:00.0 | 0 0 / 0 3159 / 65536 | +===========================+===============+====================================================+ | 4 910B3 | OK | 88.8 41 0 / 0 | | 0 | 0000:01:00.0 | 0 0 / 0 3159 / 65536 | +===========================+===============+====================================================+ | 5 910B3 | OK | 95.7 44 0 / 0 | | 0 | 0000:02:00.0 | 0 0 / 0 3159 / 65536 | +===========================+===============+====================================================+ | 6 910B3 | OK | 93.5 39 0 / 0 | | 0 | 0000:41:00.0 | 0 0 / 0 3160 / 65536 | +===========================+===============+====================================================+ | 7 910B3 | OK | 89.2 40 0 / 0 | | 0 | 0000:42:00.0 | 0 0 / 0 3160 / 65536 | +===========================+===============+====================================================+ +---------------------------+---------------+----------------------------------------------------+ | NPU Chip | Process id | Process name | Process memory(MB) | +===========================+===============+====================================================+ | No running processes found in NPU 0 | +===========================+===============+====================================================+ | No running processes found in NPU 1 | +===========================+===============+====================================================+ | No running processes found in NPU 2 | +===========================+===============+====================================================+
開始部署DeepSeek
ollama方法
根據(jù)網(wǎng)上資料看,只要用ollama部署就行,后面發(fā)現(xiàn)這個(gè)行不通。因?yàn)閛llama只適配了英偉達(dá)的GPU,像華為的根本就行不通啊,
ollama的安裝腳本也是去下載英偉達(dá)的驅(qū)動(dòng),結(jié)果就是下載失敗,就算下載成功了也不能安裝上去
https://zhuanlan.zhihu.com/p/22081569918
0
最后折騰了很久
使用 nohup ollama run
部署一個(gè)1.5B的試試,發(fā)現(xiàn)可以運(yùn)行了。但是總覺得不對(duì)境?;卮饐?wèn)題太慢了,用時(shí)3分鐘。CPU使用率也是狂飆。NPU是一點(diǎn)沒有使上勁啊
ollama run deepseek-r1:1.5b
容器部署方法
最后決定下載權(quán)重+容器部署。結(jié)果這里就有遇到了坑點(diǎn)
需要用到git lfs 工具 和 華為的鏡像。因?yàn)檫@是ARM服務(wù)器,所有g(shù)it lfs命令也很難找,歐拉的yum源還沒有提供,最后翻來(lái)覆去在github最新的V3.6.1找到了。使用二進(jìn)制命令接安裝腳本既可以實(shí)現(xiàn)。這樣就能通過(guò)git install ,git push 去拉取近1TB的權(quán)重了
https://github.com/git-lfs/git-lfs/releases
再說(shuō)說(shuō)這個(gè)華為的鏡像吧,不得不吐槽。華為這是把鏡像當(dāng)寶貝供著嗎,下載還需要申請(qǐng)權(quán)限,不是一般人還申請(qǐng)不下來(lái)。還好我們這里條件都滿足
晚上提交的申請(qǐng),第二天早上就通過(guò)了
最后參照了好幾個(gè)教程,不是啟動(dòng)失敗,就吃出現(xiàn)權(quán)限拒絕,服了
華為服務(wù)器社區(qū):https://www.hiascend.com/software/modelzoo/models/detail/68457b8a51324310aad9a0f55c3e56e3
天翼云社區(qū): https://www.ctyun.cn/document/10027724/10944583
部署R1模型提示不兼容…
天翼云社區(qū): https://www.ctyun.cn/document/10027724/10944583
部署R1模型提示不兼容…
到此這篇關(guān)于華為昇騰920b服務(wù)器部署DeepSeek翻車現(xiàn)場(chǎng)演示的文章就介紹到這了,更多相關(guān)昇騰920b服務(wù)器部署DeepSeek內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
游戲服務(wù)器開發(fā)的基本體系與服務(wù)器端開發(fā)的一些建議
剛開始時(shí)以為做游戲服務(wù)器和做web差不多,但是經(jīng)過(guò)一段時(shí)間之后,才發(fā)現(xiàn)代碼太多,太亂了,一看代碼都想重構(gòu),都是踩著坑往前走。這里我把一些游戲開發(fā)方面的東西整理一下,希望能對(duì)那些想做游戲服務(wù)器開發(fā)的朋友有所幫助2017-07-07windows系統(tǒng)搭建zookeeper服務(wù)器的教程
這篇文章主要介紹了windows系統(tǒng)搭建zookeeper服務(wù)器的教程,本文圖文并茂給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2019-10-10Nginx服務(wù)器負(fù)載均衡及ssl原理、生成ssl密鑰對(duì)、Nginx配置ssl操作示例
這篇文章通過(guò)大量的實(shí)例總結(jié)了nginx服務(wù)器上負(fù)載均衡的概念、配置、ssl原理、密鑰對(duì)生成以及nginx服務(wù)器上配置ssl的相關(guān)操作實(shí)現(xiàn)方法2018-05-05open3d?通過(guò)vscode+ssh連接遠(yuǎn)程服務(wù)器將可視化界面本地顯示的問(wèn)題
這篇文章主要介紹了open3d通過(guò)vscode+ssh連接遠(yuǎn)程服務(wù)器將可視化界面本地顯示,本文分步驟給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2023-07-07cwRsync 錯(cuò)誤 uid/gid 4294967295 (-1) is impossible to set on
今天在同步文件的時(shí)候,因?yàn)橛昧?.3的新版本,出現(xiàn)了這個(gè)問(wèn)題,cwRsync 錯(cuò)誤 uid/gid 4294967295 (-1) is impossible to set on,后來(lái)參考下面的方法解決了,特分享一下方便需要的朋友2016-08-08win2008 r2 服務(wù)器環(huán)境配置(FTP/ASP/ASP.Net/PHP)
這篇文章主要想介紹websitepanel環(huán)境配置之FTP/ASP/ASP.Net/PHP運(yùn)行環(huán)境的搭建,需要的朋友可以參考下2013-12-12網(wǎng)站https訪問(wèn)是443端口還是433端口
一直以來(lái)都是服務(wù)器防火墻開啟443端口就可以了,https是443還是433,就讓我困惑了一陣子,后來(lái)我搞清楚了,是443,每次加SSL,放行443端口就可以了,大部分時(shí)間沒出什么問(wèn)題2022-10-10rsync同步數(shù)據(jù)時(shí)提示password file must not be&nb
今天服務(wù)器同步數(shù)據(jù)的時(shí)候,突然有個(gè)命令提示這個(gè)錯(cuò)誤,但其它的機(jī)器又正常,很奇怪,不過(guò)通過(guò)下面的命令執(zhí)行以下就可以了,windows與linux操作方法一致2024-06-06Windows10 1903錯(cuò)誤0xc0000135解決方案【推薦】
windows10 1903是2019年Mircosoft推出的最新版windows操作系統(tǒng),但是有很多機(jī)器裝上之后會(huì)存在不支持.net framework的現(xiàn)象,因此在這里,筆者為大家?guī)?lái)了解決該問(wèn)題簡(jiǎn)單好用的方案,需要的朋友可以參考下2019-10-10