DeepSeek R1的NPU優(yōu)化版本將可在Copilot+ Win11 PC上運(yùn)行

人工智能正加速向著邊緣計(jì)算領(lǐng)域發(fā)展,Copilot+ PC 在其中扮演著重要角色。隨著 DeepSeek R1 出現(xiàn),微軟也意識(shí)到了這一模型可能會(huì)帶來(lái)了一系列變革。
微軟今日發(fā)文,宣布推出針對(duì) NPU 優(yōu)化的 DeepSeek-R1(我們注:已在 Azure AI Foundry 和 GitHub 上提供),首批將面向搭載高通驍龍 X 芯片的 Copilot+ PC 推出,隨后是英特爾酷睿 Ultra 200V 等平臺(tái)。
微軟表示,首個(gè)版本 DeepSeek-R1-Distill-Qwen-1.5B 將在 AI Toolkit 中提供,7B 和 14B 版本也將很快推出,從而幫助開(kāi)發(fā)者充分利用 Copilot+ PC 中強(qiáng)大的 NPU 配置。
微軟表示,Copilot+ PC 上的 NPU 開(kāi)啟了一種新的范式。在這種范式下,生成式 AI 不僅可以在被調(diào)用時(shí)執(zhí)行,還可以支持半連續(xù)運(yùn)行的服務(wù)。這使開(kāi)發(fā)者能夠利用 AI 推理引擎來(lái)構(gòu)建主動(dòng)和持續(xù)的體驗(yàn)。微軟表示:
通過(guò)我們?cè)?Phi Silica 上的工作,我們實(shí)現(xiàn)了高效的推理 —— 在首次生成 token 的時(shí)間和吞吐率方面表現(xiàn)出色,同時(shí)對(duì)電池續(xù)航和 PC 資源消耗的影響降至最低。針對(duì) NPU 優(yōu)化的 DeepSeek 模型借鑒了該項(xiàng)目的多項(xiàng)關(guān)鍵經(jīng)驗(yàn)和技術(shù),包括如何分離模型的各個(gè)部分以實(shí)現(xiàn)性能與效率的最佳平衡、低比特率量化以及將 Transformer 映射到 NPU。此外,我們還利用 Windows Copilot Runtime(WCR)通過(guò) ONNX QDQ 格式在多樣化的 Windows 生態(tài)系統(tǒng)中實(shí)現(xiàn)擴(kuò)展。
微軟表示,要想在 Copilot+ PC 上體驗(yàn) DeepSeek 只需下載 AI Toolkit VS Code 擴(kuò)展即可;以 ONNX QDQ 格式優(yōu)化的 DeepSeek 模型將很快出現(xiàn)在 AI Toolkit 的模型目錄中(直接從 Azure AI Foundry 中拉?。?。
用戶可以通過(guò)點(diǎn)擊“下載”按鈕將其下載到本地。下載完成后,只需打開(kāi) Playground 加載“deepseek_r1_1_5”模型,并給出提示詞即可開(kāi)始實(shí)驗(yàn)。
除了為 Copilot+ PC 優(yōu)化的 ONNX 模型外,您還可以通過(guò)點(diǎn)擊“DeepSeek R1”下的“Try in Playground”按鈕,在 Azure Foundry 中嘗試云托管的源模型。
如下圖所示,微軟還展示了原始模型和量化模型的示例,以展現(xiàn)兩者之間微小但確實(shí)存在的差異:
▲ 相同提示下原始模型(左)與 NPU 優(yōu)化模型(右)的響應(yīng)示例,包括模型的推理能力
相關(guān)文章
Win11 226x1.4830可選更新KB5050092發(fā)布:超實(shí)用功能回歸
微軟為Win11 23H2用戶發(fā)布了KB5050092可選更新,本次更新的適用平臺(tái)為英特爾/AMD,大小為780.2MB,適用于驍龍平臺(tái)的更新大小為907.6MB,詳細(xì)更新內(nèi)容如下2025-01-30Win11 Canary 27783預(yù)覽版今日推送:附完整更新日志
微軟今天發(fā)布 Win11 Canary 27783 預(yù)覽版更新,這個(gè)版本支持文件資源管理器主頁(yè)中的共享內(nèi)容,修復(fù)輸入法切窗口從中文換到英文的問(wèn)題,詳細(xì)請(qǐng)看下文介紹2025-01-30暫無(wú)解決辦法! 微軟承認(rèn)Win11/10 2025 年 1 月更新導(dǎo)致 DAC 音頻故障
微軟官方確認(rèn)了一個(gè)新的錯(cuò)誤,該錯(cuò)誤會(huì)影響使用USB DAC(數(shù)模轉(zhuǎn)換器)的用戶,導(dǎo)致音頻設(shè)備停止工作2025-01-29微軟砍刀部又出動(dòng)了! Win11 Dev Home 應(yīng)用被曝將于 5 月下線
近日,有用戶發(fā)現(xiàn) Dev Home 的代碼中出現(xiàn)了停止服務(wù)的消息,確認(rèn)該應(yīng)用將于2025年5月下線,詳細(xì)如下2025-01-29Win11 24H2 可選更新KB5050094發(fā)布:附預(yù)覽版26100.3037更新內(nèi)容匯總
KB5050094 是微軟于 2025 年 1 月 28 日為 Windows 11 24H2 推出的可選更新,安裝后,系統(tǒng)版本將升級(jí)到了 Windows 11 Build 26100.3037,下面我們就來(lái)看看更新內(nèi)容2025-01-29Win11新功能同步iPhone: 已支持在開(kāi)始菜單顯示 iPhone 信息
微軟宣布了一項(xiàng)名為Phone Link for iOS on Windows 11的新預(yù)覽版功能,這項(xiàng)功能允許iPhone用戶在Windows 11電腦上同步手機(jī)內(nèi)容,詳細(xì)請(qǐng)看下文介紹2025-01-29Win11 Dev 26120.3000預(yù)覽版發(fā)布:附KB5050103完整更新日志
微軟近日向Dev頻道用戶推送了Windows 11 Insider Preview Build 26120.3000(KB5050103)版本更新,其中最引人注目的是全新的電池圖標(biāo)設(shè)計(jì),詳細(xì)內(nèi)容如下文介紹2025-01-26Win11 Beta 22635.4805預(yù)覽版發(fā)布:附KB5050105完整更新日志
微軟向Beta頻道的Windows預(yù)覽體驗(yàn)成員推送了最新的Win11 Build 22635.4805(KB5050105)更新,此次更新主要針對(duì)貼靠布局功能進(jìn)行了優(yōu)化,詳細(xì)請(qǐng)看下文介紹2025-01-26Win11 24H2 KB5050009更新致硬件故障:藍(lán)牙耳機(jī)等無(wú)法正常工作
微軟發(fā)布的Win11更新KB5050009引發(fā)了廣泛的用戶反饋,許多人在安裝后遇到了藍(lán)牙耳機(jī)、攝像頭和USB DAC耳機(jī)等設(shè)備的故障,本文附解決辦法2025-01-26Win11Hyper-V虛擬機(jī)設(shè)置vGPU顯卡直通 徹底釋放GPU性能
Windows自帶的Hyper-V虛擬機(jī)免費(fèi),而且它與Windows宿主機(jī)配合,怎么安裝Hyper-V虛擬機(jī)并設(shè)置vGPU顯卡直通呢?詳細(xì)請(qǐng)看下文介紹2025-01-24