凭借卓越性能表现与先天开源优势,DeepSeek正迅速成为全球扩展大模型应用实践的一大“圆心”。作为英特尔在GPU领域的重要布局,英特尔锐炫#8482;显卡既是游戏党与视频生产力工作者的新欢,也可用作计算卡,对DeepSeek提供加速支持,为企业用户部署相关AI应用提供一条全新的高价性比实现路径。具体来说,就是与英特尔#174; 至强#174; 可扩展处理器或英特尔#174; 至强#174; W处理器搭配,以多卡配置的型态来运行和加速DeepSeek推理任务。
本文将在DeepSeek-R1- Distill-Qwen-32B推理场景下,以面向企业级应用且成本最低可控制在5-6万元人民币的4 路英特尔锐炫#8482; A770显卡 + 至强#174; W处理器的解决方案为例,详细阐述搭建硬件环境、配置驱动与软件、优化参数设置等步骤,手把手教大家部署和配置这一方案。
1. 软硬件安装配置与初始化
1.1 硬件安装配置
硬件配置
处理器:英特尔#174; 至强#174; W 处理器
内存:8 x 32GB DDR5-3200
存储:2TB M.2 固态盘
电源:≥2000瓦
GPU:4 x英特尔锐炫#8482; A770显卡
BIOS:设置Re-Size BAR Support为
图. 安装4路英特尔锐炫#8482; A770显卡的AI工作站
1.2 软件安装配置
软件配置
操作系统:Ubuntu22.04.1 LTS
内核:6.5.0 - 35 - general
驱动程序:23.43.27642.67
vLLM Serving:intelanalytics/ipex-llm-serving-xpu:b11
grep 56a0
18:00.0 VGA compatible controller: Intel Corporation Device 56a0
36:00.0 VGA compatible controller: Intel Corporation Device 56a0
54:00.0 VGA compatible controller: Intel Corporation Device 56a0
cc:00.0 VGA compatible controller: Intel Corporation Device 56a0
~$ sudo apt update
~$ sudo apt-get install -y linux-image-6.5.0-35-generic linux-headers-6.5.0-35-generic linux-modules-6.5.0-35-generic linux-modules-extra-6.5.0-35-generic
~$ sudo apt install intel-i915-dkms
~$ sudo vim /etc/default/grub
GRUB_DEFAULT="Advanced options for Ubuntugt;Ubuntu, with Linux 6.5.0-35-generic"
~$ sudo update-grub
~$ sudo reboot
~$ sudo apt install -y intel-opencl-icd intel-level-zero-gpu level-zero intel-media-va-driver-non-free libmfx1 libmfxgen1 libvpl2 libegl-mesa0 libegl1-mesa libegl1-mesa-dev libgbm1 libgl1-mesa-dev libgl1-mesa-dri libglapi-mesa libgles2-mesa-dev libglx-mesa0 libigdgmm12 libxatracker2 mesa-va-drivers mesa-vdpau-drivers mesa-vulkan-drivers va-driver-all vainfo hwinfo clinfo
~$ sudo gpasswd -a $ render
~$ sudo newgrp render
grep "Driver Version"
Driver Version 23.43.27642.67
1.3 在英特尔#174; 至强#174; W平台上设置GPU的HDMI显示
~$ sudo vim /etc/modprobe.d/blacklist.conf
~$ sudo update-initramfs -u
~$ sudo vim /etc/gdm3/custom.conf
)# sudo update-initramfs -u
~$ sudo reboot
1.4 监控工具xpu-smi安装
~$ sudo apt install ./xpu-smi_1.2.27_20240103.051106.5eeb3f13.u22.04_amd64.deb
~$ xpu-smi discovery
2.1容器安装及服务设置
~$ apt-get install linux-tools-6.5.0-35-generic linux-cloud-tools-6.5.0-35-generic
# Query max turbo frequency, like W3445, Max Turbo Frequency is 4.8GHz:
~$ sudo cpupower frequency-set -d 4.8GHz
~$ sudo xpu-smi config -d 0 -t 0 --frequencyrange 2400,2400
~$ sudo xpu-smi config -d 1 -t 0 --frequencyrange 2400,2400
~$ sudo xpu-smi config -d 2 -t 0 --frequencyrange 2400,2400
~$ sudo xpu-smi config -d 3 -t 0 --frequencyrange 2400,2400
2.2 安装并启动vLLM服务
~$ docker pull intelanalytics/ipex-llm-serving-xpu:2.2.0-b11
~$ sudo bash backend-ipex-docker.sh
~$ docker exec -it ipex-llm-b11 bash
~$ cd workspace amp; bash vllm-deepseek-r1-distill-qwen-32b-openaikey.sh
2.3 使用Chatbox AI进行性能测试
Usergt; ssh -L 8001:localhost:8001 worker192.168.10.110
创新不止步:全新24GB锐炫#8482; 显卡与满血版DeepSeek R1方案正在路上
本部署指南虽然是围绕4路英特尔锐炫#8482; A770显卡的方案展开,且以DeepSeek-R1-Distill-Qwen-32B版为例,但我们的实践探索并未局限于此。
一方面,该解决方案可对DeepSeek各个蒸馏版提供同样灵活的支持。使用者可通过调整输入模型名称,以及设定并行使用的显卡数量来进行调整。
另一方面,多路英特尔锐炫#8482;显卡 + 英特尔#174; 至强#174; 可扩展处理器 /至强#174; W处理器方案的关键目标,还是锁定在DeepSeek- R1-671B这一性能巅峰版本上,其配置与优化方法很快就会与大家见面。预计其技术路径会同时覆盖基于KTransformer,能更充分发挥至强#174; 处理器内置AI加速技术AMX潜能的方案,以及GPU配置密度更高的单机16路英特尔锐炫#8482; 显卡的方案。
另一个值得期待的进展,就是专为生产力应用打造的新一代英特尔锐炫#8482; 显卡 B580 24G显存版本也正向我们走来,其4张卡即可提供96GB的显存容量,意味着用户可在单机中更轻松地部署更大参数量的DeepSeek服务,进而能在实战中以较低的成本和较为便捷的部署方式,开启不缩水的DeepSeek服务。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。
一、前言:新KB5041587补丁到底可以提升多少游戏性能!Zen5可以说是AMD多年来底层架构变化最大的处理器。根据AMD的说法,在制程工艺不变的情况,IPC提升幅度接近20%,游戏帧率也有10%左右的提升。不过等到锐龙9000处理器正式...
继广州车展正式上市后,红旗金葵花国雅的区域上市陆续进行,这次来到了北京。早在今年4月的北京车展上,红旗汽车发布了全新品牌——金葵花,并带来四款“国字号”产品:国礼、国雅、国耀、国悦,其中作为国产顶尖大型豪华轿车的金葵花国雅备受瞩目。随后在1...
一、前言:花10万块买一台手机值吗?在这篇评测接近完稿的时候,我瞅了一眼华为官网的预约人数,已经超过了685万人。早先供应链多个渠道透露,华为MateXT非凡大师的备货量大约为100万台(首批)。这也意味着,9月20日10:08分正式开售之...
一、前言:机械硬盘在电脑中还有位置吗?如今的笔记本几乎全部默认预装SSD,大多数人装机也首选SSD,但对于有着大容量数据、稳健存储需求的用户而言,一块大容量机械硬盘仍是第一选择,毕竟其单位容量的成本远低于SSD。如今的SSD主流容量才1-2...
一、前言:能效为王的酷睿Ultra200V系列处理器ARM平台的功耗远低于X86平台,ARM处理器笔记本(比如MacBookAir)的续航远高于X86+Windows笔记本!在我们看来,这些似乎就是理所当然、天经地义的事情,毕竟几十来年一直...
一、前言:性能全面领先的国产企业级PCIe5.0SSD一年前,我们曾测试过忆恒创源PBlaze779406.4TB,它是当时最强的企业级PCIe5.0SSD,不仅率先实现了10GB/s的顺序写性能,高达14GB/s的顺序读取速度也几乎完全榨...