国产海光服务器 + 双 A6000 安装 NVIDIA 驱动 解决 DP 黑屏问题(Ubuntu 22.04)

张开发
2026/6/12 1:48:39 15 分钟阅读
国产海光服务器 + 双 A6000 安装 NVIDIA 驱动  解决 DP 黑屏问题(Ubuntu 22.04)
【踩坑实录】国产海光服务器 双 A6000 安装 NVIDIA 驱动 解决 DP 黑屏问题Ubuntu 22.04国产服务器珑京 LG 5213T-HA / 海光 CPU / 百敖 BIOS装完 NVIDIA 驱动后DP 显示器黑屏本文记录完整的排查过程和解决方案。 环境信息项目规格机型珑京 LG 5213T-HACPU2× 海光 738032核2.2GHz内存512GB DDR4硬盘2TB SSD 8TB SATA显卡NVIDIA RTX A6000 × 248GB × 2显示器Lenovo L32p-30DP 接口系统Ubuntu 22.04 LTSBIOS百敖 ByoCore国产 BIOSBMC 芯片ASPEED BMC 2500一、安装 NVIDIA 驱动1.1 确认 GPU 被系统识别lspci|grep-invidia输出如下说明两张卡都正常识别31:00.0 VGA compatible controller: NVIDIA Corporation GA102GL [RTX A6000] (rev a1) 61:00.0 VGA compatible controller: NVIDIA Corporation GA102GL [RTX A6000] (rev a1)1.2 清除旧驱动残留sudoaptpurge nvidia-*-ysudoaptautoremove-y1.3 ⚠️ 先装 SSH先装 SSH先装 SSH重要的事情说三遍。装完显卡驱动重启后有可能黑屏如果没有 SSH 就只能抱着主机哭了。sudoaptinstallopenssh-server-ysudosystemctlenablesshipaddr# 记下服务器 IP后面救命用1.4 添加驱动 PPA 并查看推荐版本sudoadd-apt-repository ppa:graphics-drivers/ppa-ysudoaptupdate ubuntu-drivers devicesubuntu-drivers devices会列出所有可用驱动版本找带recommended标记的那个。我这里推荐的是nvidia-driver-580。1.5 安装驱动并重启sudoaptinstallnvidia-driver-580-ysudoreboot 如果系统开启了 Secure Boot安装过程中会提示设置 MOK 密码重启时在蓝色界面选 “Enroll MOK” 并输入密码。建议直接在 BIOS 中关闭 Secure Boot省事。1.6 验证安装nvidia-smi看到类似输出就说明成功了----------------------------------------------------------------------------------------- | NVIDIA-SMI 580.126.09 Driver Version: 580.126.09 CUDA Version: 13.0 | --------------------------------------------------------------------------------------- | GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC | || | 0 NVIDIA RTX A6000 Off | 00000000:31:00.0 Off | Off | | 1 NVIDIA RTX A6000 Off | 00000000:61:00.0 Off | Off | ---------------------------------------------------------------------------------------两张 A6000 都在驱动安装完成 ✅二、踩坑DP 显示器黑屏驱动装好了nvidia-smi也正常但是——把显示器从 VGA 换成 DP 接到显卡上黑屏无信号。2.1 现象描述✅ VGA 线接主板 → 正常显示走 ASPEED BMC❌ DP 线接显卡 → 黑屏无信号✅nvidia-smi两张卡都正常✅ BIOS 中 Secure Boot 已关闭进 BIOS百敖 ByoCore查看显示配置外插显卡未安装但 Linux 下明明识别到了板载显卡ASPEED BMC 25002.2 排查过程通过另一台电脑 SSH 到服务器进行排查sshxzz192.168.104.181查看 Xorg 日志journalctl --no-pager-b|grepgdm-x-session|grep-iEscreen|connected|output|GPU|ASPEED|using关键输出modeset(0): Using hsync ranges from config file ← ASPEED 的 modesetting 驱动占了 Screen 0 NVIDIA(GPU-0): Lenovo Group Limited L32p-30 (DFP-4): connected ← NVIDIA 检测到了显示器检查 ast 模块lsmod|grep-iastast 114688 1 ← ASPEED 驱动已加载正在使用中2.3 根因定位这台服务器主板集成了ASPEED BMC 2500显示控制器对应的内核驱动是ast。系统启动时的加载顺序内核启动 → ast 模块加载ASPEED BMC→ 注册为主显示设备Screen 0 → nvidia 模块加载 → 检测到 DP 显示器 → 但 Screen 0 已被占用 → Xorg/GDM 把桌面渲染到 Screen 0ASPEED/VGA → DP 口黑屏 ❌一句话总结ast驱动抢先注册为主显示设备桌面画面全输出到 VGA 口了DP 口虽然被 NVIDIA 检测到但没有画面。三、解决方案禁用 ast 驱动思路很简单把ast驱动拉黑让 NVIDIA 成为唯一的显示设备。3.1 SSH 进服务器执行# 将 ast 驱动加入黑名单echoblacklist ast|sudotee/etc/modprobe.d/blacklist-ast.conf# 重新生成 initramfs让黑名单在启动时生效sudoupdate-initramfs-u# 重启sudoreboot3.2 重启后DP 线插到 GPU 0机箱靠上的显卡插槽对应的 DP 口正常显示桌面 ✅四、注意事项禁用ast后 VGA 口不再输出画面但不影响 BMC/IPMI 的远程管理功能带外管理走网络不依赖ast显示驱动DP 线要插显卡不要插主板。海光 7380 没有核显主板上的视频接口是 BMC 的百敖 BIOS 显示外插显卡未安装是正常的不影响 Linux 下的驱动识别和使用如果以后需要恢复 VGA 输出比如 DP 线坏了需要应急sudorm/etc/modprobe.d/blacklist-ast.confsudoupdate-initramfs-usudoreboot后续安装 CUDA Toolkitsudoaptinstallnvidia-cuda-toolkit总结问题原因解决装完驱动 DP 黑屏ASPEED BMC 的ast驱动抢占了主显示设备blacklist ast 重建 initramfsBIOS 显示外插显卡未安装百敖 ByoCore BIOS 的显示问题不影响实际使用无需处理Secure Boot 导致驱动加载失败驱动签名未通过验证BIOS 中关闭 Secure Boot希望这篇文章能帮到同样使用国产服务器 NVIDIA 显卡的朋友少走弯路 环境珑京 LG 5213T-HA / 海光 7380 / RTX A6000 × 2 / Ubuntu 22.04 / NVIDIA Driver 580 / 百敖 ByoCore BIOS

更多文章