容器云如果是物理机部署K8S集群的模式,则可以直接使用K8S的GPU虚拟化技术 vCUDA或者cGPU,就可以实现了在容器POD实例中高效稳定运行GPU显示。
GPU直通模式(即GPU Passthrough )则是指将GPU在虚拟化平台透传到客户虚拟机的技术,如下所示:
4. KVM 配置直通模式加载显卡。
(A) 硬件环境准备
确定主板和CPU都支持VT-d技术,即Virtualization Technology for Direct I/O(英特尔虚拟技术),近年的产品应该都支持此技术,在BIOS里开启VT-d支持。 显卡直通需要两块以上显卡,一块主机用,其他的给虚拟机用。
(B) 软件环境准备
安装KVM虚拟化平台,软件包如下:
qemu-kvm -为KVM管理程序提供硬件仿真的软件。
libvirt-daemon-system -用于将libvirt守护程序作为系统服务运行的配置文件。
libvirt-clients -用于管理虚拟化平台的软件。
bridge-utils -一组用于配置以太网桥的命令行工具。
virtinst -一组用于创建虚拟机的命令行工具。
virt-manager -易于使用的GUI界面和支持命令行工具,用于通过libvirt管理虚拟机。
(C) 内核配置支持iommu
在GRUB中配置文件 / etc / default / grub中,配置 GRUB_CMDLINE_LINUX = "intel_iommu=on"
(D) 将显卡从宿主机解绑
在 /etc/modprobe.d/blacklist.conf 将NVIDIA GPU卡禁用 默认驱动 。
(E) 创建虚拟机,在添加PCI设备时,直接选择NVIDIA独立显卡,安装 NVIDIA驱动程序即可。
可以通过GPU Operator来实现 https://docs.nvidia.com/datacenter/cloud-native/contents.html
收起