Перейти к содержанию

Установка NVIDIA драйверов

Ubuntu — apt (рекомендуемый)

# Добавление NVIDIA PPA
sudo add-apt-repository ppa:graphics-drivers/ppa -y
sudo apt update

# Поиск рекомендуемого драйвера
ubuntu-drivers devices

# Установка рекомендуемого драйвера (nvidia-driver-535 или новее)
sudo apt install -y nvidia-driver-535

# Перезагрузка
sudo reboot

Ubuntu — CUDA Toolkit (альтернативный)

# Добавление репозитория NVIDIA CUDA
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt update

# Установка CUDA Toolkit (включает драйвер)
sudo apt install -y cuda-toolkit-12-1 cuda-drivers

# Добавление в PATH
echo 'export PATH=/usr/local/cuda/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc

# Перезагрузка
sudo reboot

RHEL/Rocky

# Добавление репозитория NVIDIA
sudo dnf config-manager --add-repo https://developer.download.nvidia.com/compute/cuda/repos/rhel8/x86_64/cuda-rhel8.repo

# Установка драйвера
sudo dnf module install -y nvidia-driver:latest-dkms

# Или установка с CUDA Toolkit
sudo dnf install -y cuda-toolkit-12-1

# Перезагрузка
sudo reboot

Версии CUDA в Docker-образах

Важно

ML-сервисы threat-detector и content-safety используют базовые образы nvidia/cuda:12.8.1, а translation-servicenvidia/cuda:12.1.1. Для запуска всех GPU-сервисов рекомендуется NVIDIA Driver версии 535+ с поддержкой CUDA 12.x. Установка CUDA Toolkit 12.1 на хосте достаточна — Docker-образы содержат собственные библиотеки CUDA нужных версий.

ML-сервис Базовый образ CUDA PyTorch CUDA wheel
threat-detector nvidia/cuda:12.8.1 cu128
content-safety nvidia/cuda:12.8.1 cu128
translation-service nvidia/cuda:12.1.1 cu121

PyTorch CUDA Wheel Index URLs (для offline-развёртывания):

При сборке Docker-образов в изолированной среде (без доступа к PyPI) загрузите PyTorch wheels заранее:

# Для threat-detector и content-safety (CUDA 12.8):
pip download torch --index-url https://download.pytorch.org/whl/cu128

# Для translation-service (CUDA 12.1):
pip download torch --index-url https://download.pytorch.org/whl/cu121

Проверка установки

# Проверка драйвера
nvidia-smi

# Ожидаемый вывод:
# +-----------------------------------------------------------------------------+
# | NVIDIA-SMI 535.xx.xx    Driver Version: 535.xx.xx    CUDA Version: 12.x     |
# |-------------------------------+----------------------+----------------------+
# | GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
# | Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
# |===============================+======================+======================|
# |   0  NVIDIA GeForce ...  Off  | 00000000:01:00.0 Off |                  N/A |
# |  0%   35C    P8     5W / 320W |      0MiB /  10240MiB |      0%      Default |
# +-------------------------------+----------------------+----------------------+

# Проверка CUDA (если установлен CUDA Toolkit)
nvcc --version