Введение в nvidia-smi и общие инструкции | Использование графического процессора

GPU

nvidia-smi

Интерфейс управления системой NVIDIA (nvidia-smi) — это утилита командной строки, основанная на библиотеке управления NVIDIA (NVML), предназначенная для управления и мониторинга устройств NVIDIA GPU.

Просмотр параметров графического процессора

Просмотр работы графического процессора

nvidia-smi
Sun Mar 28 02:40:38 2021
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 418.56       Driver Version: 418.56       CUDA Version: 10.1     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce GTX 108...  On   | 00000000:02:00.0 Off |                  N/A |
| 23%   29C    P8     9W / 250W |    611MiB / 11178MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+
|   1  GeForce GTX 108...  On   | 00000000:03:00.0 Off |                  N/A |
| 23%   30C    P8     9W / 250W |      0MiB / 11178MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+
|   2  GeForce GTX 108...  On   | 00000000:82:00.0 Off |                  N/A |
| 23%   30C    P8     9W / 250W |      0MiB / 11178MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+
|   3  GeForce GTX 108...  On   | 00000000:83:00.0 Off |                  N/A |
| 23%   30C    P8     9W / 250W |      0MiB / 11178MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|    0     33777      C   /usr/bin/python                              601MiB |
+-----------------------------------------------------------------------------+

ЭтоGEFORCE GTX 1080 TiТекущая информация о сервере GPU.

  • Первая строка: версия инструмента командной строки, версия драйвера графического процессора, версия CUDA.
  • Первый столбец: GPU (номер карты GPU, от 0 до 4), Fan (скорость вращения вентилятора, от 0 до 100%).
  • Второй столбец: Name (название видеокарты), Temp (температура, градусы Цельсия)
  • Третий столбец: Perf (статус производительности, P0~P12, наивысшая производительность — P0, самая низкая производительность — P12).
  • Четвертый столбец: Persistence-M (непрерывный режим, по умолчанию выключен, более энергосберегающий, если установлено значение ON, потребление энергии относительно велико, но при запуске нового приложения GPU это займет меньше времени), Pwr :Использование/ Ограничение (потребление энергии)
  • Пятый столбец: Bus-Id (шина графического процессора, домен:шина:устройство.функция)
  • Шестой столбец: Disp.A (инициализирован ли дисплей графического процессора), Memory-Usage (использование видеопамяти).
  • Седьмой столбец: Volatile GPU-Util (плавающее использование GPU).
  • Восьмой столбец: Uncorr.ECC (код исправления ошибок), Compute M. (Режим расчета)
  • Следующая таблица: использование ресурсов каждым процессом GPU

: использование видеопамяти и использование графического процессора — это две разные вещи.Видеокарты состоят из графического процессора и видеопамяти.Взаимосвязь между видеопамятью и графическим процессором можно просто понять как взаимосвязь между памятью и процессором.

Получить информацию об идентификаторе графического процессора

nvidia-smi -L

Слева направо: номер карты графического процессора, модель графического процессора, физический номер UUID графического процессора.

GPU 0: GeForce GTX 1080 Ti (UUID: GPU-5da6e67e-fd5a-88fb-7a0e-109c3284f7bf)
GPU 1: GeForce GTX 1080 Ti (UUID: GPU-ce9189e4-2e58-3a19-4332-cb5c7fac1aa6)
GPU 2: GeForce GTX 1080 Ti (UUID: GPU-242b3020-8e5c-813a-42d9-475766d52f9d)
GPU 3: GeForce GTX 1080 Ti (UUID: GPU-8f3d825f-7246-3daf-eaa1-37845b03aa03)

Отфильтровать информацию о номере карты графического процессора отдельно

nvidia-smi -L | cut -d ' ' -f 2 | cut -c 1

Общие настройки графического процессора

Настройки режима загрузки

Решить проблему медленного запуска и загрузки графического процессора

设置GPU持续模式:Persistence-M
sudo nvidia-smi -pm 1

Назначение узла

Решите проблему неравномерной производительности карты, если это машина с четырьмя картами, используйте только два узла.优先选择0和3, слот для пограничной карты способствует рассеиванию тепла

приложение