Супер подробный процесс установки pytorch на сервер Linux

искусственный интеллект PyTorch

основная среда

  1. Во-первых, узнайте версию ядра операционной системы вашего сервера и другую информацию:
    1. Проверьте информацию о версии вашей операционной системы:cat /etc/issueилиcat /etc/lsb-releaseкоманда ожидания

    2. Просмотр информации о видеокарте сервера:

      1. lspci | grep -i nvidiaПросмотрите всю информацию о видеокарте.
      2. nvidia-smiЕсли вы установили соответствующий драйвер видеокарты, вы можете использовать эту команду.
      3. cat /proc/driver/nvidia/versionПроверьте информацию о драйвере установленной видеокарты.

      Установка драйвера видеокарты должна быть выбрана в соответствии с версией операционной системы.

Несколько версий gcc и g++

gccиg++Это компилятор, который необходимо использовать при установке многих драйверов.Во многих случаях из-за несовместимости версии компилятора при установке будет много странных ошибок.По опыту, текущийCUDA 10.1, вы также можете использовать4.8, так что лучше выбрать4.8-5.4Версии между ними лучше и более совместимы. для нескольких версийgccиg++Установка подробно описана:

  1. просмотреть свой собственныйgccиg++Версия:gcc --versionа такжеg++ --version
  2. Процесс установки новых или установки нескольких версий gcc и g++:
    1. sudo add-apt-repository ppa:ubuntu-toolchain-r/testСначала добавьте несколько обновленных репозиториев для легкого обновления.
    2. sudo apt-get updateа такжеsudo apt get updateСделайте необходимые обновления для необходимых пакетов и т. д.
    3. sudo apt-get install gcc-4.9а такжеsudo apt-get install g++-4.9для установки соответствующей версииgccа такжеg++. Обратите внимание, что вам нужно изменить версию самостоятельно.
    4. sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-4.9 20
      sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-4.9 20
      Эти две строки используются для копирования только что установленногоgccиg++Операции, аналогичные регистрации, добавляются в корзину для необязательных операций. То есть посредством этой операции новые регистрации постоянно регистрируются в системе.gccиg++Версия.
    5. update-alternatives --config gcc
      update-alternatives --config g++Используется для выбора версии. После ввода следуйте инструкциям, чтобы завершить выбор. Если разрешения недостаточно, добавьтеsudo.
    6. Как правило, мы можем использовать компилятор версии 4.8-5.4. Если ошибка все еще возникает, предпочтительной операцией должно быть удаление драйвера видеокарты и переустановка драйвера видеокарты. Этот метод имеет самый высокий процент успеха.

Установка драйвера

   Если вам необходимо установить видеокарту, сначала необходимо удалить старую версию драйвера видеокарты:
  sudo apt-get remove --purge nvidia*
   Так же перед установкой нужно отключить одну вещь. модерн.
  sudo vim /etc/modprobe.d/blacklist.conf
  Добавьте в конец файла следующее:

blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off

   Проверьте, прошла ли операция успешно:lsmod | grep nouveauУспех, если не отображается.

  Установка драйвера видеокарты относительно проста, перейдите непосредственно на официальный сайт, чтобы загрузить соответствующий драйвер.нажмите на меня, чтобы скачать


   Обратите внимание, что в загрузке драйвера вы можете напрямую выбрать LInux-xbit для выбора операционной системы.Это можно найти.Если вы выберете ubuntu16, вы не можете найти его. Доступен прямой поиск Pro-test для 64-битной установки Linux!
   Загрузите загруженный драйвер видеокарты на сервер для установки.
  sudo ./NVIDIA-Linux-x86_64-430.34.runИспользуйте эту команду для установки драйвера. После завершения установки вы можете использовать следующую команду для проверки:
  nvidia-smi

Установка CUDA и установка cudnn

  CUDA — это вычислительная платформа для вычислений на GPU. При необходимости установите соответствующую версию cuda.

Здесь следует отметить, что лучше всего выбрать соответствующий драйвер видеокарты при установке драйвера видеокарты.cudaверсия, затем установитеcudaКогда версия одинакова, хотя более старшая версия драйвера может быть совместима с более ранней версиейcuda.

  1. Загрузите соответствующую версию cuda.Нажмите на меня, чтобы загрузить различные версии cuda. Так как вход на этот сайт трудно найти, лучше его оставить.
    Это версия, которую я скачал сам. Загрузите загруженную версию на сервер для установки.
    sudo sh cuda_10.0.130_410.48_linux.runМетод установки может быть Baidu Yiha.
    Опции во время установки:
    1. Драйвер ускоренной графики nvidia, n. Потому что мы уже установили его.
    2. Все остальные выбирают да.
    3. Установление мягкой связи. Обратите внимание, что существует также возможность установить мягкое соединение, которое будет/usr/local/Создайте мягкую ссылку нижеcudaМягкая ссылка подключена к установленному реальномуcuda-10.0адрес г. Установление мягких соединений можно использовать для управления несколькими версиями cuda.
      Как показано, желтыйcudaЭто мягкое соединение, а красные — несколько установленных.CUDAВы можете изменить мягкое соединениеcudaверсия.
      Это после завершения установки. После завершения установки используйте

nvcc -VПроверьте установку.


Если подсказка не находит соответствующую команду, вам необходимо настроить переменные среды. Здесь мы настраиваем его в соответствии с программным подключением cuda, которое предполагается установленным:
sudo vim ~/.bashrcДобавьте следующее:

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda

использовать его позжеnvidia-smi

  1. Многоверсионное управление CUDA. На самом деле это очень просто.Это управление программным соединением.Например,мне нужны другие версии cuda.Поскольку моя переменная соотношения среды прямо указывает на мягкое соединение,я могу удалить старое мягкое соединение и установить новое мягкое соединение.Реализовано переключение между разными версиями cuda.
sudo rm -rf cuda # 删除旧版本的软连接
sudo ln -s /usr/local/cuda-9.1 /usr/local/cuda  # 建立新版本的软连接,前面的路径是需要的版本的cuda的安装路径。
  1. Установите соответствующий cudnn. Выберите соответствующий cudnn в соответствии с версией cuda для установки.нажмите на меня, чтобы скачать
    После входа много красочного.Если использовать метод установки, то нужно скачивать по 3 deb файла для каждой версии операционной системы, что очень напрягает. Поэтому мы напрямую загружаем версию, соответствующую стрелке, а суффикс измененного файла —cudnn-10.0-linux-x64-v7.3.0.29.solitairetheme8Это тожеtgz. Разархивируйте загруженный файл.
cp  cudnn-10.0-linux-x64-v7.3.0.29.solitairetheme8 cudnn-10.0-linux-x64-v7.3.0.29.tgz # 换后缀
tar -xvf cudnn-8.0-linux-x64-v5.1.tgz  # 解压

После декомпрессии вы получаетеcudaпапка. Сделайте следующееcudnnустановка. (В настоящее время cudnn должен быть установлен непосредственно в фактический путь установки соответствующей версии cuda. ​​Таким образом, файл cudnn будет прочитан при установлении мягкого соединения)

sudo cp cuda/include/cudnn.h    /usr/local/cuda-xx.x/include # 填写对应的版本的cuda路径
sudo cp cuda/lib64/libcudnn*    /usr/local/cuda-xx.x/lib64   # 填写对应的版本的cuda路径
sudo chmod a+r /usr/local/cuda-xx.xx/include/cudnn.h   /usr/local/cuda-xx.xx/lib64/libcudnn*

Если вы хотите использовать метод установки deb,видеть

Если описанный выше процесс по-прежнему идет не так, рекомендуется снова удалить драйвер видеокарты.



Понимание и установка Anaconda

Использование Anaconda для управления средой Python — очень эффективное решение. Загрузите соответствующую версию программного обеспечения из репозитория и установите его.нажмите на меня, чтобы скачать.

bash Anaconda3-5.0.1-Linux-x86_64.shУстановить. Процесс установки должен согласиться добавить путь установки в файл конфигурации переменной среды.source ~.bashrcчтобы сделать его эффективным.

  1. Создайте свою собственную новую средуconda create-n your_name python=your_version
  2. Активируйте новую средуsource activate your_name

Установка Питорча

Перейдите на официальный сайт pytorch, чтобы загрузить соответствующую версию pytorch.Официальный сайт

Установите в соответствии с командой производства. Тест после завершения установки:

python  # 进入python 环境
import torch  # 导入安装的pytorch包
torch.cuda.is_available()  # 检查cuda是否可以使用

еслиtorch.cuda.is_available()Если вывод ложный, значит проблема с предыдущим драйвером или установкой cuda, скорее всего драйвер. Простое удаление и переустановка драйвера видеокарты решит проблему.