1. Сегментация основных и дополнительных изображений кошек на основе PaddleSeg.

1. Введение в PaddleSeg

PaddleSeg — это комплект для разработки сквозной сегментации изображений, разработанный на основе PaddlePaddle, который охватывает большое количество высококачественных моделей сегментации в различных направлениях, таких как высокоточные и облегченные. Благодаря модульной конструкции он предоставляет два метода применения: управление конфигурацией и вызов API, чтобы помочь разработчикам легче завершить весь процесс приложений сегментации изображений от обучения до развертывания.


  • Высокоточная модель: на основе самостоятельно разработанного Baidu обучения Semi-Supervised Label Knowledge Distillation (SSLD) для получения высокоточной магистральной сети в сочетании с передовой технологией сегментации предоставляется более 50 высококачественных моделей предварительного обучения, которые лучше, чем другие реализации с открытым исходным кодом.
  • Модульная конструкция: поддержка более 15 основных сетей сегментации в сочетании с различными компонентами, такими как стратегии улучшения данных, магистральные сети и функции потерь в модульной конструкции, позволяет разработчикам собирать различные конфигурации обучения на основе реальных сценариев приложений для удовлетворения различных требований к производительности и точности.
  • Высокая производительность: поддержка многопроцессорного асинхронного ввода-вывода, параллельного обучения с несколькими картами, оценки и других стратегий ускорения в сочетании с функцией оптимизации памяти базовой платформы Flying Paddle может значительно снизить накладные расходы на обучение разделенной модели, позволяя разработчикам чтобы снизить затраты и повысить эффективность полного обучения сегментации изображений.
2. Производство набора данных

# 解压缩数据集
!mkdir dataset
!tar -xvf data/data50154/images.tar.gz -C dataset/
!tar -xvf data/data50154/annotations.tar.gz -C dataset/
# 删除list.txt文件头
import pandas as pd
import shutil
import os

# ID: 1:37 Class ids
# SPECIES: 1:Cat 2:Dog
# BREED ID: 1-25:Cat 1:12:Dog
# All images with 1st letter as captial are cat images
# images with small first letter are dog images
# ._Abyssinian_100.png

def copyfile(animal, filename):
    # image\label列表
    file_list = []
    image_file = filename + '.jpg'
    label_file = filename + '.png'

    if os.path.exists(os.path.join('dataset/images', image_file)):
        shutil.copy(os.path.join('dataset/images', image_file), os.path.join(f'{animal}/images', image_file))
        shutil.copy(os.path.join('dataset/annotations/trimaps', label_file),
                    os.path.join(f'{animal}/labels', label_file))
        temp = os.path.join('images/', image_file) + ' ' + os.path.join('labels/',label_file) + '\n'
    with open(os.path.join(animal, animal + '.txt'), 'a') as f:

if __name__ == "__main__":

    data = pd.read_csv('dataset/annotations/list.txt', header=None, sep=' ')

    cat = data[data[2] == 1]
    dog = data[data[2] == 2]

    for item in cat[0]:
        copyfile('cat', item)

    for item in dog[0]:
        copyfile('dog', item)

# 删除无用数据
!rm dataset/ -rf

3. Обучите пользовательский набор данных

3.1 Структура файла

├── cat.txt
├── images
│   ├── Abyssinian_100.jpg
│   ├── Abyssinian_101.jpg
│   ├── ...
├── labels
│   ├── Abyssinian_100.png
│   ├── Abyssinian_101.png
│   ├── ...

3.2 содержимое cat.txt:

images/Abyssinian_1.jpg labels/Abyssinian_1.png
images/Abyssinian_10.jpg labels/Abyssinian_10.png
images/Abyssinian_100.jpg labels/Abyssinian_100.png

3. Просмотр данных

%cd ~
from PIL import Image

<PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=450x313 at 0x7F157A098A90>


<PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=500x333 at 0x7F174201AC90>


4. Обработка этикеток

Этикетки отсортированы с 0, данные этого проекта взяты из Oxford-IIIT PetWoohoo.robots.O-type.AC.UK/~v GG/data/afraid…Набор данных Pet, набор данных закодирован с 1, поэтому его необходимо перекодировать. Фон установлен на 0, а изображение установлено на 1.

import pandas as pd
import os
import matplotlib.pyplot as plt
import numpy as np
from PIL import Image

def re_label(filename):
    img = plt.imread(filename) * 255.0
    img_label = np.zeros((img.shape[0], img.shape[1]), np.uint8)
    for i in range(img.shape[0]):
        for j in range(img.shape[1]):
            value = img[i, j]
            if value == 2:
                img_label[i, j] = 1
    label0 = Image.fromarray(np.uint8(img_label))
    label0.save( filename)

data=pd.read_csv("cat/cat.txt", header=None, sep=' ') 
for item in data[1]:
    re_label(os.path.join('cat', item))

2. Предварительная обработка набора данных

import os
from sklearn.model_selection import train_test_split
import pandas as pd

def break_data(target, rate=0.2):
    origin_dataset = pd.read_csv("cat/cat.txt", header=None, sep=' ')  # 加入参数
    train_data, test_data = train_test_split(origin_dataset, test_size=rate)
    train_data,eval_data=train_test_split(train_data, test_size=rate)
    train_filename = os.path.join(target, 'train.txt')
    test_filename = os.path.join(target, 'test.txt')
    eval_filename = os.path.join(target, 'eval.txt')

    train_data.to_csv(train_filename, index=False, sep=' ',  header=None)
    test_data.to_csv(test_filename, index=False, sep=' ', header=None)
    eval_data.to_csv(eval_filename, index=False, sep=' ', header=None)


if __name__ == '__main__':
    break_data(target='cat', rate=0.2)
train_data: 1516
test_data: 475
eval_data: 380
# 查看
!head cat/train.txt
images/Bengal_173.jpg labels/Bengal_173.png
images/Siamese_179.jpg labels/Siamese_179.png
images/British_Shorthair_201.jpg labels/British_Shorthair_201.png
images/Russian_Blue_60.jpg labels/Russian_Blue_60.png
images/British_Shorthair_93.jpg labels/British_Shorthair_93.png
images/British_Shorthair_26.jpg labels/British_Shorthair_26.png
images/British_Shorthair_209.jpg labels/British_Shorthair_209.png
images/British_Shorthair_101.jpg labels/British_Shorthair_101.png
images/British_Shorthair_269.jpg labels/British_Shorthair_269.png
images/Ragdoll_59.jpg labels/Ragdoll_59.png

3. Конфигурация

!cp PaddleSeg/configs/quick_start/bisenet_optic_disc_512x512_1k.yml ~/bisenet_optic_disc_512x512_1k.yml

Измените bisenet_optic_disc_512x512_1k.yml, обратите внимание на следующие моменты:

  • 1. Конфигурация пути набора данных
  • 2.num_classes настройка, фон не учитывается
  • 3.трансформирует настройки
  • 4.установка потери
batch_size: 256
iters: 500

  type: Dataset
  dataset_root: /home/aistudio/cat/
  train_path: /home/aistudio/cat/train.txt
  num_classes: 2
    - type: ResizeStepScaling
      min_scale_factor: 0.5
      max_scale_factor: 2.0
      scale_step_size: 0.25
    - type: RandomPaddingCrop
      crop_size: [224, 224]
    - type: RandomHorizontalFlip
    - type: RandomDistort
      brightness_range: 0.4
      contrast_range: 0.4
      saturation_range: 0.4
    - type: Normalize
  mode: train

  type: Dataset
  dataset_root: /home/aistudio/cat/
  val_path: /home/aistudio/cat/eval.txt
  num_classes: 2
    - type: Normalize
  mode: val

  type: sgd
  momentum: 0.9
  weight_decay: 0.0005

  type: PolynomialDecay
  learning_rate: 0.05
  end_lr: 0
  power: 0.9

    - type: CrossEntropyLoss
  coef: [1]

  type: FCN
    type: HRNet_W18_Small_V1
    align_corners: False
  num_classes: 2
  pretrained: Null

4. Обучение

%cd ~/PaddleSeg/
! python train.py --config  ../bisenet_optic_disc_512x512_1k.yml\
    --do_eval \
    --use_vdl \
    --save_interval 50 \
    --save_dir output
2021-11-03 00:21:10 [INFO]	
------------Environment Information-------------
platform: Linux-4.4.0-150-generic-x86_64-with-debian-stretch-sid
Python: 3.7.4 (default, Aug 13 2019, 20:35:49) [GCC 7.3.0]
Paddle compiled with cuda: True
NVCC: Cuda compilation tools, release 10.1, V10.1.243
cudnn: 7.6
GPUs used: 1
GPU: ['GPU 0: Tesla V100-SXM2-32GB']
GCC: gcc (Ubuntu 7.5.0-3ubuntu1~16.04) 7.5.0
PaddlePaddle: 2.1.2
OpenCV: 4.1.1
2021-11-03 00:21:10 [INFO]	
---------------Config Information---------------
batch_size: 256
iters: 500
  - 1
  - ignore_index: 255
    type: CrossEntropyLoss
  end_lr: 0
  learning_rate: 0.05
  power: 0.9
  type: PolynomialDecay
    align_corners: false
    type: HRNet_W18_Small_V1
  num_classes: 2
  pretrained: null
  type: FCN
  momentum: 0.9
  type: sgd
  weight_decay: 0.0005
  dataset_root: /home/aistudio/cat/
  mode: train
  num_classes: 2
  train_path: /home/aistudio/cat/train.txt
  - max_scale_factor: 2.0
    min_scale_factor: 0.5
    scale_step_size: 0.25
    type: ResizeStepScaling
  - crop_size:
    - 224
    - 224
    type: RandomPaddingCrop
  - type: RandomHorizontalFlip
  - brightness_range: 0.4
    contrast_range: 0.4
    saturation_range: 0.4
    type: RandomDistort
  - type: Normalize
  type: Dataset
  dataset_root: /home/aistudio/cat/
  mode: val
  num_classes: 2
  - type: Normalize
  type: Dataset
  val_path: /home/aistudio/cat/eval.txt
7. Прогноз


  model: model.pdmodel
  params: model.pdiparams
  - type: Normalize
!pip install -e .
from PIL import Image


from PIL import Image


!python deploy/python/infer.py --config output/deploy.yaml  --image_path /home/aistudio/cat/images/Siamese_79.jpg