С наступлением информационного века технология сжатия изображений оказывает все большее влияние на передачу информации.Цветное изображение с разрешением 500 Вт требует 15 М дискового пространства. Если оно не будет сжато, оно станет огромной нагрузкой для всех веб-сайтов и мобильных приложений.
С 1980-х годов в Китае были введены стандарты сжатия изображений, такие как JPEG, однако с развитием Интернета сегодня сеть ежедневно передает и хранит сотни миллионов изображений, традиционные алгоритмы сжатия уже не могут удовлетворить потребности предприятий. . Чтобы уменьшить потребление ресурсов полосы пропускания, уменьшить нагрузку на хранилище и уменьшить нагрузку на сервер, предприятия начали искать более эффективные алгоритмы сжатия изображений.
Так и должно быть.Как крупнейшая в мире научная конференция, посвященная развитию компьютерного зрения, CVPR совместно с Google, ETH, Twitter, Amazon, Disney Research и Netflix провела конкурс CVPR 2018 Image Compression Challenge (CLIC). ) в этом году. Теперь матч завершен.Tucodec TNGcnn4p компании Tuya Technology занял первое место в MS-SSIM и MOS в этом испытании.
Эта задача основана на четырех аспектах: PSNR, MOS, MS-SSIM и скорости декодирования (самая высокая скорость декодирования среди команд с более высокими баллами). PSNR, MOS, MS-SSIM широко распространены в отрасли.Оценка качества изображения(Оценка качества изображения, IQA).
(ссылка на конкурс http://www.compression.cc/results/)
Группа сжатия изображений Tucodec TNGcnn4p группы сжатия изображений Tuya Technology лидирует в значениях MOS и MS-SSIM и заняла первое место. По показателю PSNR сжатие Tucodec TNG также заняло хорошее второе место.
Значения MOS и MIS-SSIM относятся к субъективному восприятию изображения пользователем., чем выше балл, тем выше степень восстановления изображения и тем меньше информации теряется.
Tucodec TNGcnn4p имеет значительные преимущества в значениях MOS и MS-SSIM.На следующем рисунке показано сравнение с широко используемыми в отрасли BPG, WebP и JPEG2000:
(сжатие TNG и сравнительная таблица BPG, webp, jpeg2000)
Когда MS-SSIM/дБ равно 17, Tucodec TNGcnn4p сохраняет 40% битрейта по сравнению с BPG, 50% битрейта по сравнению с WebP и 75% битрейта по сравнению с JPEG 2000.
В обычном диапазоне кодовых скоростей 0,15-0,8 бит/сек Tucodec TNGcnn4p сохраняет в среднем 19,75 кодовых слов, чем BPG, 27,08 кодовых слов, чем WebP, и 33,28 кодовых слов, чем JPEG2000.
(Экспериментальные результаты Tucodec TNGcnn4p на проверочном и тестовом наборах)
По словам команды сжатия изображений Tuya Technology: алгоритм Tucodec TNGcnn4p представляет собой алгоритм, основанный на сквозном глубоком обучении, В этом алгоритме используется сетевая структура иерархического слияния признаков в сочетании сСпроектируйте всю сеть с новыми методами квантования, оценкой кодовых слов и другими методами.. Чтобы получить лучшее субъективное качество во время обучения, мы используемФункция потерь для взвешенных субъективных и объективных показателей, и использовали крупномасштабное обучение данным на нашей платформе данных, и, наконец, заняли первое место в MOS и MS-SSIM в соревновании.
Полная структура алгоритма TucodecTNGcnn4p включает в себя несколько модулей, таких как кодирование CNN, квантование, обратное квантование, декодер CNN, энтропийное кодирование, оценка кодового слова, оптимизация искажения скорости и так далее.
Группа исследований и разработок по сжатию изображений Tuya Technology состоит из нескольких отечественных врачей, занимающихся компьютерным зрением, кодированием и декодированием изображений и видео, а также глубоким обучением. Команда начала фокусироваться на исследованиях алгоритмов изображения и видео в 2016 году, а в 2017 году стала специализироваться на алгоритмах сжатия в направлении глубокого обучения. Откажитесь от традиционного алгоритма сжатия и используйте сквозной алгоритм глубокого обучения для создания новой платформы кодирования и декодирования изображений. Стремление стать следующим стандартом сжатия изображений и видео.