Больше, чем Google против Nvidia: глубокое обучение ведет войну за чипы ИИ

Google глубокое обучение открытый источник дизайн
Больше, чем Google против Nvidia: глубокое обучение ведет войну за чипы ИИ

Эта статья написана [Передовая линия ИИ] Оригинал, исходная ссылка:t.cn/RHUQR7G


Автор|Тан Шань

Редактор | Натали, Эмили

Руководство по передовой ИИ: "В 2017 году чип ИИ стал изюминкой полупроводниковой промышленности и привлек внимание далеко за пределами полупроводникового круга. В этом году от технологических гигантов до стартапов по очереди появлялись новые и старые персонажи, которые устроили для нас прекрасное шоу. Несколько лет спустя, когда мы оглядываемся назад, мы определенно можем считать 2017 год первым годом чипов ИИ. "


Goole vs Nvidia • «Война дислокаций» между гигантами

В начале апреля Google анонсировал документ, который собирался быть опубликован на ISCA2017: «Анализ инвестиций в DataCenterPerformance of Tensor Phanging Building». Можно сказать, что эта «маленькая вещь» представила опередив ежегодной драмы, а далеко идущее его воздействие может даже длиться до многих лет. Фактически, в июне 2016 года Google открыл свой собственный специальный чип AI, используемый в облаке, ТПУ (тензорное устройство). Google - это чип AI. Конечно, это новости, которая привлекает глазные яблоки, но оно не было объявлено, и каждый может только догадываться и ждать. Поэтому эти обычные академические документы получили большое внимание со стороны СМИ. Я также писал статью комментариев в первый раз: «Google TPU Secrets» также является одним из крупнейших статей в моем общественном номере. Конечно, ТПУ очень обеспокоен нашим пищевым дынями, и есть абсолютная линейка NVIDIA в области чипов AI. Эталон TPU разумна в задней части контрольных результатов ТПУ. Еще в 2016 году Google выявляет TPU, NVIDIA неоднократно указывала, что она не имеет угрозы правилам ГПУ в операции AI.

11 мая на конференции Nvidia GTC2017 Мастер Хуанг представил новейший GPU Volta (GV100) на Keynote. Акции Nvidia резко выросли, и СМИ это освещали. Фокус чипа ИИ, кажется, снова на стороне Nvidia.

В дополнение к анонсу тяжеловеса Volta, на GTC также состоялось «небольшое мероприятие», Nvidia объявила об открытии исходного кода своего DeepLearning Accelerator (DLA), официально выпущенного в сентябре. Этот выпуск был упомянут в одном предложении в Keynote Мастера Хуанга, но шок, вызванный отраслью, был немалым. «Почему Nvidia занимается открытым исходным кодом? Что это будет за открытый исходный код? Повлияет ли этот открытый исходный код на перспективы многих стартапов?» Обсуждение этих вопросов продолжалось до тех пор, пока NVDLA не стала действительно открытым исходным кодом.

Вскоре после этого, 17 мая, на конференции Google I/O Google объявила о TPU второго поколения, по словам СМИ, «…украла недавний гром Nvidia Volta GPU…». Хотя для TPU2 было опубликовано не так много подробностей, метрики выглядят хорошо и легко масштабируются. Жалею только о том, что он не продается извне и может использоваться всеми только в виде TPU Cloud.

В конце сентября Джефф Дин, бог программного обеспечения Google, принял участие в HotChip, важной конференции в индустрии микросхем, а также лично представил TPU и TPU2 в Keynote «Последние достижения в области искусственного интеллекта с помощью машинного обучения и их значение для проектирования компьютерных систем». рассматривать их как важную часть новой вычислительной экосистемы.

В конце сентября NVDLA открыла исходный код частей аппаратного кода NVDLA раньше обещанного срока, а также объявила о планах по открытию большего количества аппаратного и программного обеспечения в будущем. После этого все также проводили различные анализы и обсуждения NVDLA, пытаясь в нее поиграть. С текущей точки зрения открытый исходный код NVDLA, похоже, не влияет на финансирование многих стартапов. Мы обсудим эту тему позже. Что касается причины DLA с открытым исходным кодом от Nvidia, официальное заявление состоит в том, чтобы упростить внедрение Inference для большего числа людей и способствовать продвижению ИИ, особенно приложения на многих встроенных устройствах. Но с точки зрения всего процесса открытого исходного кода это решение кажется поспешным. DLA исходит из модуля в самоуправляемой SoC Nvidia, который изначально не был разработан с учетом IP с открытым исходным кодом. Более того, открытый исходный код в сентябре раскрыл только часть аппаратного кода и соответствующую среду проверки, и до того, как его действительно можно будет использовать, еще далеко. Мы не можем сказать, связано ли это решение с открытым исходным кодом с сильным дебютом Google TPU (который имеет большое преимущество в Inference). Но основное предположение заключается в том, что основной интерес Nvidia к глубокому обучению должен заключаться в обучении (в настоящее время графические процессоры по-прежнему являются лучшей платформой для обучения). В его интересах снизить порог логического вывода и охватить больше приложений, особенно пограничных, для дальнейшего повышения спроса на обучение. Более того, программная среда NVDLA по-прежнему использует CUDA/TensorRT от Nvidia, который по-прежнему контролируется Nvidia.

Эта борьба между Google и NVIDIA, который начал с бумаги и пробежал почти весь год 2017 года, может иметь гораздо более влияние на отрасль, чем самих компаний. Причина, по которой я называю это «несоответствующей» войной, заключается в том, что она между традиционным программным гигантом, таким как Google и гигант, как NVIDIA. Если вы переключитесь на Intel VS NVIDIA, кажется нормальным. Участие Google в войне может быть началом новой эры. Мы видим, что не только TPU, но в октябре Google анонсировал свой пользовательский SOC IPU (блок обработки изображений), используемый в телефоне «Google Pixel 2». Как и более и более обычные чипсы Apple, Tech Giants, такие как Google также имеют приложения (знают, что они хотят), технологии (годы накопления связанных технологий), а также ресурсы (без дефицита денег, нет нехватки людей). Преимущества, настройка вашего Собственное оборудование, и даже чипсы станут нормой. В то же время мы также видели, что появился демонстрационный эффект Google TPU, и более технологические гиганты присоединились к соревнованию для AI-ускоренного оборудования. Tesla объявила о собственных пользовательских автономных кишках вождения; Amawei, Microsoft и отечественная летучая мышь, Huawei все предоставляют специализированную поддержку ускорения FPGA в облаке; Говорят, что BUS Five по-прежнему развивает свои собственные чипсы; BAT также создает команду дизайна чипов и т. Д. Хотя конкретная архитектура и реализация всех различны, все они отражают большой интерес к специальному специальному устройству. Я считаю, что эта тенденция станет все более и очевидным в будущем.

В то же время, традиционные чиповые гиганты, конечно же, не будут сидеть сложа руки и смотреть, как на этом огромном рынке доминирует Nvidia или его разделяет Google. Intel последовательно приобрела Nervana (облако), Movidius (конец), Mobileye (автономное вождение), Altera (FPGA) и наняла AMD RajaKudori (GPU) и даже занялась Loihi (nueromorphic). рука; хотя действие не так быстро, как все себе представляли, более поздней силы все же стоит ожидать. AMD тоже пытается наверстать упущенное, ведь у их CPU+GPU есть свои уникальные способности, и вся компания постепенно вышла из корыта. Более того, независимо от того, правдивы или ложны новости о сотрудничестве Tesla и AMD в разработке чипов для автономного вождения, способ компании-производителя чипов вывода возможностей проектирования чипов также является хорошим (или беспомощным) выбором.

«Новая вычислительная модель, представленная Deep Learning, будет определять направление развития будущих чипов», — с этим мнением в основном согласны все. Все больше и больше игроков будут обращать внимание на чипы, способные поддерживать новые типы вычислений, многие из которых раньше могли быть совершенно вне круга полупроводников и не иметь представления о том, что такое чип. В 2017 году мы можем видеть некоторые научно-популярные статьи, время от времени сравнивающие архитектуру ЦП, ГП, ПЛИС и ASIC, и даже объем чтения 10 Вт+, нетрудно увидеть энтузиазм каждого.

Стартапы • Длинный список


В драме 2017 года про ИИ-чипов главные герои не только гиганты, но и стартапы, и их роли ничуть не уступают. Что еще более важно, в «выступлении» начинающих компаний китайские компании не только не боятся сцены, но и очень блестящие. Я веду список AI-чипов на github с августа, включая как продукты крупных компаний, так и стартапы. К декабрю список расширился и насчитывал более 30 стартапов по всему миру. И этот список содержит только общедоступную информацию, и есть много компаний, которые находятся в скрытом состоянии и не включены. Я также слышал поговорку о том, что может быть более 100 стартапов в области чипов ИИ, и 30 выстроились в очередь на TSMC.

Независимо от области, стартапы сталкиваются с множеством рисков и неопределенностей и могут постоянно приспосабливаться и меняться по мере своего роста. Чипы ИИ, безусловно, не являются исключением. Мы видели, что в этом году многие компании росли, постепенно уточняя собственное направление и позиционирование, шагая все более и более солидно. С другой стороны, судя по начальному финансированию в этом году, в этой области (и более широкой концепции ИИ) также наблюдается явный пузырь. Некоторые компании занимаются «финансированием PPT» или «финансированием на бумаге», не имея ничего реального. В некоторых компаниях основное внимание уделяется PR, и все усилия направлены на венчурных капиталистов, известных как компании «2VC». Столкнувшись с перспективными возможностями ИИ, иметь пузыри, конечно, нормально, но я просто надеюсь, что эти пузыри не повредят развитию всего рынка.

Отбросив в сторону всевозможные смога и пузыри, мы постепенно видим какие-то «компании-лидеры» в этой области стартапов. Например, отечественные Cambrian, Horizon, Shenjian Technology и Bitmain все выпустили свои продукты в 2017 году; американские Cerebras, Wave Computing, Graphcore и Groq (основанные главным дизайнером бывшего Google TPU) могут иметь сильную силу, либо иметь свои собственные. уникальные технологии и относительно прозрачные продукты. В 2017 году в Китае также было несколько стартапов в области ИИ, которые полагаются на приложения для разработки чипов, и большинство из этих компаний возглавляют разработку чипов с приложениями. Я также ожидаю увидеть больше этого в 2018 году. Конечно, многие стартапы не разглашают собственную информацию, и не исключено, что они сдерживают свои большие ходы.

Друзья, знакомые с полупроводниковой промышленностью, возможно, лучше знают, что раньше стартапам в области полупроводников было очень трудно получить венчурные инвестиции. Основная причина в том, что эта отрасль имеет высокий риск, высокий порог и длительный цикл. Но в 2017 году фонды искали стартапы по производству чипов ИИ. Мы можем взглянуть на некоторые общедоступные данные о финансировании в этом году. Cambrian: 100 миллионов долларов США (оценивается почти в 1 миллиард долларов США); Shenjian Technology: 40 миллионов долларов США; Horizon: почти 100 миллионов долларов США; Cerabras: 60 миллионов долларов США (оценивается в 860 миллионов долларов США); Graphcore: 50 миллионов долларов США. Я также упоминал ранее, что, когда Nvidia объявила об открытии исходного кода DLA, все почувствовали, что это окажет определенное влияние на финансирование и оценку стартапов. Но по результатам такой ситуации не оказалось. После сентября мы увидели, как много стартапов снова собирают деньги. Энтузиазм инвесторов, похоже, ничуть не ослаб: как только появится новая компания, к ней сразу же устремятся многие инвестиционные институты.

Почему инвесторы, традиционно не желающие прикасаться к полупроводниковой промышленности, теперь стекаются в чипы ИИ? Это интересный вопрос. Конкретные причины могут иметь много аспектов, и основной причиной должен быть инвестиционный бум во всей области ИИ. Если вы посмотрите на капитал, стоящий за этими инвестициями, вы увидите, что многие инвесторы очень активны в области ИИ, и даже технологические гиганты, которые сосредоточатся на ИИ в будущем, такие как BAT. Традиционные инвестиции в полупроводниковые фонды более осторожны. С этой точки зрения еще предстоит увидеть, принесут ли эти капиталы без большого опыта работы с полупроводниками в области микросхем новые возможности и горизонты для всех или же они принесут риски и неопределенность. Кроме того, чипы ИИ теперь обычно относятся к чипам ускорения глубокого обучения.Условно говоря, ключевые алгоритмы просты и понятны, а цели оптимизации очень ясны.Многие технологии (например, аппаратное ускорение матричных операций) исследовались в течение многих лет. . Проверка, тестирование и отладка таких аппаратных ускорителей также относительно просты. Без тщательной оптимизации аппаратная часть может быть выполнена за меньшее время небольшой командой. Эти технические особенности больше подходят стартапам, чтобы быстро их опробовать. Конечно, создание чипа аппаратного ускорения (или IP) — это только первый шаг. Чтобы действительно сделать продукт, который может быть принят рынком, требуется много серьезной работы, определение продукта, производительность оборудования, программные инструменты, тестирование системы, поддержка на месте и т. д., и не может быть одной короткой доски. Хотя всех очень волнует время съемок, но после выхода пробы остается еще много грязной работы.

2018 • На что обратить внимание

Я все еще очень жду 2018 года. Как инженер, много лет занимающийся проектированием архитектур микросхем, я в первую очередь с нетерпением жду появления технологических новшеств. В 2017 году я написал много статей с анализом технологий, связанных с ИИ-чипами, к концу года я уже почти немного устал от эстетики (думаю, читатели такие же), и кажется, что новых становится все меньше и меньше. вещи. В конце 2017 года стартап под названием Vathys открыл сразу несколько дыр в мозгу, полностью настроил асинхронную логику, эквивалентная тактовая частота может достигать 12 ГГц (процесс 28 нм); SRAM высокой плотности (1T-SRAM), встроенное хранилище Емкость может достигать 1,5 ГБ (28 нм), беспроводное стекирование 3D, 10 000 ГБит/с при ~8 фДж/бит. Эти технологии либо все еще находятся на стадии академических исследований, либо когда-то были вспышкой. Реально ли стартап-компания сделать такие большие ходы сразу, да еще с таким высоким показателем? Итак, когда босс Ватиса написал по электронной почте, что их компания должна быть добавлена ​​в список ИИ-чипов, которые я сделал, я сначала отказался. Однако, с другой точки зрения, даже если они полностью обманывают, это болевая точка, которая поражает процессор глубокого обучения. Более того, эти технологии в настоящее время исследуются, и с повальным увлечением ИИ и огромной финансовой поддержкой, возможно, их удастся придумать. Так что я все еще надеюсь увидеть, как они или другие команды сделают прорыв в этих технологиях, что нас очень волнует. Говоря о технологических прорывах, мы можем ожидать прорывов в технологиях хранения в будущем (вероятно, после 2018 года), а также архитектурных инноваций, основанных на новых технологиях хранения, включая технический маршрут Neuromorphic.

Дальше, конечно же, следующий ход гигантов. Будут ли TPU Google продаваться другим пользователям, чтобы напрямую конкурировать с Nvidia? В настоящее время лагерь ONNX сформировал конфронтацию с Google.Как самый полный производитель в экосистеме, Google продвигает ТПУ очень важно для укрепления своих лидирующих позиций. Кто из «Большой пятерки» и BAT будет учиться на примере Google и напрямую разрабатывать собственные чипы? Начнется ли исследование микросхем Alibaba Dharma Institute с ИИ? Сможет ли Intel взорваться, как все ожидают? Как Nvidia ответит на вызовы со всех сторон и будет ли она выпускать больше специализированных чипов для ускорения вместо простого добавления Tensor Core в GPU? Когда Qualcomm добавит аппаратные ускорители в чипы мобильных телефонов? Каким будет следующий шаг ARM, охватит ли он встраиваемую сторону? . . . Если подумать, есть много вещей, которых можно с нетерпением ждать. Недавно мы также видели, что AMD и Intel объявили о редком сотрудничестве для борьбы с Nvidia. И IBM активно работает с Nvidia над Power9. В 2018 году мы все еще можем увидеть больше сотрудничества между гигантами отрасли.

Судьба стартапов также является самым важным событием в 2018 году. В предыдущей статье я сказал, что «для стартапов, занимающихся чипами ИИ, 2018 год — это как минимум конец семестрового экзамена, если не выпускной экзамен…». В 2018 году большинство стартапов сдадут результаты первого испытания (чипы), а также начнут испытания небольшими партиями. Считается, что результаты бенчмаркинга будут более справедливыми, а «теоретические» показатели будут заменены фактическими результатами «бегущей оценки». В то время как ошибки допустимы для стартапов, чипы первого поколения не в полной мере отражают будущие перспективы компании. Однако производство чипов требует постоянной поддержки огромных ресурсов, и на этом этапе может быть очень опасно оставаться позади. Конечно, первая ликвидация также является лучшей возможностью для действительно отличных компаний. Я очень жду одноклассников, которые смогут выделиться на экзамене и перейти на новый уровень (или сразу получить высшее образование); Кроме того, в 2018 году к конкуренции на стороне Edge присоединятся более традиционные производители чипов, такие как Samsung, Qualcomm, MTK, Spreadtrum и др., а ARM, имеющая абсолютное преимущество во встраиваемых IP, также должна сделать больше шагов. Оба они могут оказать серьезное влияние на судьбу стартапов.

Наконец, есть возможность измениться. Вообще то, как будет развиваться ИИ в целом в 2018 году, — это вопрос, который всех очень волнует. Продолжать расти с высокой скоростью, или стабильно развиваться, или будут проблемы? В любом случае общая тенденция неизбежно повлияет на чипы ИИ. Особенность заключается в том, что цикл разработки чипа составляет от 9 до 18 месяцев, что намного больше, чем цикл разработки и обновления программных приложений. В сочетании с некоторыми запаздывающими эффектами разработка чипов не может идти в ногу с развитием алгоритмов и приложений. Одна из самых страшных проблем при разработке чипов — неопределенность будущего. Условно говоря, предсказуемая и стабильная среда роста наиболее благоприятна для исследований и разработок чипов, что позволяет разработчикам чипов лучше планировать продукты и координировать ресурсы. Другая изменяющаяся ситуация заключается в том, что на уровне алгоритма происходят огромные изменения, то есть техническая неопределенность. Самый успешный алгоритм ИИ за последние годы — глубокое обучение на основе нейронных сетей. Это является основой для текущего спроса на чипы ИИ, а также определяет, что большинство текущих чипов ИИ нацелены на ускорение алгоритмов этого типа. Если требования к базовым алгоритмам изменятся, это окажет большое влияние на дизайн чипов ИИ. Например, уже есть сеть низкой точности с определенным прикладным базисом, то есть в выводе используется очень низкая точность, или даже напрямую используется бинарная сеть. Если этот вывод будет широко использоваться, возможно, придется пересмотреть текущую архитектуру чипа. Другой пример: если капсульные сети Хинтона окажутся практичными, для их поддержки могут потребоваться новые архитектуры микросхем. В конце концов, область ИИ стремительно развивается, поэтому каждый должен всегда следить за последними разработками на уровне приложений и алгоритмов. Мы также не стесняемся задавать себе следующие вопросы (из выступления Джеффа Дина на NIPS2017).


Суммировать

В 2017 году я хотел бы вернуться в прошлое за последние несколько лет, чип AI нас взволновал. На самом деле, есть много вещей, и приведенный выше текст в основном то, что вы хотите написать, это также немного размышлений, точное место, пожалуйста, также исправьте, больше.

Желаем всем читателям удачи в 2018 году! Хочу пожелать успехов всем коллегам, которые сражаются на передовой ИИ-чипов!

Заявление AI Frontline | Эта статья является оригинальной статьей доктора Тан Шаня, которая была уполномочена пересылать и распространять через публичный аккаунт InfoQ.

об авторе

Доктор Тан Шан имеет более чем 15-летний опыт проектирования микросхем, специализированных процессоров и архитектуры SoC.Сейчас Synopsys AI Lab отвечает за исследования архитектуры микросхем ИИ и связанных с ними технологий. Добро пожаловать в общедоступный аккаунт доктора Тан Шаня StarryHeavensAbove.

Ответить после подписки "AI"Знаешь