Nvidia выпускает графические ускорители tesla для ускорения глубокого обучения

Nvidia выпускает графические ускорители tesla для ускорения глубокого обучения

На конференции по графическим разработкам в Китае компания NVIDIA представила новые ответа для платформы глубокого обучения на базе архитектуры Pascal, включая два графических ускорителя Tesla P4 и Tesla P40, и ПО, предназначенное для оптимизации и ускорения анализа информации для сервисов, в базе которых лежит применение ИИ. Так как нейронным сетям, нужным для всевозможных сервисов (голосовые ассистенты, движки генерации и почтовые фильтры спама рекомендуемых фильмов), сейчас требуется на порядок больше вычислений, чем годом ранее, все представленные NVIDIA ответы имеют серьёзное значение для индустрии.

Смотрите кроме этого: NVIDIA Tesla P100 способен ускорить приложения и высокоскоростные вычисления глубокого обучения

NVIDIA объявила передовой ускоритель для сверхмасштабируемых дата-центров NVIDIA Tesla P100 в рамках конференции GTC. Tesla P100 разрешает создавать новый класс серверов с производительностью на уровне нескольких сотен хороших CPU-серверов. Ускоритель основан на новой архитектуре NVIDIA Pascal с пятью передовыми разработками и снабжает экономичность и высокую производительность для очень ресурсоёмких приложений.

Графические ускорители Tesla P4 и Tesla P40 созданы специально для ускорения операций инференса — применения обученных глубоких нейронных сетей для распознавания речи, текста и изображений. Новые графические процессоры применяют особые руководства инференса на базе 8-битных данных, снабжая ответную реакцию в 45 раз стремительнее если сравнивать с центральным процессором и в 4 раза стремительнее если сравнивать с графическими процессорами, представленными менее года назад.

Tesla P4 рекомендован для гипермасштабируемых дата-центров. Этот ускоритель в 40 раз экономичнее центральных процессоров в задачах применения результатов обучения нейронных сетей при обработке данных. Сервер с одним Tesla P4 может заменить 13 серверов на базе центральных процессоров, предназначенных для анализа данных, что уменьшает неспециализированную цена совокупности в 8 раз.

Модель Tesla P40 создана для обеспечения большой пропускной свойстве для задач глубокого обучения. Производительность данного ускорителя образовывает 47 тера-операций в секунду с руководствами INT8. Сервер с восемью Tesla P40 может заменить 140 серверов на базе центральных процессоров.

В лице Tesla P100, а сейчас и Tesla P4 и P40, компания NVIDIA предлагает единственную комплексную платформу глубокого обучения для дата-центров, раскрывая огромные возможности ИИ для ответа самого широкого круга задач. Новые процессоры уменьшают время обучения нейронных сетей с нескольких суток до нескольких часов. Они разрешают мгновенно извлечь эти из разбираемых материалов.

И они выдают ответы в настоящем времени пользователям сервисов ИИ, — говорит говорит Ян Бак, директор по ускоренным вычислениям в NVIDIA.

Кроме новых ускорителей, NVIDIA представила два новых программных продукта, предназначенных для ускорения работы сервисов на базе ИИ: NVIDIA TensorRT и NVIDIA DeepStream SDK.

NVIDIA TensorRT есть библиотекой, созданной для оптимизации моделей глубокого обучения, которая снабжает мгновенную ответную реакцию для сетей любой сложности.Путём оптимизации обученных нейронных сетей для операций INT8 пониженной точности TensorRT увеличивает эффективность приложений и пропускную способность глубокого обучения.

NVIDIA DeepStream SDK применяет мощности сервера на базе ответов на архитектуре Pascal для анализа и одновременного декодирования в реальном времени до 93 видеопотоков в формате HD, в отличие от 7 потоков при с серверами на базе двух центральных процессоров. Это разрешает решить одну из непростых задач в области применения ИИ — восприятие масштабируемого видеоконтента, — и открывает возможности для применения ИИ в таких областях, как самоуправляемые машины, интерактивные роботы, размещение и фильтрация рекламы.

Нам крайне важно, дабы отечественные клиенты имели возможность создавать простые приложения с мгновенной реакций. Мы используем графические процессоры NVIDIA для таких отечественных сервисов ИИ, как Deep Speech 2. Использование графических ускорителей разрешает добиться таковой оперативности, которая попросту неосуществима на вторых неускоренных ответах. Pascal, с помощью руководств INT8, разрешает нам сделать ещё один ход вперед, и сейчас мы можем делать пользовательские возможности значительно лучше, — поведал Грэг Диамос, старший исследователь в Baidu.

Графические ускорители NVIDIA Tesla P4 и Tesla P40 станут дешёвы в мире в декабрь и ноябрь этого года.

Источник: 4pda.ru

Случайная статья:

Графический ускоритель NVIDIA Tesla K80 для высокопроизводительных вычислений


Похожие статьи:

Комментирование и размещение ссылок запрещено.

Обсуждение закрыто.