Nvidia tegra k1: сила xbox в мобильной платформе?

Nvidia tegra k1: сила xbox в мобильной платформе?

Обзор Nvidia Tegra K1 | GPU в Tegra K1: один SMX — это большое количество либо мало?

Само собой разумеется, в работе Nvidia Tegra K1 наблюдаются кое-какие ограничения: в условиях определённого запаса мощности, кроме того не обращая внимания на применение архитектуры Kepler, реализация Nvidia Tegra K1 должна быть шепетильно проработана. В сущности, мы располагаем одним потоковым мультипроцессом, что встроен в один кластер графической обработки. SMX содержит 192 ядра CUDA.

Вместо 16 текстурных блоков, каковые имеются в ПК, Nvidia Tegra K1 уменьшает количество SMX до восьми. И до тех пор пока любой ROP выводит 8 пикселей за такт, скажем, в GK104, Nvidia Tegra K1 снижает это количество до четырёх.

Не обращая внимания на то, что Nvidia не сказала нам правильную тактовую частоту собственного графического комплекса, в одном из слайдов упоминается большой показатель 365 ГФЛОПС. При помощи 192 шейдеров частота достигнет уровня приблизительно 950 МГц.

Сложнее поведать о некоторых вторых трансформациях, каковые требуются для функционирования Kepler в Nvidia Tegra K1. Кратко: если вы обратите внимание на блок-схему GPU, то представленная серым цветомструктура со взаимодействующими компонентами была заменена в целях увеличения эффективности.

Не обращая внимания на то, что архитектура нового поколения Maxwell была создана с учётом потребностей мобильных устройств, в будущем компания начнёт использовать совсем различные структуры для построения мобильных и более больших GPU, создавая нужный баланс между энергопотреблением и производительностью.

Nvidia скоро разрешила понять, что не старается сократить другие особенности архитектуры: к примеру, тесселяция хоть и появляется через DirectX 11 и OpenGL, но движок второго поколения PolyMorph, имеющийся в настольных GPU на архитектуре Kepler, считается частью SMX.

Мы не в первый раз слышим о тесселяции через DirectX 11 на аппаратном уровне – Qualcomm Snapdragon 805 с графикой Adreno 420 кроме этого поддерживают поверхностный, доменный и геометрический шейдеры, как и ядра Vega от Vivante. Nvidia не сомневается в собственном способе и вычисляет его лучше остальных, но сейчас это никак не проверить умелым путём. Мы же считаем, что использование таких функций, как тесселяция и применение геометрических шейдеров, разрешит разработчикам применить эти возможности в новом поколении игр.

GPU-ускоряемый метод path rendering есть ещё одной разработкой, с которой Nvidia экспериментировала на собственных громадных GPU (в действительности, ещё в 2001 году) и которую пробует реализовать в мире мобильных ответов. Он в большинстве случаев применим при применении свободных от разрешения двухмерных графических приложениях – это характерно для для того чтобы контента, как PostScript, PDF, шрифты TrueType, Flash, Silverlight, HTML5 Canvas, наровне с API Direct2D и OpenVG. Исторически это являлось задачей CPU.

Артефакты, являющиеся результатом, весьма заметны при применении мобильных устройств.При масштабировании веб-страницы щипком на первом iPad проходило пара секунд, пока SoC А4 повторно растрировал картину, текст же за это время так и оставался размытым. iPad Mini с А5 справляется с задачей лучше: стоит отпустить шрифты и картинку становятся чёткими, но пока пальцы остаются на картине – сохраняется размытие. Nvidia заявляет о том, что ускоренный рендеринг окажет помощь избавиться от для того чтобы результата, в один момент применяя нужную мощность, потому, что процессор CPU наряду с этим не задействован.

Справа видно пятно от и масштабирования щипком, слева шрифты повторно растеризованы

Быть может, под впечатлением от показателей устройства Qualcomm Snapdragon 805 с интерфейсом памяти LPDDR3-1600 128бит (128бит поделить на восемь и умножить на 1600 MT/с в итоге образовывает 25,6 Гбит/с), Nvidia старается доказать, что достаточно и 17 Гбит/с на 64-битной шине с 2133 MT/с. Конечно же, пропускная свойство есть ответственной чёртом. Однако, Nvidia внедряет архитектурные изюминки Kepler, улучшая функционирование Tegra кроме улучшения спецификаций.

Одним из примеров есть наличие 128 Кбайт кэша L2, что облегчает требования DRAM в тех обстановках, в то время, когда ссылки на применяемые эти приводят к повышению количества обращений, а потому, что кэш унифицирован, то любой чип в блоке может делать задачу. Применение сжатий технологий и ряда отказов кроме этого минимизирует трафик памяти: к данным оптимизациям относятся отсечение невидимых поверхностей (Z-cull), Early Z и Z-сжатие, и сжатие структур (включая XT, ETC и ASTC) и цветов.

Кое-какие из этих возможностей выходят кроме того за рамки 3D-нагрузок и в полной мере соответствуют многоуровневым пользовательским интерфейсам, в которых оптимизация применения пропускной свойстве может содействовать помощи более большого разрешения (возможно, как раз исходя из этого большая часть устройств на Tegra 4 применяет более низкое разрешение). В первый раз в Nvidia Tegra K1 употребляется сжатие с применением дельта-кодирования, где сравниваются блоки пикселей для уменьшения влияния информации о цвете.

Nvidia кроме этого способна сэкономить пропускную свойство на уровнях интерфейса пользователя благодаря громадной прозрачности – GPU распознаёт «чистые» участки и пропускает данный рабочий процесс. Имея соответственное устройства для тестирования, мы, само собой разумеется, возьмём более глубокое представление о том, как система памяти Tegra воздействует на производительность. Сейчас Nvidia настаивает на том, что элегантность ответа имеет не меньшую сокровище если сравнивать с неотёсанной силой.

В дополнение Nvidia Tegra K1 унаследовала у Kepler помощь неоднородных вычислений. До недавнего времени все новейщие разработки графических совокупностей PowerVR, Mali и Adreno применяли сочетание OpenCL и/либо Renderscript, из-за меньшей гибкости изолируя устаревающую мобильную архитектуру Nvidia. Всё изменилось по окончании того, как Nvidia внедрила CUDA, OpenCL, Renderscript, Rootbeer (для Java) и ряд других вычислительных языков в собственной новой платформе.

Обзор Nvidia Tegra K1 | Как масштабировать мощность Kepler ниже 2 Вт?

На первый взгляд, математически это звучит нелепо. GPU GK104 в GeForce GTX 680 от Nvidia содержит восемь блоков SMX и вычислен приблизительно на 200 Вт. Само собой разумеется, имеются четыре раздела ROP, 256-битная шина памяти и вдвое больше текстурных блоков на один SMX. Наряду с этим вы рассчитываете на, по крайней мере, десятикратную отличие между Kepler в Tegra и теоретическим дискретным GPU, поскольку в последнем задействован всего один SMX.

Как же это исправить?

Как пример старший вице-президент Nvidia Джона Албэн (Jonah Alben) тестировал GeForce GT 740M мощностью 19 Вт на двух SMX. шина ввода-и Память вывода PCI Express 3.0 несут ответственность за 3 Вт от всей мощности GPU. Утечка достигает приблизительно 6 Вт.

GK107 имеет два SMX, исходя из этого нужно поделить этот показатель мощности, для получения мощности одного блока SMX. Получается 5 Вт. Имея эту цифру в виду, представьте, что Nvidia способна поднять тактовые частоты и напряжение собственных дискретных GPU, дабы уложиться в заданный запас мощности.

Через масштабирование напряжения вероятно добиться 2 Вт либо около того, именно для GPU на Nvidia Tegra K1.

Повышение эффективности ответа происходит мало сложнее, чем представлено выше. Многоуровневая совокупность уменьшения энергопотребления за счёт запрета подачи тактовых сигналов на неиспользуемые цепи схемы трудится так, что в масштабе всего GPU неиспользуемый в какой-то момент времени метод отключается. Существуют два уровня экономии энергии, где отключение тока происходят на чипе либо в регуляторе.

В SoC инженерам Nvidia было нужно оптимизировать каналы передачи и внутренние соединения данных, находя компромисс между снижением энергопотребления и повышением производительности, где это нужно.

Nvidia представила личные результаты тестирования через GFXBench 3.0, сравнив частоту подачи кадров с энергопотреблением при разрешении 1080p при помощи независимого теста Manhattan. Примерами для сравнения были выбраны Apple iPhone 5s и Сони Xperia Z Ultra, основанные на SoC A7 и Snapdragon 800. При неизменном уровне производительности компания заявляет о том, что показатель производительности на ватт в 1,5 раза превышает возможности вторых платформ при памяти и совокупном энергопотреблении процессора DRAM.

Обзор Nvidia Tegra K1 | Chimera 2: особенное внимание формированию изображения

При создании Tegra 4 Nvidia очевидно ориентировалась на увеличение качества изображения, а учитывая крепкие позиции компании в области графических ответов, имело суть увеличить собственное влияние в области обработки видео и фото. К сожалению, мы ожидали практически весь год , пока нам не показали реализацию разработки Computational Photography Engine, которая внедряла средства стабилизации HDR-изображений и видео.

Иначе, учитывая маленькое количество устройств, основанных наTegra 4, не выглядит неожиданностью и скромный комплект ПО. В случае если Nvidia Tegra K1 будет обширно распространена, мы сохраняем надежду на то, что в будущем производители устройств станут больше применять возможности новой SoC в области обработки изображений.

Этот потенциал существенно выше при с Nvidia Tegra K1. Показатель пропускной свойстве ISP у Tegra 4 достигал 350 мегапикселей в секунду. В новейшем устройстве находятся уже два ISP по 600 мегапикселей (два потока 20 Мп на частоте 30 Гц).

Посредством пары ISP возможно принимать изображения с одного источника, тогда как изображения с другого находятся в обработке, или возможно трудиться с двумя камерами, или с памятью и камерой. Перекрёстная структура соединяет оба ISP с памятью, где происходит соединение с CPU и GPU.

В возможности ожидается помощь 4096 точек фокусировки, входного сигнала 14 бит, 100 мегапиксельных сенсоров, сотрудничество с вычислениями неспециализированного назначения, расширение возможностей для минимизации шума, исправления «битых» пикселей и уменьшение масштаба – появление всего этого видится в полной мере вероятным. Кое-какие функции помогают всего лишь для улучшения качества изображения, тогда как остальные смогут проложить путь для новых приложений визуализации.

К примеру, получать показателя более 4000 точек фокусировки не имеет смысла, но Nvidia уверен в том, что это полезно для отслеживания нескольких объектов, и мы в действительности видели демонстрацию перемещения, при котором камера обнаруживает и отслеживает объект, фокусируясь на нём, не обращая внимания на те трансформации, происходящие в другой части картины.

В том же ключе, применяя купленную свойство движка к вычислениям, эффекты смогут использоваться и к контенту ISP в реальном времени. Глубокое изображение, в котором любой пиксель способен хранить любое количество выборок на канал (вместо одной), станет в полной мере вероятным. То же касается и создания панорамных снимков путём рисования сенсором камеры.

Замечательные ISP при помощи сильного GPU открывают двери к новым формам творчества, и команда Nvidia разумеется имеет представление о том, как применить инновации в данной сфере. Как уже упоминалось, демонстрация уровня, которого может достигнуть фотография, показывает на то, как медлительно может реализовываться инновация в коммерческом продукте. Забрав бразды правления в собственные руки и представив Tegra Note 7, Nvidia была вынуждена разрабатывать новое ПО.

Первое обновление OTA показалось пара недель назад. Быть может, на данный момент, по окончании выхода Nvidia Tegra K1, направляться перейти с размеренного на ускоренный ход – мы не желаем ожидать ещё год до следующих свежих демо компании.

В то время, когда в прошедшем сезоне Nvidia представила Chimera, она презентовала слайд, весьма похожий на данный, действительно, ISP был всего лишь один, а GPU не базировался на Kepler.

Обзор Nvidia Tegra K1 | Может ли Nvidia ковать железо, пока горячо?

На бумаге Nvidia Tegra K1 ликвидирует неприятности, в следствии которых Tegra 4 была такой неконкурентоспособной платформой. На кое-какие вопросы мы не возьмём ответ до тех пор, пока не совершим тестирование настоящего устройства, но на кое-какие — только тогда, в то время, когда разработчики игр или портируют премиум-контент с консолей на планшеты, либосоздадут что-то новое, применяя усовершенствованные API.

Мы сохраняли надежду совершить опробования одной из референсных аппаратных платформ Nvidia до представления Nvidia Tegra K1, но они всё ещё так редки, что результаты тестов производительности покажутся позднее. Производство SoC якобы началось в декабре, а представители компании утверждают, что устройства на базе Nvidia Tegra K1 поступят в продажу в первой половине 2014 года.

Но, правильные сроки выхода конечных устройств не зависят от Nvidia, так что до тех пор пока нет информации о форм-факторах данных устройств и регионах, где они будут дешёвы (то же касается собственных устройств компании на базе Nvidia Tegra K1). Но, по крайней мере, один продукт на Nvidia Tegra K1 уже изготовлен. Это хорошая новость.

Но из слов представителей компании стало ясно, что Nvidia Tegra K1 создавалась как раз для планшетов и будет употребляться и в премиальных моделях телефонов с множеством и большими экранами технологических новшеств. Платформа Tegra 4i со встроенным LTE-модемом i500, которая больше ориентирована на смартфоны, предположительно будет выпускаться, причём более подробная информация по ней покажется в первой половине 2014 года.

Но, сегодняшняя дискуссия идёт не о заслугах Tegra и не об окончательной судьбе Nvidia Tegra K1. Зная, как остро отечественная аудитория реагирует на информацию о производительности и скоростях, Nvidia скорее желала поделиться информацией о внутреннем строенииSoC. Наровне с Intel, Nvidia есть одним из самые общительных поставщиков в мобильном сегменте, говоря значительно больше о собственной продукции, чем Apple либо Qualcomm.

Остаются и маленькие пробелы (к примеру, конечная тактовая частота GPU), но, учитывая то, что мы уже знали об архитектуре Kepler, это именно та Tegra, которую мы сохраняли надежду взять в 2013 году.

Примерное сравнение с консолями прошлого поколения
Tegra K1 PlayStation 3 Xbox 360
Производительность в GFLOPS (Peak Shader) 365 192 240
Текстурирование (GTex/s) 7.6 12 8
Пропускная свойство памяти (GB/s) 17 28.8 22.4
Помощь Direct X DX 11.1 DX 9 DX 9
Производительность процессора (в SPECint, по-ядрово) 1403 1200 1200

На одном из собственных слайдов, представленных на брифинге, Nvidia показала сравнение Nvidia Tegra K1 с Xbox 360 и PS3. Спецификации не являются стопроцентно правильными, в соответствии с вычислениям, один SMX, трудясь, как мы предполагаем, на частоте 950 МГц, снабжает больше шейдеров и практически такую же большую скорость прорисовки текстур. По крайней мере, в теории Nvidia Tegra K1 может пребывать на одном уровне с этими совокупностями прошлого поколения, каковые до сих пор дешёвы в продаже.

Имеете возможность ли вы представить игровую производительность вашего ветхого Xbox в планшете, да ещё и с Bluetooth-контроллером?

Мы будем скучать по играм, что само по себе хорошо для Nvidia, учитывая то, какие конкретно тесные взаимоотношения связывают компанию с игроками на рынкеПК.Посмотрим, вероятно ли переосмыслить сегмент мобильных игр, применяя накопленный опыт, дабы пополнить копилку игр чем-то увлекательнее Tegra-модифицированных франшиз.

Отечественный призыв к Nvidia: сделать всё вероятное, дабы на планшетах возможно было играться в увлекательные игры, в каковые в большинстве случаев играются ПК-энтузиасты, а не в те жалкие игрушки, которыми мы занимаем себя лишь тогда, в то время, когда нам нечего делать. Продемонстрируйте нам, что ваши мобильные ответы кроме этого сильны, как архитектура Kepler на простых ПК, что вынудит вторых разработчиков последовать вашему примеру. В тот момент, в то время, когда игры на Android вырастут до отметки игр на ПК, за новыми планшетами выстроится целая очередь из читателей THG.

Случайная статья:

Nvidia Tegra K1: Console Quality Graphics On Smartphones?


Похожие статьи:

Комментирование и размещение ссылок запрещено.

Обсуждение закрыто.