Nvidia gtx970 — теория ущербности

Nvidia gtx970 — теория ущербности

В прошедшей статье из цикла PC Buyer’s Guide о выборе видеокарты я взял множество увлекательных комментариев как в личных сообщениях, так и на почту, в скайп… где лишь возможно. Кто-то указывал на неточности, кое-какие просили оказать помощь с выбором устройства под их конфиг. В общем, по всей видимости, по видеоплатам нужно будет пройтись глубже, раз тема так тревожит.Сейчас доступно поболтаем о последних архитектурах карточек NVIDIA и попытаемся осознать, над чем смеялся усатый хохотун в этом видео:
Смотрите кроме этого: NVIDIA отзывает планшеты SHIELD из-за опасности возгорания аккумулятора

Сейчас, 31 июля 2015 года, NVIDIA объявляет о необязательном отзыве 8-дюймовых планшетов SHIELD, реализованных во время с июля 2014 по июль 2015 года для их замены. NVIDIA установила, что аккумуляторная батарея в этих планшетах может перегреваться и тем самым воображать угрозу возгорания.NVIDIA требует пользователей планшета SHIELD посетить страницу www.nvidia.com/support/tabletrecall, дабы выяснить, как взять устройство, высылаемое на замену.

Краткий экскурс в историюЭпоха «современных» видеоплат начинается с трёх ответственных трансформаций в архитектуре ПК. Во-первых, устаревшую шину AGP, по которой подключалась видеокарта продолжительное время, поменяла PCI Express семь дней16 первого поколения. Во-вторых, Микрософт выпустила Windows Vista с помощью новых API DirectX версии 10.0, каковые включали в себя серьёзную штуку: Direct3D 10, одной из фич которого являлся доступ для видеоплаты к простой оперативной памяти ПК нативными средствами.

В-третьих, производители видеоадаптеров отошли от концепции раздельных вершинных и пиксельных шейдерных1 процессоров и создали универсальный вариант, что умел обрабатывать и те и другие. Эти трансформации, вкупе с ростом аппаратных возможностей производителей железа создали условия для развития и взрывного роста графических ускорителей. 1 — Ше?йдер (англ.

Shader; схема затемнения, программа построения теней) — это программа для одной из ступеней графического конвейера, применяемая в трёхмерной графике для определения окончательных параметров объекта либо изображения. Она может включать в себя рассеяния света и описание поглощения произвольной сложности, наложения текстуры, преломление и отражение, затемнение, эффекты и смещение поверхности пост-обработки.

Википедия.Переход от AGP к PCI-e случился чуть раньше, чем два следующих за ним новшества, исходя из этого оценить «чистый» прирост достаточно сложно — межу эрами «ветхих» и «новых» видокарт лежит поколение ускорителей, сочетающих новый интерфейс (PCI-e) и «ветхий» подход к организации GPU: раздельные шейдерные отсутствие и процессоры поддержики D3D 10. Однако, новые возможности разрешили железкам «современного» поколения на высоких разрешениях результаты железа прошлого поколения, имеющего лишь PCI-e в качестве бонуса:На графике наглядно видно превосходство 8800GTX над двумя флагманами прошлого поколения, трудящимися совместно (в режиме SLI).

С этого момента подходы ATI (которая в последствии будет приобретена AMD) и NVIDIA в видеокартостроении пара расходятся. О том пути, что выбрали красно-белые поболтаем как-нибудь в второй раз, а сейчас обращение отправится об актуальных архитектурах чёрно-зелёных и различных интересностях внутри их продуктовых линеек.NVIDIA со времён 8800 по отечественные дниВозможности новых ускорителей на фоне их предков вы уже видели на графике чуть выше.

С того момента прошло уже практически десять лет, компания NVIDIA успела поменять пара архитектур:G80 — начинала на видеоплатах 8000-й серии, принесла помощь DirectX 10, OpenCL и Shader Model 4.0, плюс добавила одну увлекательную изюминку — программирование неспециализированного назначения на видеоускорителях (GPGPU), реализованную через фирменные API NVIDIA CUDA.G90 — усовершенствованная архитектура, использовалась в 9000-й серии. Ничего главного не принесла, а была закономерным развитием G80 — уже техпроцесс, холоднее чип, выше частоты, больше шейдерных процессоров.G200 — это поколение принесло в производственные процессы NVIDIA серьёзную изюминку, которая и сыграла одну из главных ролей в «изюминках» работы GTX970.

Очевидно, были общего характера и улучшения, но основное — вот что: в случае если раньше любой из направляться создавался под конкретную модель, то в поколении видеоплат GeForce 200 модели 280 и 260 производятся на одном и том же чипе. По окончании производства все чипы GPU проходят тест на полное соответствие спецификации GTX280, и, в случае если неприятностей никаких нет, употребляются в флагманских вдиеокартах.

Те же, что не прошли диагностику сбрасываются со скалы повторно проверяются уже на соответствие требуемым чертям для установки в видеоплаты GTX260, которая подразумевает наличие меньшего количества потоковых процессоров и более узкую шину памяти.GF100 (Fermi) — ещё одно поколение, очень сильно поменявшее неспециализированный уровень производительности видеоускорителей NVIDIA. Главные трансформации: работа по схеме Multiple Instructions Multiple Data, помощь ECC, переход на 64-разрядные регистры видеопамяти, помощь разработок DirectCompute, OpenCL, разрешающих проводить вычисления на GPU (аналоги NVIDIA CUDA, талантливые трудиться на любом GPU, поддерживающим соответствующий комплект руководств).

Как раз в этом поколении показались «чёткие средняки» — видеокарты серий GTX 460 и GTX 560, снабжающие достаточно высокую производительность по весьма и весьма увлекательной цене для конечного клиента. Они были не так увлекательны фанатам и энтузиастам самого крутого и передового железа, но, неосмненно, стали одними из самых массовых и популярных видеоускорителей собственного времени: производительности хватало, дабы играться во что угодно на «высоких» (но не «больших») настройках графики с разрешением 1920х1080, они не были требовательны к процессору и блоку питания ПК (о влиянии CPU на работу видеокарты — как-нибудь в второй раз), а основное — стоили в районе $200.

GK100 (Kepler) — Ничем примечательным не отличался, но как раз в этом поколении началась работа по улучшению энергоэффективности видеоускорителей NVIDIA. Технически, это был всё тот же Fermi, но переведённый на новый техпроцесс и применяющий новые транзисторы с низкими высокой скоростью и токами утечки переключения.

Понижение энергопотребления стало причиной уменьшению нагрева, а это указывает, что в рамках того же теплопакета производитель имел возможность поднять тактовые частоты, тем самым увеличив производительность видеоплаты. Фактически, это и случилось: новые GPU были стремительнее и холоднее.

Очевидно, кое-что изменилось и на более глубоком уровне, и но к главным отличиям это не относится.Использовался в видеоплатах 600-й и 700-й серии, на момент написания статьи есть «королём» потребительской графики для энтузиастов: видеоплаты GTX 780Ti с заводским разгоном и продвинутой совокупностью охлаждения, пока что, стремительнее, чем флагманы 900-й серии (GTX 980Ti легко ещё не существует, а простая GTX980 пара медленнее по различным обстоятельствам).GM100 / GM200 (Maxwell) — текущее поколение видеочипов NVIDIA, отличается ещё более глубокой работой над энергоэффективностью, чем GK100. Модульная архитектура GPU, личный ARM-сопроцессор, улучшения техпроцесса — вот неполный перечень главных изюминок новой архитектуре.

По ней по большому счету возможно целый трактат написать, но мы остановимся на самом ответственном.GM100 и GM200 MaxwellЧипы Maxwell существуют аж в двух поколениях. Так как главная ставка в новых GPU была сделана на энергоэффективность, первое из них — чипы GM107 и GM108 — как тест самой архитектуры — достались бюджетным карточкам GTX745, 750/750 ti и мобильным ответами GTX 830, 840, 850 и 860M. Главные трансформации, относящиеся к трёхмерной графике:

  • Повышение суммарного количества кэш-памяти второго уровня с 256 КБ до 2 МБ (в флагманских моделях), разрешило уменьшить ширину шины памяти и не мучиться от «бутылочного горлышка» между процессором видеокарты и памятью;
  • Уменьшение шины памяти с 192 бит до 128 бит — следствие из прошлого трансформации — разрешило упростить архитектуру, разводку платы и уменьшить количество потребляемой энергии;
  • Новый дизайн потоковых процессоров, названный SMM. Вдаваться с технические детали трансформаций мы не будем, но сущность трансформации вот в чём: новая архитектура разрешила экономнее расходовать вычислительные ресурсы и лучше распределять нагрузку между процессорными ядрами. По заявлениям NVIDIA, лишь заменой «устаревшей» архитектуры SMX на SMM удалось достигнуть 35% прироста производительности если сравнивать с архитектурой Kepler.

Второе поколение чипов Maxwell (GM20x) относилось к десктопному сегменту. Именно на данной архитектуре создан текущий флагман GTX 980 и получившая широкую известность GTX 970 с 3.5 гигабайтами памяти. Особенности SMM и архитектура GM200Не забывайте, я сказал, что с архитектуры G200 отправилась практика «обрезания» неудачных чипов флагманского уровня до «нефлагманских»?

Вот из этого и идут изюминке чипа, употребляющегося в видеоплатах GTX 980 и GTX 970. В соответствии с архитектурой Maxwell, шина памяти (и сама память) у чипа GM204 не неспециализированная, а поделена между блоками на пара (в этом случае — 16) сегментов. Суммарная пропускная свойство памяти — 256 бит за такт на частоте 7000 МГц.

Суммарное количество кеш-памяти — 2048 МБ. Всё это дело общается через неспециализированную шину CROSSBAR:У видеочипов, каковые употребляются в GTX 970 отключено часть вычислительных блоков (3 светло-серых квадрата в верхней части картины), каковые содержат в себе унифицированные шейдерные процессоры (NVIDIA именует их «ядра CUDA», но технически — это легко шейдерные процессоры) и блоки выборки текстур; помимо этого, как вы видите на иллюстрации, отключен один из блоков L2-кеш памяти. Но и это ещё не всё.

Обратите внимание, что между контроллерами памяти (MC) в первых трёх больших блоках нет никакой связи, а в четвёртом — «ущербном» — сообщение имеется. На картине не изображены так именуемые ROP’ы — блоки растеризации, несущие ответственность за превращение всей той магии, что видеоплата вам насчитала в простой двухмерный кадр для вывода на монитор. Их у GTX 970 также меньше, чем у «полноценной» GTX 980. Вот полная таблица с чертями «уникального» чипа GM204, применяемого в GTX 980 и «урезанного» — из GTX 970:

GM204 GTX 980 GM204 GTX 970
Количество вычислительных блоков 16 13
Ядра CUDA 2048 1164
Блоки выборки текстур 128 106
Блоки растеризации 64 56
Кеш-память L2 2048 КБ 1792 КБ
Частота ядра 1126 МГц 1050 МГц
Количество памяти 4 ГБ 4 ГБ
Шина памяти 256 Бит 2562 Бит
Частота памяти 7000 МГц 7000 Мгц
Пропускная свойство памяти 224 ГБ/с 2243 ГБ/с
Вычислительная мощность 4600 ГФлопс 3500 Гфлопс

2 — Для первых 3.5 ГБ видеопамяти;3 — Теоретическая, на практике — меньше.В принципе, ни к какому из этих «сокращений» по отдельности претензий не появляется: вы платите меньше, приобретаете менее производительное ответ, производитель экономит на «отбракованных» чипах, превращая их в пригодные к эксплуатации. Все в выигрыше, если бы не одно «но».

У GTX 970 заявлено 4 ГБ видеопамяти, но настоящие тесты говорят о том, что взять полноценный и скоростной доступ возможно лишь к «первым» 3.5 ГБ, оставшиеся 512 МБ памяти подключены через «урезанный» блок. Доступ к «главной» памяти осуществляется через полноценные блоки: их контроллеры памяти имеют доступ к своим банкам видеопамяти, собственному кусочку L2-кеша и в то время, когда видеоплате требуется очередная порция данных, драйвер обращается к контроллеру памяти – тот добывает нужную информацию из связанных с ним банков и перекладывает в скоростной кеш, к которому смогут обращаться вычислительные блоки. В случае если же игра либо программа применяет больше 3.5 ГБ видеопамяти, часть данных упадёт в «проклятый» сегмент, что не имеет собственного кеша и может общаться с вычислительными модулями только через кеш-память собственного соседа. Настоящая пропускная свойство распределяется следующим образом:

«Стремительные» 3.5 ГБ «Медленные» 512 МБ Доступ к RAM через PCI-e
192 ГБ/сек 28 ГБ/сек 164 ГБ/сек

4 — Теоретический максимум, зависит от скорости оперативной памяти, занятого количества, вторых задач, приобретающих доступ к данным сейчас.Так, без оглядки на «ущербность» оставшейся памяти, она всё ещё остаётся стремительнее, чем доступ к «оперативке». Модульная архитектура Maxwell разрешила отключить лишь мелкий кусочек GPU, не очень сильно воздействующий на производительность совокупности в целом.

Если бы употреблялась архитектура прошлого поколения (Kepler), ущерб от «деффективности» был бы намного выше: вероятнее, производителям было нужно бы отключить целый блок контроллера памяти, и без полноскоростного доступа остались бы не 512, а 1024 МБ, или видеоплата вовсе вышла бы в 3ГБ-версии и серьёзно проигрывала как соперникам, так и флагманской GTX 980.GTX 970 — 4 ГБ либо 3.5?Технически, ни маркетологи, ни инженеры нам не соврали: у видеоплаты вправду 4 ГБ памяти, применять она может все 4 гигабайта, пускай и с некоторыми ограничениями. Само собой разумеется, более «щедрой» и «не обманывающей пользователей» компания смотрелась бы, если бы завялала 3.5 ГБ видеопамяти, а на деле ставила 4, пускай и не самых полноценных, но что имеем, то имеем.На что воздействуют «медленные» 512 МБ памяти?Современные игрушки, само собой разумеется, разжирели, но таковой громадный количество памяти (3.5 ГБ) требуется лишь в том случае, если вы планируете играть на мониторе с разрешением 2560х1440 либо 3820х2160 точек.

До тех пор пока что таких экранов в проценте от общей массы не довольно много, а вдруг сказать про 4к2к, то они дороги, не всегда отличаются хорошими чертями и в целом лишь начинают завоёвывать рынок. Что касается игровых движков, то несколько лет назад производители очень не заморачивались кроме того на тему 2560х1440 и оптимизирвоали все движки под работу с разрешением 1920х1080 и 1920х1200 точек, оставляя любителей высоких разрешений с просадками FPS, микрофризами либо легко без обычного user expirience’а.

Что уж сказать про бедных пользователей ноутбуков с Retina-дисплеями и куда менее замечательными мобильными видеоплатами.На этом с теорией мы закончим, а всю практику отложим до понедельника: посмотрим, как воздействует разрешение на потребляемую память, с чем это связано, как справляется GTX 970 и чем ещё хороша новая архитектура Maxwell. Хороших вам выходных!Обзоры: » Подключаем уникальные геймпады к ПК» Razer Abyssus: самый дешёвый Razer» Nikon 1 S2: однокнопочная беззеркалка» Обзор Lenovo Miix 3-1030» Разбираемся в арт-хаосе компании Wacom»ASUS ZenFone 5, LG L90, HTC Desire 601 — двухсимочная война за потребителя, часть 1» ASUS Transformer Pad» Гарнитуры Razer KrakenЦикл PC Buyer’s Guide:» PC Buyer’s guide: выбор видеоплаты» PC Buyer’s Guide: выбор блока питания» PC Buyer’s Guide: охлаждение» PC Buyer’s Guide 2015: Материнские платы, сокеты и чипсеты» Кручу-кручу, запутать желаю. Разбираемся в линейках HDD

Случайная статья:

Geforce GTX 970 3.5GB + 0.5GB VRAM Explained — Tech Tips


Похожие статьи:

Комментирование и размещение ссылок запрещено.

Обсуждение закрыто.