Nvidia gf100: графическая архитектура нового поколения

Nvidia gf100: графическая архитектура нового поколения

Для чего перестраивать GF100? Обстоятельство одна: геометрия

Успешные архитектуры не переделывают легко чтобы потешить публику. Имеется много обстоятельств в ответе nVidia оснастить любой кластер GPC собственным движком растеризации, а любой мультипроцессор SM — так называемым движком PolyMorph (нет, игроки WoW, вы не о том поразмыслили).

Сперва основное: движок PolyMorph складывается из пяти ступеней логики с фиксированными функциями, которая трудится совместно с другой частью мультипроцессора SM, дабы запрашивать вершины, делать тесселяцию, изменение области просмотра, запись и настройку атрибутов в память. Между каждым этапом потоковый мультипроцессор SM снабжает функции vertex/hull shading и domain/geometry shading.

Из каждого движка PolyMorph примитивы отсылаются на движок растеризации, любой из которых способен обрабатывать восемь пикселей на такт (в сумме 32 пикселя за такт по всему чипу).

Для чего необходимо было разбивать обработку геометрии на все эти этапы если сравнивать с монолитной передней частью конвейера, которая в прошлом трудилась превосходно? В итоге, не активировала ли AMD блоки тесселяции ещё в шестом поколении собственных GPU (не забывайте TruForm в 2001)? Да, правильно. Но какое количество игр с того времени смогли взять преимущество от блоков тесселяции? В этом сущность.

Ещё с дней архитектуры Nvidia GeForce 2 мы слышим о программируемых пиксельных и вершинных шейдерах. Сейчас мы взяли очень впечатляющие шейдеры, каковые додают огромное количество подробностей в последние игры DirectX 9 и 10 (Nvidia заявляет о 150x повышении производительности шейдеров при переходе с линейки GeForce FX 5800 на GT200). Но все мы видели не самую совершенную геометрию ландшафта, которая всецело хоронит реализм отечественных любимых игр. Возможно, следующей планкой в поднятии реализма графики будет повышение детализации геометрии.

DirectX 11 реализует подобный ход через три новых этапа в конвейере рендеринга: шейдер корпуса (hull shader), что вычисляет изменении контрольных точек, тесселятор (tessellator), что додаёт тесселяцию к шейдеру корпуса и выдаёт доменные точки (domain points) и шейдер домена (domain shader), что уже обрабатывает эти точки.

Но для получения производительности, которая бы разрешала действенно реализовывать тесселяцию, nVidia было нужно перейти с монолитной передней части конвейера на более параллельный дизайн. Исходя из этого мы взяли четыре блока растеризации и 16 движков PolyMorph. В полной мере конечно, что у компании имеется личные демонстрации, показывающие, как более действен дизайн GF100 если сравнивать с архитектурой Cypress, которая упирается в узкий монолитный дизайн. Но, мы бы однако желали сравнить производительность в таких играх, как Aliens Vs. Predator от Rebellion Developments с включённой и отключённой тесселяцией. В любом случае, nVidia заявляет о том, что GF100 снабжает до 8x лучшую производительность, чем GT200 в окружениях, упирающихся в геометрию.

Не просто вычислительная архитектура

До объявления подробностей о выходе GF100 мы уже много слышали о том, что компания принимает новинку как возможность поменять собственную роль в графике с выговором на вычисления на GPU. Само собой разумеется, представители nVidia первыми выразили опасения по поводу этого мифа, но однако компания сама виновата за распространение аналогичного мнения.

Архитектура Fermi была в первый раз заявлена на собственной конференции nVidia GPU Technology Conference в последних числах Сентября 2009 года, и в то время обсуждались лишь характеристики дизайна, относящиеся к вычислениям. Подобное объявление спустя семь дней по окончании выхода ATI Radeon HD 5870 произвело достаточно сильный эффект, потому, что финальный продукт (по слухам) должен был показаться не раньше, чем через квартал, а AMD уже поставляла на рынок первые в мире видеоплаты с помощью DirectX 11. В любом случае, мы с интересом ознакомились с одним из первых детальных обзоров возможностей архитектуры Fermi.

Само собой разумеется, на данный момент nVidia пробует всех убедить, что она и не отходила от главной идеи графической производительности. Архитектура GPC, с выговором на геометрии, и полное соответствие DirectX 11 должны убедить всех сомневающихся. Но, беглый взор на GF100 всё равняется говорит о том, что компания пробовала достигнуть баланса между графикой и вычислениями, включая такие намёки, как работу с числами с плавающей запятой двойной точности либо архитектуру кэша на чипе.

Любой из 16 потоковых мультипроцессоров SM поддерживает личные 64 кбайт неспециализированной памяти/кэша L1, каковые смогут быть сконфигурированы, к примеру, как 16 кбайт неспециализированной памяти/48 кбайт кэша L1 либо напротив. У GT200 употреблялось 16 кбайт неспециализированной памяти на мультипроцессор SM, дабы эти были как возможно ближе, другими словами дабы минимизировать обращение к кадровому буферу за информацией. Расширив данный массив памяти и сделав его практически динамически настраиваемым, nVidia решила одновременно и неприятности графики, и вычислений. К примеру, в сценариях расчёта физики либо трассировки лучей у вас нет предсказуемого механизма адресации, так что маленькая неспециализированная память/громадной кэш L1 улучшают работу с памятью. Это будет особенно заметно, в то время, когда разработчики начнут лучше применять преимущества DirectCompute в собственных играх.

GT200
GF100
Преимущества
Текстурный кэш L1 (на квад) 12 кбайт 12 кбайт Текстурная фильтрация
Выделенный кэш L1 загрузки/ хранения Нет 16/48 кбайт Нужен в расчётах физики/ трассировки лучей
Неспециализированная память 16 кбайт 16/48 кбайт Более действенное повторное применение данных между потоками
Кэш L2 256 кбайт (лишь чтение текстур) 768 кбайт (все операции чтения/запись клиентов) Производительность вычислений, покрытие текстур

на данный момент графический процессор владеет 768 кбайт кэша L2, что намного больше и функциональнее, чем 256 кбайт кэша GT200, употреблявшегося лишь для чтения текстур. Из-за унификации кэш L2 у GF100 заменяет кэш текстур L2, кэш ROP и буферы FIFO чипа, потому, что любой клиент может считывать данные из кэша либо записывать её в кэш. Это ещё одна область, в которой nVidia очевидно нацелилась на увеличение вычислительной производительности. Но, производительность в играх также возрастет, потому, что мультипроцессоры SM при работе над одними и теми же данными будут реже обращаться в память.

Само собой разумеется, правильно, что GF100 представляет собой важный ход вперёд в области того, что сторонние разработчики смогут сделать в сфере вычислений. Катализатором помогает да и то, что стандарты DirectCompute и OpenCL уже дешёвы, AMD поддерживает оба API, а в будущем мы должны заметить увеличение реализма игр через помощь вычислений на GPU. Трассировка лучей (применяемая как по отдельности, так и вместе с растеризацией), рендеринг вокселей, изменение глубины резкости, поиск пути и гидродинамика частиц AI — всё это потенциальные сферы, в которых покажут себя вычисления на GPU.

Помощь Surround

Мы ещё не забываем времена, в то время, когда Matrox запускала собственную видеокарту Parhelia. Однослотовая видеоплата разрешала подключать до трёх дисплеев через переходник. Как возможно додуматься по заглавию, разработка Surround Gaming разрешала играть на трёх мониторах (GPU кроме того поддерживал адаптивную тесселяцию полигонов — в 2002 году!) К сожалению, видеокарта Parhelia была не хватает стремительной, дабы насладиться игрой кроме того на одном мониторе, не говоря уже о трёх.

Выход ATI Radeon HD 5870 дал нам достаточно 3D-производительности кроме того в разрешении 2560×1600, причём графическая мощь кроме того оставалась. Само собой разумеется, игра в разрешении 5760×1200 в режиме Eyefinity даёт значительную нагрузку на GPU Cypress, но играться однако возможно — а также с удовольствием!

nVidia столкнулась со схожей обстановкой с GF100 — GPU обязан снабжать значительную графическую производительность. Включение GeForce 3D Vision может задействовать часть бюджета производительности, потому, что стереоскопический рендеринг уполовинивает частоту кадров. Но nVidia, вне всякого сомнения, испытывает давление со стороны разработки Eyefinity, причём раскрывается путь и очень увлекательной реализации 3D Vision Surround. Разработка поддерживает дисплеи с разрешением до 1920×1080 и может выводить стереоскопический рендеринг до трёх ЖК-мониторов 120 Гц. Само собой разумеется, добавление коррекции на рамку монитора ведет к тому, что между дисплеями вы приобретаете невидимую область, скрывающую часть пространства игры, но nVidia показывает, что это именно ближе по реалистичности к виду из окон кабины.

Если вы не готовы израсходовать деньги на три 120-Гц дисплея, то nVidia поддерживает и простой режим Surround — та же самая разработка на тройке дисплеев с разрешением 2560×1600, весьма похожая на Eyefinity. Но имеется и два значительных отличия. Первое: обе функции будут реализованы в будущем драйвере, что, как информируют, обязан показаться к тому моменту, как на рынок выйдут видеоплаты GF100 (причём будет поддерживаться не только GPU GF100, но и видеоплаты GT200 также смогут выводить режим 3D Vision Surround).

Второе: для конфигураций с тремя дисплеями потребуется установка SLI, потому, что GPU GT200 и GF100 поддерживают выходы лишь на два монитора.

Преимущества: вы получите приличный потенциал производительности в играх, объединив три дисплея 1920×1080 (5760×1080) в стерео.

Недочёты: при существующих стоимостях на GeForce GTX 285, вам нужно будет выложить за видеокарты Nvidia Surround очень приличную сумму, сопоставимую с одной Radeon HD 5970. А вдруг требуется помощь стереоскопии, то направляться дождаться появления Acer G245 — сейчас вы станете, в основном, ограничены маленькими панелями 1680×1050 от ViewSonic и Samsung.

Заключение

nVidia обещает, что мы должны заметить видеоплаты на базе GF100 в течение последних трех месяцев этого года — другими словами в течение следующих двух месяцев либо через шесть месяцев по окончании того, как AMD начала поставки собственной видеоплаты Radeon HD 5870. Большой срок для индустрии ИТ. Но в случае если одна GF100 прекрасно продемонстрирует себя в современных играх и сможет соперничать с флагманом AMD Radeon HD 5970, то мы можем с уверенностью заявить, что выпуск видеокарт DirectX 11 на 6 месяцев позднее вряд ли омрачит будущее Nvidia, пускай кроме того сейчас компания приобретает много критики.

Но больше всего нас тревожит то, что чип с тремя миллиардами транзисторов вряд ли будет продаваться по дешёвым стоимостям. По крайней мере, пока мы не заметим на рынке появление производных от него, видеокарты GF100 останутся эксклюзивом для тех геймеров, каковые смогут себе позволить топовые видеоплаты в линейке Radeon HD 5800.

Но, если вы ожидаете новых событий на рынке high-end графики, то не так долго осталось ждать станете вознаграждены. Сложно не обсуждать представленные nVidia спецификации, и они вправду впечатляют. Мы должны взять более чем двукратное повышение производительности в современных играх если сравнивать с GeForce GTX 285, и немыслимый потенциал в будущих играх (благодаря архитектуре, оптимизированной под сложную геометрию, и GPU с расширенной помощью вычислительных свойств).

Так что GF100 может оказаться одним из революционных дизайнов nVidia.

Само собой разумеется, мы не можем относиться к итогам nVidia с полным доверием. Все результаты тестов, каковые были нам представлены, были взяты на собственных компьютерах nVidia с видеокартами, чьи частоты не заявлены. И в этом случае у нас имеется лишь предварительные сведения. Да и видеокарты должны оказаться дорогими, прожорливыми и тёплыми.

Мы так же, как и прежде не знаем точный срок выхода, ассортимент моделей на GPU GF100 и цены.

В это же время AMD производит видеокарты DirectX 11 по стоимостям от $99 до $649 (но, вам нужно будет потратить не меньше $150, для получения нормальной производительности DirectX 11). Вы сразу же получите помощь Eyefinity, что очень полезно и для погружения в игры, и для плодотворной работы на нескольких мониторах. Да и новые видеоплаты AMD очень прекрасно вписываются в окружение домашнего кинотеатра.

Время продемонстрирует

AMD последние месяцы наслаждается своим лидирующим положением на рынке видеоплат, но зелёная команда nVidia подготавливается к замечательному и долгому рывку, что обещает появляться очень впечатляющим, в то время, когда видеокарты GF100 начнут оказаться на рынке. Вероятнее, видеокарты предоставят геймерам личные преимущества, добавят производительности в играх и в вычислениях PhysX и CUDA, и скорости в помощи GeForce 3D Vision. GF100 — очень амбициозный проект, с этим не поспоришь.

Но нам необходимо заполучить видеокарту в лабораторию, дабы на практике оценить упрочнения nVidia.

Случайная статья:

NVIDIA VOLTA — ВИДЕОКАРТЫ для игр НЕ БУДЕТ, зато многоядерный GPU


Похожие статьи:

Комментирование и размещение ссылок запрещено.

Обсуждение закрыто.