Прошлое роста производительности: конец гонки частот, многоядерность и почему прогресс увяз на одном месте

Прошлое роста производительности: конец гонки частот, многоядерность и почему прогресс увяз на одном месте

КДПВ: одна из попыток Intel создать демотиватор :)Практически 10 лет назад Intel сказал о закрытии проектов Tejas и Jayhawk – продолжателей архитектуры NetBurst (Pentium 4) в направлении повышения тактовой частоты. Это событие практически ознаменовало переход в эру многоядерных процессоров. Давайте давайте разберемся чем это было обусловлено, и какие конкретно принесло результаты.
Смотрите кроме этого: QUMO RUNNER – плеер для занятий спортом

QUMO RUNNER – плеер для занятий спортом, с функцией шагомера,  счетчиком калорий, подсчетом пройденной расстоянии и  FM-радио с диапазоном  частот FM: 87,5–108 МГц. Кроме этого данный плеер разрешит слушать музыку с плеера в автомобиле по радио-каналу, потому, что оснащен функцией трансмиттера, и возможностью зарядки от автомобиля.Диапазон частот  FM-трансмиттера: 88,1–107,9 МГц, память на 30 станций, диапазон воспроизводимых частот: 20 Гц–20 КГц.

Руководить  плеером легко при помощи 1,1 монохромного OLED дисплея с разрешением 64?48 px. Плеер поддерживает ID3-теги.

Чтобы понять обстоятельства и масштабы произошедшего с этим переходом, предлагаю посмотреть на следующий график. Тут продемонстрировано число транзисторов, тактовая частота, степень и энергопотребление параллелизма на уровне руководств (ILP). Удвоение числа транзисторов каждые пара лет, известное как закон Мура – не единственная закономерность. Возможно подметить, что до 2000го года тактовая частота и потребляемая мощность росли в соответствии с подобным законам.

Исполнение закона Мура в течении десятилетий было вероятно вследствие того что размеры транзисторов всё уменьшались и уменьшались, следуя еще одному закону, известному как закон Деннарда (Dennard’s scaling). В соответствии с этому закону, в совершенных условиях такое уменьшение транзисторов при неизменной площади процессора не потребовало роста энергопотребления. В итоге, в случае если первый процессор 8086 при частоте 8MHz потреблял менее 2W, то Pentium 3, трудящийся на частоте 1GHz, потреблял уже 33W.

Другими словами энергопотребление увеличилось в 17 раз, а тактовая частота за то же время возросла в 125 раз. Увидим, что производительность за это время выросла значительно посильнее, т.к. сравнение частот не учитывает таких вещей как появление L1/L2 кэша и out-of-order выполнения, и развитие суперскалярной конвейеризации и архитектуры.

Это время возможно по праву именовать золотым веком: масштабирование техпроцесса (уменьшение размера транзисторов) выяснилось идеей, обеспечившей устойчивый рост производительности на пара десятилетий.Сочетание технологических и архитектурных достижений стало причиной тому, что закон Мура выполнялся до середины 2000х, где и наступил перелом. На 90nm затвор транзистора делается через чур узким, дабы не допустить ток утечки, а энергопотребление уже и без того достигло всех мыслимых пределов.

Энергопотребление до 100W и совокупности охлаждения весом до полукилограмма у меня ассоциируются скорее со сварочным аппаратом, да с чем угодно, но лишь не со сложным счётным прибором.Intel и другие компании смогли пара продвинуться в вопросах снижения энергопотребления и роста производительности благодаря инновационным ответам, таким, как применение оксида гафния, переход на Tri-Gate транзисторы и т.п. Но каждое такое улучшение было только одноразовым, и не имело возможности кроме того близко сравниться с тем, чего получалось добиться легко уменьшая транзисторы.

В случае если с 2007 по 2011 год тактовая частота процессоров возросла на 33%, то с 1994 по 1998 эта цифра составляла 300%.Поворот в сторону MulticoreПоследние 8 лет Intel и AMD фокусируют свои силы на многоядерных процессорах, как ответе для повышения производительности. Но имеется последовательность обстоятельств вычислять, что это направление себя фактически исчерпало. Прежде всего – повышение числа ядер ни при каких обстоятельствах не дает совершенного повышения производительности.

Производительность любой параллельной программы ограничена частью кода, не поддающейся распараллеливанию. Это ограничение известно как закон Амдала и иллюстрируется следующим графиком.Кроме этого не нужно забывать о таких обстоятельствах, как, к примеру, трудность действенной загрузки солидного числа ядер, каковые кроме этого ухудшают картину.Хорошим примером того, как применение бОльшего числа ядер ведет к меньшей производительности, имел возможность бы стать AMD Bulldozer.

Данный процессор был спроектирован с расчетом на то, что разделяемый кэш и логика разрешат сэкономить площадь кристалла и в итоге разместить больше ядер. Но в итоге оказалось так, что при применении всех ядер, энергопотребление чипа вынуждает очень сильно снизить тактовую частоту, а медленный разделяемый кэш еще посильнее снижает производительность. Не обращая внимания на то, что в целом это был хорошей процессор, повышение числа ядер кроме того близко не дало ожидаемой производительности.

И AMD не единственные, кто столкнулись с данной проблемой.Еще одна обстоятельство, из-за чего добавление новых ядер не очень сильно оказывает помощь решить проблему – оптимизация приложений. Существует не так много задач, каковые как, к примеру, обработка банковских транзакций, возможно без особенного труда распараллелить фактически на любое число ядер.

Кое-какие ученые (с аргументацией различной степени убедительности) уверены в том, что задачи настоящего мира, как и железо, владеют естественным параллелизмом, и остается лишь создать архитектуру и параллельную модель вычислений. Но большая часть известных методов, применяемых для практических задач, последовательные по собственной сути. Их распараллеливание не всегда быть может, затратно и не дает желаемых высоких результатов. Особенно это заметно, в случае если посмотреть на компьютерные игры.

Разработчики игр хоть и делают прогресс в направлении загрузки работой многоядерных процессоров, но двигаются они в этом направлении весьма неспешно. Имеется не так много игр, каковые, как последние части Battlefield смогут загрузить все ядра работой. И, в большинстве случаев, такие игры создавались сначала с возможностью применения многоядерности как главной целью. (Соглашусь, я не могу проверить данные про Battlefield.

У меня нет ни самой игры, ни компьютера, на котором в нее возможно было бы играться. 🙂 )Возможно заявить, что на данный момент для Intel либо AMD добавление новых ядер – более несложная задача, нежели их применение для разработчиков программ.ограничения и Появление ManycoreКонец эры масштабирования техпроцесса стал причиной тому, что много компаний занялись разработкой специальных процессорных ядер. В случае если ранее, в эру бурного роста производительности, процессорные архитектуры неспециализированного назначения фактически вытеснили с рынка платы расширения и специализированные сопроцессоры, то с замедлением роста производительности специальные ответы начали неспешно отвоёвывать назад собственные позиции.Не обращая внимания на заявления последовательности компаний, специальные manycore чипы никоим образом не нарушают закон Мура и не являются исключением из реалий полупроводниковой индустрии.

параллелизма и Ограничения энергопотребления для них актуальны равно как и для любых вторых процессоров. Что они предлагают – это выбор в пользу менее универсальной, более специальной архитектуры, талантливой показывать лучшую производительность на узком круге задач.

Кроме этого такие решения менее обременены ограничениями на энергопотребление – предел для Intel’овских CPU – 140W, а старшие модели видеоплат от Nvidia находятся в районе 250W.Архитектура MIC (Many Integrated Cores) от Intel – частично это попытка воспользоваться преимуществами отдельного интерфейса к памяти и создать огромную ультра-параллельную числодробилку. AMD же тем временем направляет свои силы на менее требовательные к производительности задачи, разрабатывая архитектуру GCN (Graphics Core Next).

Не обращая внимания на то, в какой сегмент рынка метят подобные ответы, все они по собственной сути предлагают специальные сопроцессоры для последовательности задач, одна из которых – графика.К сожалению, таковой подход не урегулирует вопросы. Интеграция специальных блоков в процессорный кристалл либо их размещение на платах расширения разрешает повысить производительность на ватт потребляемой мощности.

Но тот факт, что размеры транзисторов уменьшались и уменьшаются, в то время, как их тактовая частота и энергопотребление – нет, стал причиной появлению нового понятия – чёрный кремний (dark silicon). Данный термин употребляется для обозначения бОльшей части процессора, которая не может быть задействована, оставаясь в рамках допустимого энергопотребления.Исследования будущего многоядерных устройств говорят о том, что независимо от того, как устроен процессор и какова его топология, повышение числа ядер без шуток ограничено энергопотреблением.

Учитывая низкий прирост производительности, добавление новых ядер не дает достаточных преимуществ, дабы обосновать необходимость и окупить предстоящее совершенствование техпроцесса. А вдруг посмотреть на масштабы неприятности да и то, как давно она требует решения, то делается ясно, что радикального либо кроме того инкрементального ответа данной неприятности ожидать со стороны типовых отвлечённых либо промышленных изучений не приходится.Нужно отыскать новую идею как применять очень много транзисторов, которое снабжает закон Мура.

В противном случае упадёт экономическая составляющая разработки нового техпроцесса, а закон Мура прекратит выполняться еще перед тем, как достигнет собственного технологического предела.В течение нескольких следующих лет мы, возможно, однако заметим 14nm и 10nm чипы. Вероятнее, 6-8 ядер станет простым делом для любого пользователя компьютера, четырехъядерные процессоры проникнут фактически везде, и мы заметим еще более тесную интеграцию CPU и GPU.Но неясно, что случится дальше.

Каждое следующее улучшение производительности выглядит очень малым если сравнивать с ростом, имевшим место в прошлые десятилетия. Из-за роста токов утечки закон Деннарда прекратил выполняться, а новой технологии, талантливой обеспечить столь же устойчивый рост производительности не отмечается.В следующих частях, я поведаю о том, как разработчики пробуют решить эту проблему, об их кратковременных и более отдаленных замыслах.

Случайная статья:

Вся правда о многоядерных процессорах


Похожие статьи:

Комментирование и размещение ссылок запрещено.

Обсуждение закрыто.