Сеть на кристалле — мини-интернет внутри процессора

Сеть на кристалле — мини-интернет внутри процессора

Мы уже смирились с тем, что рост тактовой частоты процессоров остановился и производители пошли по пути распараллеливания вычислений. Но и число ядер обычного процессора неспециализированного назначения, скоро одолев отметки 2 и 4, остановилось в районе 8. Кое-какие кроме того собрались хоронить закон Мура.
Смотрите кроме этого: Ritmix RMD-1050: планшет с 3G-модемом

Мини-компьютер, оснащённый 9,7-дюймовым сенсорным дисплеем, разрешает выходить в Интернет через мобильную сеть, выполнять телефонные вызовы и посылать SMS. ОС — Android 4.0 Ice Cream Sandwich. Компания Ritmix начала продажи на русском рынке планшета RMD-1050, выполненного на платформе Android 4.0 Ice Cream Sandwich.Планшет Ritmix RMD-1050 (изображение производителя).

У для того чтобы застоя имеется объективная обстоятельство. В случае если отличие между 2, 4 либо 8 ядрами скорее количественная, то уже 16-ядерный процессор сталкивается с принципиальными ограничениями классической архитектуры. Дело в том, что в течении последних многих лет базой коммуникации между отдельными IP-блоками чипа служила шина. До тех пор пока блоков было мало, она справлялась, но в то время, когда начали плодиться ядра, эта архитектура исчерпала себя.

Шина представляет собой неспециализированную среду передачи данных, к которой подключено пара блоков процессора. В любой момент времени один блок может передавать эти, а все остальные — приобретать. В случае если нескольким блокам необходимо передавать в один момент — появляется коллизия, соответственно и задержка.

При числе ядер больше восьми задержки становятся неприемлемо громадными, полностью перечёркивая преимущества параллельной работы нескольких ядер.Число ядер возможно расширить ещё мало, поделив шину на пара сегментов, объединённых мостами, но это скорее «костыль», что не хорошо масштабируется и не решает главную проблему. Настоящее ответ, которое разрешит объединять много блоков на одном чипе — это прекрасно общеизвестная сеть с коммутацией пакетов, либо Network on Chip.Переход от шины к сети в полной мере закономерен.

Как раз так развивались телекоммуникационые сети: радиоэфир — обычная «шина», телефонные сети — коммутация каналов посредством матричных коммутаторов, интернет — коммутация пакетов. Так же развивалась и компьютерная периферия — современная шина PCI Express в действительности вовсе не шина, а сеть c топологией типа звезда.

Так же развиваются и процессоры — сперва прямые соединения между блоками, после этого шины и матричные коммутаторы и, наконец, сети.В архитектуре NoC каждое ядро либо блок процессора соединён с маршрутизатором, через что происходит его общение с другими блоками. Сами маршрутизаторы объединены в сеть, по которой пакеты данных путешествуют от одного блока к второму, так же как пакеты в простой компьютерной сети.

Это существенно упрощает топологию микросхемы и снимает ограничения по масштабированию — в отличие от шины, множество блоков способно общаться в один момент, не мешая друг другу. опытные образцы и Компьютерное моделирование многоядерных процессоров говорят о том, что при громадном количестве ядер такая архитектура превосходит классическую по многим показателям.Конечно, напрямую перенести логику и протоколы работы интернета вовнутрь чипа было бы неразумно и неэффективно. Тут совсем другие задачи и технологические ограничения:

  1. Весьма твёрдые требования к энергопотреблению и задержкам. Коммутаторы должны трудиться с наносекундными задержками и быть весьма экономичными. Затраты энергии на передачу данных между блоками составляют большую часть неспециализированного потребления современных чипов.
  2. минимализм и Простота. Коммутаторы на чипе должны занимать мало места, соответственно не смогут иметь сложную логику и громадный размер буфера.
  3. Параллельное, а не последовательное соединение. На физическом уровне в чипа удачнее предавать биты не последовательно по одному проводнику, а по 32 либо 64 параллельным каналам.

Изучениями NoC занимаются ведущие университеты и компании мира. Так, в 2007 году Intel создала экспериментальный процессор c 80-ю производительностью и ядрами 1 терафлопс при энергопотреблении всего в 62 ватта. В 2010 был представлен 48-ядерный «Облачный компьютер на кристалле» (Single chip cloud computer).

В апреле была напечатана работа группы исследователей MIT, каковые создали прототип 16-ядерного процессора, в котором были применены своеобразные для NoC-совокупностей оптимизации — виртуальный обход (virtual bypassing) и сигналы с малой амплитудой (low-swing signaling). Эти разработки разрешили приблизиться к теоретическим пределам пропускной свойстве и задержек и заметно снизить энергопотребление.Как они трудятся?

Простой маршрутизатор сохраняет полученный пакет в буфер, разбирает его заголовок и решает, куда его послать дальше. Virtual bypassing разрешает передать пакет фактически без задержек, за счёт того, что заголовок посылается заблаговременно, и коммутатор успевает сделать необходимые переключения цепей к тому моменту, как придёт тело пакета. Так, пакет идёт без остановок, минуя буфер.

Low-swing signaling — это уменьшение отличия между напряжениями 0 и 1 в проводнике, за счёт чего удалось дополнительно сократить энергопотребление. В сумме эти усовершенствования поднимают экономичность и пропускную способность более чем в полтора раза.Не считая улучшения таких черт, как скорость и энергопотребление, архитектура NoC даёт ещё одно серьёзное преимущество. Она легко разрешает объединять не только однородные ядра, но и по большому счету каждые блоки на одном чипе.

Как и в компьютерных сетях, физический и транспортный уровни трудятся одинаково для любых типов данных и протоколов. Возможно без особенных неприятностей поставить на место одного либо нескольких из универсальных вычислительных ядер каждый IP-блок, к примеру, графическое ядро, специальный сигнальный процессор либо контроллер какого-либо устройства.

И, так же как и в сетях, возможно реализовать помощь Quality of Service на уровне чипа, что возможно полезно для совокупностей настоящего времени и виртуализации.NoC для объединения ядер процессоров до тех пор пока ещё имеют экспериментальный статус, но для объединения разнородных блоков в совокупностях на кристалле NoC разрабатываются и используются достаточно давно. Решения таких компаний, как Sonics либо Arteris употребляются в микросхемах Samsung, Qualcomm а также Intel.

Быть может, уже не так долго осталось ждать сетевая архитектура начнёт вытеснять шины и из “святая святых” микроэлектроники — многоядерных центральных процессоров. И тогда число ядер опять начнёт быстро расти. Так что закон Мура хоронить ещё рано.Дополнительные источники по теме:

  1. Презентация Intel
  2. Перечень исследовательских групп, занимающихся NoC
  3. Компания Tilera — разработчик процессоров на архитектуре NoC
  4. Сравнение NoC и шинной архитектуры
  5. Обзорная лекция по NoC

Случайная статья:

kavabanga & Depo & kolibri — Сеть


Похожие статьи:

Комментирование и размещение ссылок запрещено.

Обсуждение закрыто.