Помощь в учёбе, очень быстро...
Работаем вместе до победы

Многоядерные модульные процессоры второго поколения

РефератПомощь в написанииУзнать стоимостьмоей работы

Все элементы процессора (процессорные ядра и графическое ядро, кэш третьего уровня) объединены с помощью 256-битной межкомпонентной кольцевой шины. Шина состоит из четырех 32-байтных колец: шины данных, шины запросов, шины мониторинга состояния и шины подтверждения. Производительность кольцевой шины достигает 96 Гбайт в секунду на соединение при тактовой частоте 3 ГГц, что фактически в четыре… Читать ещё >

Многоядерные модульные процессоры второго поколения (реферат, курсовая, диплом, контрольная)

Следующее поколение многоядерных процессоров, провозглашенных фирмой Intel как второе поколение Intel Core, реализовано на основе новой микроархитектуры Sandy Bridge.

Процессоры с микроархитектурой Sandy Bridge были анонсированы 3 января 2011 г. и реализованы на основе технологической нормы 32 нм. Четырехъядерный процессор Sandy Bridge с графическим ядром и 8-мегабайтным кэшем третьего уровня содержит 995 млн транзисторов.

Эта микроархитектура — дальнейшее развитие микроархитектуры Nehalem, в которую было введено большое количество усовершенствований. Количество ядер у различных модификаций процессоров может колебаться от 1 до 8. Как и Nehalem, Sandy Bridge имеет три уровня кэш-памяти, причем объем кэш-памяти третьего уровня у разных представителей может колебаться от 1—1,5 Мбайта (у простейших одноядерных процессоров Celeron) до 20 Мбайт (восьмиядерные процессоры для серверов). Процессоры имеют интегрированные усовершенствованные двухканальный контроллер памяти, контроллер системной шины (образуют встроенный в чип так называемый северный мост набора системной логики) и графический процессор. Но если в процессорах Nehalem графический процессор вводился только для отдельных моделей и выполнялся на отдельном кристалле, то теперь он был реализован как дополнительное ядро процессора, реализуемое в едином технологическом процессе и имеющее, как и все процессорные ядра, доступ к кэшу третьего уровня. Графическое ядро ориентировано на аппаратное декодирование и кодирование видео, и в его состав входит в зависимости от модели процессора 6 или 12 исполнительных блоков.

Все элементы процессора (процессорные ядра и графическое ядро, кэш третьего уровня) объединены с помощью 256-битной межкомпонентной кольцевой шины. Шина состоит из четырех 32-байтных колец: шины данных, шины запросов, шины мониторинга состояния и шины подтверждения. Производительность кольцевой шины достигает 96 Гбайт в секунду на соединение при тактовой частоте 3 ГГц, что фактически в четыре раза превышает показатели процессоров предыдущего поколения.

Введение

кольцевой шины позволило уменьшить время обращения к кэшу третьего уровня.

В процессорах реализован новый расширенный набор векторных команд A VX (.Advanced Vector Extension), который обеспечивает более высокое быстродействие в мультимедийных задачах и операциях с плавающей точкой. Эти команды выполняют векторные вычисления над 256-битными операндами с плавающей точкой, для чего разрядность соответствующих вычислительных блоков процессорных ядер увеличена вдвое. (В микроархитектуре Nehalem аналогичные вычислительные блоки выполняли обработку 128-битных операндов.).

В процессорное ядро введен кэш микроопераций ранее декодированных команд, обеспечивающий хранение около 1500 микроопераций средней длины. Если обнаруживается, что выполняемая микрооперация в декодированном виде имеется в кэше, она берется оттуда. Это приводит к дополни тельной экономии энергии и улучшает пропускную способность команд.

В процессоре Sandy Bridge реализован новый режим — Turbo Boost (дословно — турборазгон), заключающийся в увеличении тактовой частоты выше номинальной при условии сохранения ограничения по допустимой мощности, температуре и току. Для управления этим режимом введен специальный блок, автоматически следящий за потребляемой мощностью процессора и обеспечивающий разгон тактовой частоты одного или нескольких ядер. За счет сэкономленной энергии от незагруженных ядер тактовая частота активного ядра повышается с фиксированным шагом 133 МГц относительно базовой частоты. Возможен также разгон частоты всех ядер, но на короткое время, в течение которого процессор не успевает перегреться.

Рост производительности процессоров Sandy Bridge по сравнению с их предшественниками Nehalem во многом зависит от решаемой задачи. Естественно, что для задач, связанных с реализацией компьютерной графики, прирост будет выше, чем для обычных вычислительных задач. В целом же в зависимости от задачи рост производительности оценивается в 20—40%.

У фирмы AMD вторым поколением модульных многоядерных процессоров стало семейство процессоров, выполненных на основе микроархитектуры Bulldozer. Процессоры этого семейства имеют полностью переработанную архитектуру по сравнению с предыдущими поколениями процессоров AMD, до 16 ядер, увеличенный объем кэш-памяти третьего уровня. Как и процессоры Sandy Bridge, они поддерживают набор команд AVX и имеют интегрированное в кристалл графическое ядро. В процессорах введена улучшенная технология передачи данных на основе четырехканальной шины HyperTransport 3.0. Характерной особенностью микроархитектуры процессоров стал вычислительный процессорный модуль. Модуль Bulldozer рассчитан на обработку четырех микроопераций за такт — также, как и ядро Sandy Bridge. Исполнительная часть модуля состоит из двух ядер: кластеров целочисленных исполнительных устройств и одного кластера для MMX-операций и операций с плавающей точкой, у каждого кластера свой блок — планировщик. При этом блоки, обеспечивающие выборку и формирование очереди команд, их дешифрацию, предсказание переходов — общие для всей исполнительной части. Поэтому говорить о том, что модуль Bulldozer содержит два полноценных процессорных ядра нельзя. Инженеры AMD сознательно пошли на упрощение процессорного ядра с целью поднятия тактовой частоты. Основной выигрыш такой конфигурации процессора появляется при многопоточной обработке, когда один поток команд затем разделяется на два потока декодированных микроопераций, выполняемых двумя исполнительными ядрами.

При многопоточной обработке один модз’ль Bulldozer должен был превосходить по производительности одно ядро Sandy Bridge. Однако при реализации процессора в виде кремниевого кристалла существенно поднять тактовую частоту не удалось. Поэтому в целом производительность процессоров, выполненных на основе микроархитектуры Bulldozer, уступала производительности процессоров Sandy Bridge.

Показать весь текст
Заполнить форму текущей работой