У вас вопросы?
У нас ответы:) SamZan.net

Архитектура процессора Core 2 Duo

Работа добавлена на сайт samzan.net:

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 27.12.2024

Содержание:

Введение……………………………………………………………………4

  1.  Архитектура процессора Core 2 Duo……………………………………..5
  2.  Сравнение с аналогами.…………………………………………………..12
  3.  Аналитический обзор……………………………………………………..17

Вывод………………………………………………………………………19

Список использованной литературы…………………………………….20


Введение

Core 2— шестое поколение микропроцессоров архитектуры x86-64 корпорации Intel, основанное на процессорной архитектуре Core. Это потомок микроархитектуры Intel P6, на которой, начиная с процессора Pentium Pro, построено большинство микропроцессоров Intel, исключая процессоры с архитектурой NetBurst. Введя новый бренд, от названий Pentium и Celeron Intel не отказалась, в 2007 году переведя их также на микроархитектуру Core, и на данный момент доступны процессоры Pentium Dual-Core (не путать с Pentium D) и Core Celeron (400-я серия). Но теперь воссоединились мобильные и настольные серии продуктов (разделившиеся на Pentium M и Pentium 4 в 2003 году).

Первые процессоры Core 2 официально представлены 27 июля 2006 года. Также как и их предшедственники, процессоры Core, они делятся на модели Solo (одноядерные), Duo (двухъядерные), Quad (четырёхъядерные) и Extreme (двух- или четырёхъядерные с повышенной частотой и разблокированным множителем). Процессоры получили следующие кодовые названия— Conroe (двухъядерные процессоры для настольного сегмента), Merom (для портативных ПК), Kentsfield (четырёхъядерный Conroe) и Penryn (Merom, выполненный по 45 нанометровому техпроцессу). Хотя процессоры «Woodcrest» также основаны на архитектуре Core, они выпускаются под маркой Xeon. С декабря 2006 года все процессоры Core 2 Duo производятся на пластинах диаметром 300 миллиметров на заводе Fab 12 в Аризоне, США и на заводе Fab 24-2 в County Kildare, Ирландия.

  1.  
    Архитектура процессора
    Core 2 Duo

Core 2 Duo вставляются в разъем LGA775, но совместимы только с новейшими, на 2007 год, материнскими платами. Core 2 Duo поддерживают материнские платы со следующими чипсетами: Intel 865PE, Intel 945P/PL/G, Intel 955X, Intel 975X, Intel P/G/Q965, Intel Q963, Intel 946GZ/PL; ATi Radeon Xpress 200, ATi RD600 и RS600; nForce 4 SLI Intel Edition, nForce 570/590 Intel Edition and nForce 680i/650i; VIA PT880/PT880 Ultra, VIA PT890, VIA PM880 и PM890; SiS662. Кроме того, материнская плата должна обязательно поддерживать спецификацию питания VRD 11.0 и иметь соответствующую версию BIOS (ранние версии BIOS’а некоторых материнских плат с описанными выше условиями могут не определить процессор).

Intel выпустила три процессорных дизайна, производные от одной и той же двуядерной архитектуры: Conroe для настольных ПК, Merom для мобильных и Woodcrest для серверов. Каждый чип будет производиться по 65-нм техпроцессу. И хотя три модели практически идентичны технически, ряд функций был включён только для того или иного сегмента. Высокие тактовые частоты только в high-end настольных ПК и в серверах. Для всего остального главной целью является высокая эффективность, независимая от тактовой частоты. Она достигается повышением пропускной способности и ширины конвейера.

Новая микро-архитектура получила название Core Micro Architecture. Её можно охарактеризовать пятью ключевыми чертами: широкое динамическое исполнение (Wide Dynamic Execution), улучшенная работа с цифровым медиа-содержанием (Advanced Digital Media Boost), улучшенный "умный" кэш (Advanced Smart Cache), "умный" доступ к памяти (Smart Memory Access) и интеллектуальная система управления энергопотреблением (Intelligent Power Capability).

Core Micro Architecture по-прежнему основывается на дизайне с изменением последовательности выполнения команд (out-of-order execution), при этом инструкции проходят через планировщик и выполняются на 14-ступенчатом конвейере. Чтобы повысить эффективность, Intel сфокусировалась на реализации гибкого выполнения инструкций. Звучит просто, но вычислительные машины IA зависят от чёткого порядка выполнения инструкций с памятью, соответствующего семантике программы.

Число одновременно выполняемых инструкций было увеличено с помощью трёх АЛУ (арифметическо-логическое устройство), способных выполнять 128-битные инструкции SSE в один такт. Кроме того, улучшенный кэш L2 (общий дизайн и новые блоки предварительной выборки, работающие по принципу устранения неоднозначностей памяти, то есть предварительно выбирающие только те данные, которые не будут меняться другими инструкциями в очереди) помогает заполнять конвейер более эффективно.

Некоторые сравнивают архитектуру Core с Pentium III. Но Intel всё же построила совершенно новую архитектуру, поскольку Core использует встроенное декодирование (inline decoding), которого не было у Pentium III. Кроме того, в процессоре три АЛУ, а у Pentium III было всего одно (в архитектуре NetBurst их три). Кэш с отслеживаниями (trace cache) полностью исчез.

Технология широкого динамического выполнения (Wide Dynamic Execution) собирала в себя все улучшения, которые Intel внесла касательно ширины выполнения (четыре параллельных процесса вместо трёх) и эффективности работы с микро-операциями (micro-ops).

Как можно видеть на рисунке 1, более широкая ширина из четырёх потоков (а частично даже из пяти) соблюдается на всём пути выполнения, то есть налицо внутреннее увеличение пропускной способности. Другими словами, процессор может выбирать (fetch), выдавать (dispatch), выполнять (execute) и возвращать (return) четыре инструкции одновременно.

Рисунок 1- Wide Dynamic Execution

Conroe (рис.2) использует Socket 775. Ему потребуется либо чипсет 975X (для игр), либо чипсет 965 (для "цифрового дома" и "цифрового офиса").

Рисунок 2 - Conroe

Идея слияния микро-операций была реализована и на уровне инструкций x86 (параллелизм на уровне инструкций), позволяя двум независимым инструкциям сливаться для ступеней декодирования и выполнения. Эта функция, называемая Macro Ops Fusion, перешла даже и на АЛУ: последние обеспечивают выполнение инструкций за один такт, будь то две слитые воедино инструкции или простые.

АЛУ обычно разбивает инструкции на два блока, что приводит к двум микро-операциям и, соответственно, двум тактам выполнения. Intel решила расширить ширину выполнения трёх АЛУ до 128 бит, что позволяет обрабатывать за один такт восемь блоков с одинарной точностью или четыре блока с двойной точностью. Эта функция была названа улучшенной работой с цифровым медиа-содержанием (Advanced Digital Media Boost), поскольку она касается и инструкций SSE. Здесь мы подходим к выполнению команд SSE за один такт (Single Cycle SSE). Например, можно объединить четыре 32-битных вектора в один 128-битный блок.

Единый кэш L2 (рис.3). Два ядра совместно используют кэш объёмом 2 или 4 Мбайт. Кэширование производится более эффективно, ведь данные не нужно хранить по два раза в отдельных кэшах L2 (дублировать). Кэш L2 полностью динамический и способен адаптироваться под нагрузку каждого ядра. Например, одно ядро может динамически забрать 100% кэша L2, если это требуется (строчка за строчкой).

Да и обмен данными между ядрами теперь производится более эффективно, поскольку процессорная шина при этом не нагружается. И задержки, если два ядра пытаются получить доступ к шине, теперь не происходит. В качестве хорошего примера можно привести многопоточное окружение, когда одно ядро записывает в кэш, а второе ядро может в это время что-либо считывать из него. Снижаются промахи кэша, снижаются задержки, да и доступ теперь происходит быстрее, ведь раньше "узким местом" являлась FSB.

Рисунок 3 – Dynamic L2 Cache Usage

После разработки, без сомнения, более эффективной процессорной архитектуры и мощного кэша L2 Intel создала условия, чтобы они использовались в полной мере. Каждый двуядерный процессор Core оснащён восемью блоками предварительной выборки (prefetch): два блока выборки данных и один блок выборки инструкций на ядро, а также два блока выборки в общем кэше L2. Как утверждает Intel, блоки можно оптимизировать для каждой из моделей Core (Merom/Conroe/Woodcrest), в результате чего они будут по-разному выполнять предварительную выборку для секторов мобильных, настольных или серверных вычислений.

Блок предварительной выборки предоставляет данные вышестоящим блокам, используя сложные алгоритмы предсказания. Он должен запросить данные, которые вероятно будут использоваться в ближайшем времени, что снижает задержки и повышает эффективность. Блоки предварительной выборки памяти постоянно оценивают картину использования памяти, пытаясь предсказать будущие запросы и закачать соответствующие данные в кэш L2. В то же время, блоки предварительной выборки должны следить за потоковым трафиком, кэшировать который смысла не имеет.

Процессор по-прежнему использует системную шину (FSB), а контроллер памяти встроен в северный мост.

Intel Core 2 Duo на базе ядра Conroe (рис.4) (65 нм технология, 291 млн транзисторов) были представлены в вариантах E6300 (1,86 ГГц), E6400 (2,13 ГГц), E6600 (2,40 ГГц), E6700 (2,66 ГГц), при этом дешевые модели (E6300 и E6400) выпускаются с урезанной до 2 Мб общей для 2 ядер кэш-памятью 2 уровня, в отличии от 4 Мб у E6600 и E6700. Объединение кэш-памяти ядер позволяет более эффективно использовать ресурсы процессора.

Рисунок 4 - Intel Core 2 Duo на базе ядра Conroe

Intel Core 2 Duo на базе ядра Merom, предназначенный для мобильных процессоров, выпускается в следующих вариантах: T5200 с частотой 1,60 ГГц, T5500 с 1,66 ГГц, T5600 с 1,83 ГГц, T7200 — 2,00 ГГц, T7400 — 2,16 ГГц, T7600 — 2,33 ГГц. Более дешевые T5x00 имеют 2 Мб общей для двух ядер кэш-памяти второго уровня, более дорогие T7x00 — 4 Мб.

Intel Core 2 Extreme построен на ядре Conroe XE и призван заменить такие процессоры как Pentium 4 Extreme Edition и двуядерные Pentium Extreme Edition. Core 2 Extreme имеет тактовую частоту 2.93 ГГц и 1066 МГц FSB, хотя сначала ожидалось 3.33 ГГц и 1333 МГц соответственно. Тепловыделение этого семейства составляет 75-80 ватт — при максимальной нагрузке X6800 не греется выше 45° C , а с включенным SpeedStep средняя температура простоя составляет 25° C.

Процессоры Intel Core 2 Duo работают на эффективной частоте процессорной шины 1066 МГц (пропускная способность 8.5 Гбайт/с) и 667 МГц (мобильные процессоры), поддерживают оперативную память DDR2 SDRAM, работающую на эффективной частоте 800 МГц и выше. Объем кэш-памяти первого уровня составляет 64 Кб (по 32 Кб на инструкции и данные).

Для поддержки Core 2 Duo (рис.5) от системных плат требуется возможность тактования фронтальной шины на частоте 1067 МГц.

Рисунок 5 – микроархитектура Intel Core 2 Duo 

  1.  
    Сравнение с аналогами

Краткое сравнение микроархитектур: Intel Core и AMD K8

Естественно, основными соперниками для процессоров, построенных на базе микроархитетуры Core, выступают процессоры AMD, базирующиеся на микроархитектуре K8. Ведь именно эти процессоры следует считать самыми прогрессивными на тот момент. Сравнение новой микроархитектуры Intel на фоне старой микроархитектуры AMD наглядно представлено в таблице 1.

Таблица 1 – сравнение Intel Core и AMD K8

Intel Core

AMD K8

L1 кеш данных

32 Кбайта

64 Кбайта

L1 кеш инструкций

32 Кбайта

64 Кбайта

Латентность кеша L1

3 цикла

3 цикла

Ассоциативность L1 кеша

8-way

2-way

Размер L1 TLB

Инструкции – 128 вхождений

Инструкции – 32 вхождения

Данные – 256 вхождений

Данные – 32 вхождения

Максимальный размер L2 кеша

4 Мбайта на два ядра

1 Мбайт на каждое ядро

Латентность кеша L2

14 циклов

12 циклов

Ассоциативность L2 кеша

16-way

16-way

Ширина шины L2 кеша

256 бит

128 бит

Размер L2 TLB

-

512 вхождений

Длина конвейера

14 стадий

12 стадий

Число x86 декодеров

1 сложный и 3 простых

3 сложных

Целочисленные исполнительные устройства

3 ALU + 2 AGU

3 ALU + 3AGU

Load/Store устройства

2 (1 Load + 1 Store)

2

FP исполнительные устройства

FADD + FMUL + FLOAD + FSTORE

FADD + FMUL + FSTORE

SSE исполнительные устройства

3 (128-битные)

3 (64-битные)

Из приведённой таблицы ясно уже многое. А самое главное, это то, что процессоры с микроархитектурой Core имеют более "широкую" архитектуру, позволяющую выполнять больше инструкций за такт, нежели процессоры с микроархитектурой K8. Хотя исполнительные устройства процессоров с обеими конкурирующими архитектурами способны выполнять до трёх целочисленных x86 и x87 команд за такт, микроархитектура Core показывает подавляющее преимущество на SSE операциях. В то время как процессоры K8 могут совершать за один такт лишь одну или две 128-битные команды, Core может выполнить до трёх таких команд.

Кроме того, преимущество микроархитектуры Core кроется в гораздо более совершенной системе декодирования кода. Вместе с тем, что число декодеров в этом процессоре доведено до четырёх, применение технологии macrofusion может позволить обеспечить декодирование до пяти инструкций за такт (в идеальном случае). Процессоры же конкурента не способны на декодирование более трёх инструкций одновременно. Всё это позволяет говорить о том, что декодеры процессоров с микроархитектурой Core могут более полно загружать исполнительные устройства этого процессора, выполняя в наиболее благоприятных для процессора условиях до четырёх команд за такт и превышая общий темп исполнения команд процессорами с микроархитектурой K8 на 33%.

К этому остаётся добавить и более эффективные алгоритмы работы с данными, присутствующие в процессорах семейства Core. Преимущества этой микроархитектуры заметны в первую очередь при рассмотрении системы кеширования данных. L1 кеш Core, хотя и имеет меньший размер, но может похвастать более высокой степенью ассоциативности. А L2 кеш просто имеет больший объём и более высокую пропускную способность. При этом разделяемое строение кеш-памяти второго уровня способно также получить дополнительные преимущества при многопоточной нагрузке.

Важным дополнением алгоритмов предварительной выборки данных, присутствующих в процессорах, построенных на основе микроархитектуры Core, следует считать и не имеющую аналогов в процессорах конкурента технологию memory disambiguation, позволяющую считать процессоры Intel более out-of-order (внеочередными с точки зрения кода).

Фактически, единственным остающимся после появления микроархитектуры Core неоспоримым преимуществом AMD K8 следует считать лишь интегрированный контроллер памяти, который, несомненно, способен обеспечить более низкую латентность при работе с данными.

Следует отметить, что линейка Core 2 Duo будет расширена и моделью процессора "Extreme Edition" (рис.7). Такой CPU будет называться Core 2 Extreme и его рейтинг будет иметь вид XXXXX. Основным отличием Core 2 Extreme от Core 2 Duo (помимо экстремально высокой цены) станет повышенная тактовая частота.

Полностью линейка процессоров Conroe на начальный момент имела вид представленый в Таблице 2.

Таблица 2 – процессоры на базе ядра Conroe

Процессор

Тактовая частота, ГГц

Размер L2 кеша, Мбайт

Частота шины, МГц

Типичное тепловыделение, Вт

Стоимость, $

Core 2 Extreme X6800

2.93

4

1066

75

999

Core 2 Duo E6700

2.67

4

1066

65

530

Core 2 Duo E6600

2.4

4

1066

65

316

Core 2 Duo E6400

2.13

2

1066

65

224

Core 2 Duo E6300

1.86

2

1066

65

183

Таблица 3 – сравнение процессоров по некоторым параметрам

Процессор

Pentium D 805

Pentium D 915

Pentium D 930

Pentium D 940

Pentium E2140

Pentium E2160

Core 2 Duo E4400

Athlon X2 BE-2350

Athlon 64 X2 5000+

Технология пр-ва

90 нм

65 нм

65 нм

65 нм

65 нм

65 нм

65 нм

65 нм

90 нм

Частота ядра, ГГц

2.66

2.8

3.0

3.2

1.6

1.8

2.0

2.1

2.6

Кол-во ядер

2

2

2

2

2

2

2

2

2

Кэш L2*, КБ

2x1024

2x2048

2x2048

2x2048

1024

1024

2048

2x512

2x512

Частота шины**, МГц

533 (QP)

800 (QP)

800 (QP)

800 (QP)

800 (QP)

800 (QP)

800 (QP)

2x800 (DDR2)

2x800 (DDR2)

Коэфф. умножения

20

14

15

16

8

9

10

10.5

13

Сокет

LGA775

LGA775

LGA775

LGA775

LGA775

LGA775

LGA775

AM2

AM2

Тепловыделение***

95 Вт

95 Вт

95 Вт

95 Вт

65 Вт

65 Вт

65 Вт

45 Вт

89 Вт

AMD64/EM64T

+

+

+

+

+

+

+

+

+

VT

+

+

+

+

* — «2x…», имеется в виду «по … на каждое ядро»;
** — у процессоров AMD — частота шины контроллера памяти;
*** — у процессоров Intel и AMD указывается по-разному, поэтому сравнивать напрямую некорректно.

Таблица 4. Характеристики процессоров AMD Athlon 64 X2 5000+ и Intel Core 2 Duo E6600

Процессор

AMD Athlon 64 X2

Intel Core 2 Duo

Модель

5000+

E6600

Частота, МГц

2600

2400

Системная шина, частота, МГц/
пропускная способность, Гбайт/с

HyperTransport/2000/8

Quad Pumped Bus/1067/8,5

Количество ядер

2

2

Максимальная температура, °С

55-70

60

TDP, Вт

89

65

L1 Cache инструкций, Кбайт

2x64

2x32

L1 Cache данных, Кбайт

2x64

2x32

L2 Cache, Кбайт

2x512

4096

Технология энергосбережения

Cool’n’Quiet

Enhanced Intel Speed Step

Набор SIMD-инструкций

SSE 3

SSE 3

Техпроцесс

90-нм SOI

65-нм

Процессорный разъем

Socket AM2

LGA775


3. Аналитический обзор

 Если сравнивать модели процессоров в пределах одной микроархитектуры, то можно с легкостью увидеть разницу по характеристикам как по тактовой частоте (рис.6) так и по цене (рис.7). Кстати Core 2 Extreme X6800 первый серверный процессор который дает значительные результаты в сравнении с домашним, соответствует своему предназначению и затребованной на него цене.

Рисунок 6 – Тактовая частота Core 2 Duo

Рисунок 7 – Ценовой диапазон Core 2 Duo

 Сравнение с основным конкурентом Athlon 64, дает нам увидеть что хоть число транзисторов и увеличилось, размер кристалла стал только меньше (рис.8).

Рисунок 8 – сравнение с Athlon 64

Коэффициент умножения – это то число, на которое умножается частота системной шины, в результате чего получается рабочая (внутренняя) частота процессора.

Рисунок 9 – Коэффициент умножения

Выводы

В данном курсовом проекте была рассмотрена микроархитектура Intel Core 2 Duo. Были рассмотрены все ее положительные и негативные стороны. Данная микроархитектура сравнивалась с конкурентом AMD и с предыдущей микроархитектурой Intel NetBurst.

В отличие от процессоров архитектуры NetBurst (Pentium 4 и Pentium D), в архитектуре Core 2 ставка делается не на повышениетактовой частоты, а на улучшение других параметров процессоров, таких как кэш, эффективность и количество ядер. Рассеиваемая мощность этих процессоров значительно ниже, чем у настольной линейки Pentium. С параметром TDP, равным 65 Вт, процессор Core 2 имеет наименьшую рассеиваемую мощность из всех доступных в продаже настольных чипов, в том числе на ядрах Prescott (Intel) с TDP, равным 130 Вт, и на ядрахSan Diego(AMD) с TDP, равным 89 Вт.

Новые процессоры Duo 2 Core компании Intel, построенные на основе микроархитектуры Intel Core, на то время значительно превосходили по уровню производительности решения конкурентов, единственным серьезным из которых является Advanced Micro Devices. Кроме того, можно сказать, что противник в лице AMD Athlon 64 X2 5000+, выступившего здесь в роли продолжателя славного дела процессоров с микроархитектурой AMD64, был бит его же оружием.

Особенностями процессоров Core 2 являются поддержка архитектуры EM64T, технология поддержки виртуальных x86-машинVanderpool, NX bit и набор инструкций SSSE3. Кроме того, впервые реализованы следующие технологии: LaGrande Technology, усовершенствованная технология, SpeedStep (EIST) и Active Management Technology (iAMT2).


Список использованной литературы

  1.  http://www.thg.ru/cpu/core_2_duo/core_2_duo-10.html
  2.  http://www.thg.ru/cpu/core_2_duo/index.html
  3.  http://compress.ru/article.aspx?id=16724
  4.  http://compress.ru/article.aspx?id=16962
  5.  https://ru.wikipedia.org/wiki/Core_( микроархитектура)
  6.  http://ru.wikipedia.org/wiki/Core_2
  7.  http://www.overclockers.ru/lab/22660.shtml
  8.  http://faqhard.ru/base/14/32.php
  9.  http://www.vicont.com.ua/cat181/
  10.  http://worldcomp.narod.ru/duo.html


Изм.

ист

№ докум.

Подпись

Дата

Лист

3

ЧДТУ 14.4216.007 ПЗ

Разраб.

Кононенко

Провер.

Рудаков

Реценз.

Н. Контр.

Утверд.

Архитектура процессора Core 2 Duo

Пояснительная записка

Лит.

Листов

27

Група СКСС-1477




1. Лабораторная работа 6 Тема- Методы проверок средств и систем автоматики Наименование работы- Проверка
2. Работа с программой PageMaker
3. Джироламо Савонарола против Медичи
4. 2013 г. ООО ТИМ именуемое в дальнейшем Поставщик в лице Директора Хлопова А
5. статья Н. Н. Чушкина Комментарии H.
6. Экономическая теория1
7. Об утверждении Положения о деятельности по организации торговли на рынке ценных бумаг
8. истинным знанием и мнением
9. ОПРЕДЕЛЕНИЕ РАБОТЫ ВЫХОДА ЭЛЕКТРОНА МЕТОДИЧЕСКИЕ УКАЗАНИЯ к лабораторной работе 36 по ку.
10. Сто лет одиночества- Локид; Москва; 1997 ISBN 5230002254 Аннотация Габриель Гарсия Маркес не нуждается в рек
11. Владимирский юридический институт Федеральной службы исполнения наказания Кафедра- Экономич
12. Эстетика английской лексики
13. Казанский Приволжский федеральный университет ЮРИДИЧЕСКОЕ ОТДЕЛЕНИЕ КАФЕДРА КОНСТИТУЦИОННО.html
14. I. nd Belrussin lnds becme the ren of militry ctions
15. Денежно-кредитная система в рыночной экономике
16. по теме реализуемой кампании
17. Курсовая работа- Система национальной безопасности Украины
18. РЕФЕРАТ дисертації на здобуття наукового ступеня доктора технічних наук Київ ~ Д.html
19. Культура России 2001 2005 год
20. Современная американская геополитика