Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Содержание:
Введение……………………………………………………………………4
Вывод………………………………………………………………………19
Список использованной литературы…………………………………….20
Введение
Core 2 шестое поколение микропроцессоров архитектуры x86-64 корпорации Intel, основанное на процессорной архитектуре Core. Это потомок микроархитектуры Intel P6, на которой, начиная с процессора Pentium Pro, построено большинство микропроцессоров Intel, исключая процессоры с архитектурой NetBurst. Введя новый бренд, от названий Pentium и Celeron Intel не отказалась, в 2007 году переведя их также на микроархитектуру Core, и на данный момент доступны процессоры Pentium Dual-Core (не путать с Pentium D) и Core Celeron (400-я серия). Но теперь воссоединились мобильные и настольные серии продуктов (разделившиеся на Pentium M и Pentium 4 в 2003 году).
Первые процессоры Core 2 официально представлены 27 июля 2006 года. Также как и их предшедственники, процессоры Core, они делятся на модели Solo (одноядерные), Duo (двухъядерные), Quad (четырёхъядерные) и Extreme (двух- или четырёхъядерные с повышенной частотой и разблокированным множителем). Процессоры получили следующие кодовые названия Conroe (двухъядерные процессоры для настольного сегмента), Merom (для портативных ПК), Kentsfield (четырёхъядерный Conroe) и Penryn (Merom, выполненный по 45 нанометровому техпроцессу). Хотя процессоры «Woodcrest» также основаны на архитектуре Core, они выпускаются под маркой Xeon. С декабря 2006 года все процессоры Core 2 Duo производятся на пластинах диаметром 300 миллиметров на заводе Fab 12 в Аризоне, США и на заводе Fab 24-2 в County Kildare, Ирландия.
Core 2 Duo вставляются в разъем LGA775, но совместимы только с новейшими, на 2007 год, материнскими платами. Core 2 Duo поддерживают материнские платы со следующими чипсетами: Intel 865PE, Intel 945P/PL/G, Intel 955X, Intel 975X, Intel P/G/Q965, Intel Q963, Intel 946GZ/PL; ATi Radeon Xpress 200, ATi RD600 и RS600; nForce 4 SLI Intel Edition, nForce 570/590 Intel Edition and nForce 680i/650i; VIA PT880/PT880 Ultra, VIA PT890, VIA PM880 и PM890; SiS662. Кроме того, материнская плата должна обязательно поддерживать спецификацию питания VRD 11.0 и иметь соответствующую версию BIOS (ранние версии BIOSа некоторых материнских плат с описанными выше условиями могут не определить процессор).
Intel выпустила три процессорных дизайна, производные от одной и той же двуядерной архитектуры: Conroe для настольных ПК, Merom для мобильных и Woodcrest для серверов. Каждый чип будет производиться по 65-нм техпроцессу. И хотя три модели практически идентичны технически, ряд функций был включён только для того или иного сегмента. Высокие тактовые частоты только в high-end настольных ПК и в серверах. Для всего остального главной целью является высокая эффективность, независимая от тактовой частоты. Она достигается повышением пропускной способности и ширины конвейера.
Новая микро-архитектура получила название Core Micro Architecture. Её можно охарактеризовать пятью ключевыми чертами: широкое динамическое исполнение (Wide Dynamic Execution), улучшенная работа с цифровым медиа-содержанием (Advanced Digital Media Boost), улучшенный "умный" кэш (Advanced Smart Cache), "умный" доступ к памяти (Smart Memory Access) и интеллектуальная система управления энергопотреблением (Intelligent Power Capability).
Core Micro Architecture по-прежнему основывается на дизайне с изменением последовательности выполнения команд (out-of-order execution), при этом инструкции проходят через планировщик и выполняются на 14-ступенчатом конвейере. Чтобы повысить эффективность, Intel сфокусировалась на реализации гибкого выполнения инструкций. Звучит просто, но вычислительные машины IA зависят от чёткого порядка выполнения инструкций с памятью, соответствующего семантике программы.
Число одновременно выполняемых инструкций было увеличено с помощью трёх АЛУ (арифметическо-логическое устройство), способных выполнять 128-битные инструкции SSE в один такт. Кроме того, улучшенный кэш L2 (общий дизайн и новые блоки предварительной выборки, работающие по принципу устранения неоднозначностей памяти, то есть предварительно выбирающие только те данные, которые не будут меняться другими инструкциями в очереди) помогает заполнять конвейер более эффективно.
Некоторые сравнивают архитектуру Core с Pentium III. Но Intel всё же построила совершенно новую архитектуру, поскольку Core использует встроенное декодирование (inline decoding), которого не было у Pentium III. Кроме того, в процессоре три АЛУ, а у Pentium III было всего одно (в архитектуре NetBurst их три). Кэш с отслеживаниями (trace cache) полностью исчез.
Технология широкого динамического выполнения (Wide Dynamic Execution) собирала в себя все улучшения, которые Intel внесла касательно ширины выполнения (четыре параллельных процесса вместо трёх) и эффективности работы с микро-операциями (micro-ops).
Как можно видеть на рисунке 1, более широкая ширина из четырёх потоков (а частично даже из пяти) соблюдается на всём пути выполнения, то есть налицо внутреннее увеличение пропускной способности. Другими словами, процессор может выбирать (fetch), выдавать (dispatch), выполнять (execute) и возвращать (return) четыре инструкции одновременно.
Рисунок 1- Wide Dynamic Execution
Conroe (рис.2) использует Socket 775. Ему потребуется либо чипсет 975X (для игр), либо чипсет 965 (для "цифрового дома" и "цифрового офиса").
Рисунок 2 - Conroe
Идея слияния микро-операций была реализована и на уровне инструкций x86 (параллелизм на уровне инструкций), позволяя двум независимым инструкциям сливаться для ступеней декодирования и выполнения. Эта функция, называемая Macro Ops Fusion, перешла даже и на АЛУ: последние обеспечивают выполнение инструкций за один такт, будь то две слитые воедино инструкции или простые.
АЛУ обычно разбивает инструкции на два блока, что приводит к двум микро-операциям и, соответственно, двум тактам выполнения. Intel решила расширить ширину выполнения трёх АЛУ до 128 бит, что позволяет обрабатывать за один такт восемь блоков с одинарной точностью или четыре блока с двойной точностью. Эта функция была названа улучшенной работой с цифровым медиа-содержанием (Advanced Digital Media Boost), поскольку она касается и инструкций SSE. Здесь мы подходим к выполнению команд SSE за один такт (Single Cycle SSE). Например, можно объединить четыре 32-битных вектора в один 128-битный блок.
Единый кэш L2 (рис.3). Два ядра совместно используют кэш объёмом 2 или 4 Мбайт. Кэширование производится более эффективно, ведь данные не нужно хранить по два раза в отдельных кэшах L2 (дублировать). Кэш L2 полностью динамический и способен адаптироваться под нагрузку каждого ядра. Например, одно ядро может динамически забрать 100% кэша L2, если это требуется (строчка за строчкой).
Да и обмен данными между ядрами теперь производится более эффективно, поскольку процессорная шина при этом не нагружается. И задержки, если два ядра пытаются получить доступ к шине, теперь не происходит. В качестве хорошего примера можно привести многопоточное окружение, когда одно ядро записывает в кэш, а второе ядро может в это время что-либо считывать из него. Снижаются промахи кэша, снижаются задержки, да и доступ теперь происходит быстрее, ведь раньше "узким местом" являлась FSB.
Рисунок 3 Dynamic L2 Cache Usage
После разработки, без сомнения, более эффективной процессорной архитектуры и мощного кэша L2 Intel создала условия, чтобы они использовались в полной мере. Каждый двуядерный процессор Core оснащён восемью блоками предварительной выборки (prefetch): два блока выборки данных и один блок выборки инструкций на ядро, а также два блока выборки в общем кэше L2. Как утверждает Intel, блоки можно оптимизировать для каждой из моделей Core (Merom/Conroe/Woodcrest), в результате чего они будут по-разному выполнять предварительную выборку для секторов мобильных, настольных или серверных вычислений.
Блок предварительной выборки предоставляет данные вышестоящим блокам, используя сложные алгоритмы предсказания. Он должен запросить данные, которые вероятно будут использоваться в ближайшем времени, что снижает задержки и повышает эффективность. Блоки предварительной выборки памяти постоянно оценивают картину использования памяти, пытаясь предсказать будущие запросы и закачать соответствующие данные в кэш L2. В то же время, блоки предварительной выборки должны следить за потоковым трафиком, кэшировать который смысла не имеет.
Процессор по-прежнему использует системную шину (FSB), а контроллер памяти встроен в северный мост.
Intel Core 2 Duo на базе ядра Conroe (рис.4) (65 нм технология, 291 млн транзисторов) были представлены в вариантах E6300 (1,86 ГГц), E6400 (2,13 ГГц), E6600 (2,40 ГГц), E6700 (2,66 ГГц), при этом дешевые модели (E6300 и E6400) выпускаются с урезанной до 2 Мб общей для 2 ядер кэш-памятью 2 уровня, в отличии от 4 Мб у E6600 и E6700. Объединение кэш-памяти ядер позволяет более эффективно использовать ресурсы процессора.
Рисунок 4 - Intel Core 2 Duo на базе ядра Conroe
Intel Core 2 Duo на базе ядра Merom, предназначенный для мобильных процессоров, выпускается в следующих вариантах: T5200 с частотой 1,60 ГГц, T5500 с 1,66 ГГц, T5600 с 1,83 ГГц, T7200 2,00 ГГц, T7400 2,16 ГГц, T7600 2,33 ГГц. Более дешевые T5x00 имеют 2 Мб общей для двух ядер кэш-памяти второго уровня, более дорогие T7x00 4 Мб.
Intel Core 2 Extreme построен на ядре Conroe XE и призван заменить такие процессоры как Pentium 4 Extreme Edition и двуядерные Pentium Extreme Edition. Core 2 Extreme имеет тактовую частоту 2.93 ГГц и 1066 МГц FSB, хотя сначала ожидалось 3.33 ГГц и 1333 МГц соответственно. Тепловыделение этого семейства составляет 75-80 ватт при максимальной нагрузке X6800 не греется выше 45° C , а с включенным SpeedStep средняя температура простоя составляет 25° C.
Процессоры Intel Core 2 Duo работают на эффективной частоте процессорной шины 1066 МГц (пропускная способность 8.5 Гбайт/с) и 667 МГц (мобильные процессоры), поддерживают оперативную память DDR2 SDRAM, работающую на эффективной частоте 800 МГц и выше. Объем кэш-памяти первого уровня составляет 64 Кб (по 32 Кб на инструкции и данные).
Для поддержки Core 2 Duo (рис.5) от системных плат требуется возможность тактования фронтальной шины на частоте 1067 МГц.
Рисунок 5 микроархитектура Intel Core 2 Duo
Краткое сравнение микроархитектур: Intel Core и AMD K8
Естественно, основными соперниками для процессоров, построенных на базе микроархитетуры Core, выступают процессоры AMD, базирующиеся на микроархитектуре K8. Ведь именно эти процессоры следует считать самыми прогрессивными на тот момент. Сравнение новой микроархитектуры Intel на фоне старой микроархитектуры AMD наглядно представлено в таблице 1.
Таблица 1 сравнение Intel Core и AMD K8
Intel Core |
AMD K8 |
|
L1 кеш данных |
32 Кбайта |
64 Кбайта |
L1 кеш инструкций |
32 Кбайта |
64 Кбайта |
Латентность кеша L1 |
3 цикла |
3 цикла |
Ассоциативность L1 кеша |
8-way |
2-way |
Размер L1 TLB |
Инструкции 128 вхождений |
Инструкции 32 вхождения |
Данные 256 вхождений |
Данные 32 вхождения |
|
Максимальный размер L2 кеша |
4 Мбайта на два ядра |
1 Мбайт на каждое ядро |
Латентность кеша L2 |
14 циклов |
12 циклов |
Ассоциативность L2 кеша |
16-way |
16-way |
Ширина шины L2 кеша |
256 бит |
128 бит |
Размер L2 TLB |
- |
512 вхождений |
Длина конвейера |
14 стадий |
12 стадий |
Число x86 декодеров |
1 сложный и 3 простых |
3 сложных |
Целочисленные исполнительные устройства |
3 ALU + 2 AGU |
3 ALU + 3AGU |
Load/Store устройства |
2 (1 Load + 1 Store) |
2 |
FP исполнительные устройства |
FADD + FMUL + FLOAD + FSTORE |
FADD + FMUL + FSTORE |
SSE исполнительные устройства |
3 (128-битные) |
3 (64-битные) |
Из приведённой таблицы ясно уже многое. А самое главное, это то, что процессоры с микроархитектурой Core имеют более "широкую" архитектуру, позволяющую выполнять больше инструкций за такт, нежели процессоры с микроархитектурой K8. Хотя исполнительные устройства процессоров с обеими конкурирующими архитектурами способны выполнять до трёх целочисленных x86 и x87 команд за такт, микроархитектура Core показывает подавляющее преимущество на SSE операциях. В то время как процессоры K8 могут совершать за один такт лишь одну или две 128-битные команды, Core может выполнить до трёх таких команд.
Кроме того, преимущество микроархитектуры Core кроется в гораздо более совершенной системе декодирования кода. Вместе с тем, что число декодеров в этом процессоре доведено до четырёх, применение технологии macrofusion может позволить обеспечить декодирование до пяти инструкций за такт (в идеальном случае). Процессоры же конкурента не способны на декодирование более трёх инструкций одновременно. Всё это позволяет говорить о том, что декодеры процессоров с микроархитектурой Core могут более полно загружать исполнительные устройства этого процессора, выполняя в наиболее благоприятных для процессора условиях до четырёх команд за такт и превышая общий темп исполнения команд процессорами с микроархитектурой K8 на 33%.
К этому остаётся добавить и более эффективные алгоритмы работы с данными, присутствующие в процессорах семейства Core. Преимущества этой микроархитектуры заметны в первую очередь при рассмотрении системы кеширования данных. L1 кеш Core, хотя и имеет меньший размер, но может похвастать более высокой степенью ассоциативности. А L2 кеш просто имеет больший объём и более высокую пропускную способность. При этом разделяемое строение кеш-памяти второго уровня способно также получить дополнительные преимущества при многопоточной нагрузке.
Важным дополнением алгоритмов предварительной выборки данных, присутствующих в процессорах, построенных на основе микроархитектуры Core, следует считать и не имеющую аналогов в процессорах конкурента технологию memory disambiguation, позволяющую считать процессоры Intel более out-of-order (внеочередными с точки зрения кода).
Фактически, единственным остающимся после появления микроархитектуры Core неоспоримым преимуществом AMD K8 следует считать лишь интегрированный контроллер памяти, который, несомненно, способен обеспечить более низкую латентность при работе с данными.
Следует отметить, что линейка Core 2 Duo будет расширена и моделью процессора "Extreme Edition" (рис.7). Такой CPU будет называться Core 2 Extreme и его рейтинг будет иметь вид XXXXX. Основным отличием Core 2 Extreme от Core 2 Duo (помимо экстремально высокой цены) станет повышенная тактовая частота.
Полностью линейка процессоров Conroe на начальный момент имела вид представленый в Таблице 2.
Таблица 2 процессоры на базе ядра Conroe
Процессор |
Тактовая частота, ГГц |
Размер L2 кеша, Мбайт |
Частота шины, МГц |
Типичное тепловыделение, Вт |
Стоимость, $ |
Core 2 Extreme X6800 |
2.93 |
4 |
1066 |
75 |
999 |
Core 2 Duo E6700 |
2.67 |
4 |
1066 |
65 |
530 |
Core 2 Duo E6600 |
2.4 |
4 |
1066 |
65 |
316 |
Core 2 Duo E6400 |
2.13 |
2 |
1066 |
65 |
224 |
Core 2 Duo E6300 |
1.86 |
2 |
1066 |
65 |
183 |
Таблица 3 сравнение процессоров по некоторым параметрам
Процессор |
Pentium D 805 |
Pentium D 915 |
Pentium D 930 |
Pentium D 940 |
Pentium E2140 |
Pentium E2160 |
Core 2 Duo E4400 |
Athlon X2 BE-2350 |
Athlon 64 X2 5000+ |
Технология пр-ва |
90 нм |
65 нм |
65 нм |
65 нм |
65 нм |
65 нм |
65 нм |
65 нм |
90 нм |
Частота ядра, ГГц |
2.66 |
2.8 |
3.0 |
3.2 |
1.6 |
1.8 |
2.0 |
2.1 |
2.6 |
Кол-во ядер |
2 |
2 |
2 |
2 |
2 |
2 |
2 |
2 |
2 |
Кэш L2*, КБ |
2x1024 |
2x2048 |
2x2048 |
2x2048 |
1024 |
1024 |
2048 |
2x512 |
2x512 |
Частота шины**, МГц |
533 (QP) |
800 (QP) |
800 (QP) |
800 (QP) |
800 (QP) |
800 (QP) |
800 (QP) |
2x800 (DDR2) |
2x800 (DDR2) |
Коэфф. умножения |
20 |
14 |
15 |
16 |
8 |
9 |
10 |
10.5 |
13 |
Сокет |
LGA775 |
LGA775 |
LGA775 |
LGA775 |
LGA775 |
LGA775 |
LGA775 |
AM2 |
AM2 |
Тепловыделение*** |
95 Вт |
95 Вт |
95 Вт |
95 Вт |
65 Вт |
65 Вт |
65 Вт |
45 Вт |
89 Вт |
AMD64/EM64T |
+ |
+ |
+ |
+ |
+ |
+ |
+ |
+ |
+ |
VT |
|
|
+ |
+ |
|
|
|
+ |
+ |
* «2x…», имеется в виду «по … на каждое ядро»;
** у процессоров AMD частота шины контроллера памяти;
*** у процессоров Intel и AMD указывается по-разному, поэтому сравнивать напрямую некорректно.
Таблица 4. Характеристики процессоров AMD Athlon 64 X2 5000+ и Intel Core 2 Duo E6600
Процессор |
AMD Athlon 64 X2 |
Intel Core 2 Duo |
Модель |
5000+ |
E6600 |
Частота, МГц |
2600 |
2400 |
Системная шина, частота, МГц/ |
HyperTransport/2000/8 |
Quad Pumped Bus/1067/8,5 |
Количество ядер |
2 |
2 |
Максимальная температура, °С |
55-70 |
60 |
TDP, Вт |
89 |
65 |
L1 Cache инструкций, Кбайт |
2x64 |
2x32 |
L1 Cache данных, Кбайт |
2x64 |
2x32 |
L2 Cache, Кбайт |
2x512 |
4096 |
Технология энергосбережения |
CoolnQuiet |
Enhanced Intel Speed Step |
Набор SIMD-инструкций |
SSE 3 |
SSE 3 |
Техпроцесс |
90-нм SOI |
65-нм |
Процессорный разъем |
Socket AM2 |
LGA775 |
3. Аналитический обзор
Если сравнивать модели процессоров в пределах одной микроархитектуры, то можно с легкостью увидеть разницу по характеристикам как по тактовой частоте (рис.6) так и по цене (рис.7). Кстати Core 2 Extreme X6800 первый серверный процессор который дает значительные результаты в сравнении с домашним, соответствует своему предназначению и затребованной на него цене.
Рисунок 6 Тактовая частота Core 2 Duo
Рисунок 7 Ценовой диапазон Core 2 Duo
Сравнение с основным конкурентом Athlon 64, дает нам увидеть что хоть число транзисторов и увеличилось, размер кристалла стал только меньше (рис.8).
Рисунок 8 сравнение с Athlon 64
Коэффициент умножения это то число, на которое умножается частота системной шины, в результате чего получается рабочая (внутренняя) частота процессора.
Рисунок 9 Коэффициент умножения
Выводы
В данном курсовом проекте была рассмотрена микроархитектура Intel Core 2 Duo. Были рассмотрены все ее положительные и негативные стороны. Данная микроархитектура сравнивалась с конкурентом AMD и с предыдущей микроархитектурой Intel NetBurst.
В отличие от процессоров архитектуры NetBurst (Pentium 4 и Pentium D), в архитектуре Core 2 ставка делается не на повышениетактовой частоты, а на улучшение других параметров процессоров, таких как кэш, эффективность и количество ядер. Рассеиваемая мощность этих процессоров значительно ниже, чем у настольной линейки Pentium. С параметром TDP, равным 65 Вт, процессор Core 2 имеет наименьшую рассеиваемую мощность из всех доступных в продаже настольных чипов, в том числе на ядрах Prescott (Intel) с TDP, равным 130 Вт, и на ядрахSan Diego(AMD) с TDP, равным 89 Вт.
Новые процессоры Duo 2 Core компании Intel, построенные на основе микроархитектуры Intel Core, на то время значительно превосходили по уровню производительности решения конкурентов, единственным серьезным из которых является Advanced Micro Devices. Кроме того, можно сказать, что противник в лице AMD Athlon 64 X2 5000+, выступившего здесь в роли продолжателя славного дела процессоров с микроархитектурой AMD64, был бит его же оружием.
Особенностями процессоров Core 2 являются поддержка архитектуры EM64T, технология поддержки виртуальных x86-машинVanderpool, NX bit и набор инструкций SSSE3. Кроме того, впервые реализованы следующие технологии: LaGrande Technology, усовершенствованная технология, SpeedStep (EIST) и Active Management Technology (iAMT2).
Список использованной литературы
Изм.
ист
№ докум.
Подпись
Дата
Лист
3
ЧДТУ 14.4216.007 ПЗ
Разраб.
Кононенко
Провер.
Рудаков
Реценз.
Н. Контр.
Утверд.
Архитектура процессора Core 2 Duo
Пояснительная записка
Лит.
Листов
27
Група СКСС-1477