Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Современные процессоры Intel и AMD.
Реферат выполнил: Волощенко А. П., гр. Э-25
Таганрогский Государственный Радиотехнический Университет
Таганрог 2005 г
Введение
Процессоры персональных компьютеров отвечают единому стандарту, который задан фирмой Intel, мировым лидером в производстве процессоров для ПК. В старых компьютерах мы можем найти процессоры типов PentiumII, Pentium III, в новейших - Pentium 4. Фирма AMD выпускает процессоры, в общем аналогичные интеловским, но называются они немного иначе: K6 (пентиум второй), К7 или Athlon (пентиум третий). Поэтому AMD приходится предугадывать будущее индустрии, иногда опережая Intel с ее полумиллиардными доходами. Предсказуемо появление новых идей у отстающей компании для нее это способ выжить. Но неожиданно то, что иногда эти идеи принимает на вооружение и Intel. Речь идет о IBM-совместимых персональных компьютерах. На нашем рынке, как, впрочем, и в мире, их подавляющее большинство. В расчёте именно на этот стандарт пишутся игры, программы и прочее.
В основе любой ПЭВМ лежит использование микропроцессоров. Он является одним из самых важнейших устройств в компьютере, которым привычно характеризуют уровень производительности ПК. Микропроцессор является "мозгом" и "сердцем" компьютера. Он осуществляет выполнение программ, работающих на компьютере, и управляет работой остальных устройств компьютера. Когда выбирают себе компьютер, первым делом выбирают себе микропроцессор, который будет соответствовать требованиям, тех или иных людей. От процессора зависит, как быстро будут запускаться программы, и даже насколько быстро будет происходить процесс архивации данных в WinRAR, не говоря уже о создании трёхмерной анимации в 3D MAX Studio. Из всего выше сказанного, я считаю, что моя тема очень актуальна и значима на сегодняшний день.
Цель моей работы состоит в том, чтобы провести сравнение нескольких самых популярных, на сегодняшний день, процессоров и выявить лидера среди них.
Функции и строение процессора
Микропроцессор - центральное устройство (или комплекс устройств) ЭВМ (или вычислительной системы), которое выполняет арифметические и логические операции, заданные программой преобразования информации, управляет вычислительным процессом и координирует работу устройств системы (запоминающих, сортировальных, ввода вывода, подготовки данных и др.). В вычислительной системе может быть несколько параллельно работающих процессоров; такие системы называют многопроцессорными. Наличие нескольких процессоров ускоряет выполнение одной большой или нескольких (в том числе взаимосвязанных) программ. Основными характеристиками микропроцессора являются быстродействие и разрядность. Быстродействие - это число выполняемых операций в секунду. Разрядность характеризует объём информации, который микропроцессор обрабатывает за одну операцию: 8-разрядный процессор за одну операцию обрабатывает 8 бит информации, 32-разрядный - 32 бита. Скорость работы микропроцессора во многом определяет быстродействие компьютера. Он выполняет всю обработку данных, поступающих в компьютер и хранящихся в его памяти, под управлением программы, также хранящейся в памяти. Персональные компьютеры оснащают центральными процессорами различных мощностей.
Функции процессора:
обработка данных по заданной программе путем выполнения арифметических и логических операций;
программное управление работой устройств компьютера.
Модели процессоров включают следующие совместно работающие устройства:
Устройство управления (УУ). Осуществляет координацию работы всех остальных устройств, выполняет функции управления устройствами, управляет вычислениями в компьютере.
Арифметико-логическое устройство (АЛУ). Так называется устройство для целочисленных операций. Арифметические операции, такие как сложение, умножение и деление, а также логические операции (OR, AND, ASL, ROL и др.) обрабатываются при помощи АЛУ. Эти операции составляют подавляющее большинство программного кода в большинстве программ. Все операции в АЛУ производятся в регистрах - специально отведенных ячейках АЛУ. В процессоре может быть несколько АЛУ. Каждое способно исполнять арифметические или логические операции независимо от других, что позволяет выполнять несколько операций одновременно. Арифметико-логическое устройство выполняет арифметические и логические действия. Логические операции делятся на две простые операции: "Да" и "Нет" ("1" и "0"). Обычно эти два устройства выделяются чисто условно, конструктивно они не разделены.
AGU (Address Generation Unit) - устройство генерации адресов. Это устройство не менее важное, чем АЛУ, т.к. оно отвечает за корректную адресацию при загрузке или сохранении данных. Абсолютная адресация в программах используется только в редких исключениях. Как только берутся массивы данных, в программном коде используется косвенная адресация, заставляющая работать AGU.
Математический сопроцессор (FPU). Процессор может содержать несколько математических сопроцессоров. Каждый из них способен выполнять, по меньшей мере, одну операцию с плавающей точкой независимо от того, что делают другие АЛУ. Метод конвейерной обработки данных позволяет одному математическому сопроцессору выполнять несколько операций одновременно. Сопроцессор поддерживает высокоточные вычисления как целочисленные, так и с плавающей точкой и, кроме того, содержит набор полезных констант, ускоряющих вычисления. Сопроцессор работает параллельно с центральным процессором, обеспечивая, таким образом, высокую производительность. Система выполняет команды сопроцессора в том порядке, в котором они появляются в потоке. Математический сопроцессор персонального компьютера IBM PC позволяет ему выполнять скоростные арифметические и логарифмические операции, а также тригонометрические функции с высокой точностью.
Дешифратор инструкций (команд). Анализирует инструкции в целях выделения операндов и адресов, по которым размещаются результаты. Затем следует сообщение другому независимому устройству о том, что необходимо сделать для выполнения инструкции. Дешифратор допускает выполнение нескольких инструкций одновременно для загрузки всех исполняющих устройств.
Кэш-память. Особая высокоскоростная память процессора. Кэш используется в качестве буфера для ускорения обмена данными между процессором и оперативной памятью, а также для хранения копий инструкций и данных, которые недавно использовались процессором. Значения из кэш-памяти извлекаются напрямую, без обращения к основной памяти. При изучении особенностей работы программ было обнаружено, что они обращаются к тем или иным областям памяти с различной частотой, а именно: ячейки памяти, к которым программа обращалась недавно, скорее всего, будут использованы вновь. Предположим, что микропроцессор способен хранить копии этих инструкций в своей локальной памяти. В этом случае процессор сможет каждый раз использовать копию этих инструкций на протяжении всего цикла. Доступ к памяти понадобиться в самом начале. Для хранения этих инструкций необходим совсем небольшой объём памяти. Если инструкции в процессор поступают достаточно быстро, то микропроцессор не будет тратить время на ожидание. Таким образом экономиться время на выполнение инструкций. Но для самых быстродействующих микропроцессоров этого недостаточно. Решение данной проблемы заключается в улучшении организации памяти. Память внутри микропроцессора может работать со скоростью самого процессора.
Кэш первого уровня (L1 cache). Кэш-память, находящаяся внутри процессора. Она быстрее всех остальных типов памяти, но меньше по объёму. Хранит совсем недавно использованную информацию, которая может быть использована при выполнении коротких программных циклов.
Кэш второго уровня (L2 cache). Также находится внутри процессора. Информация, хранящаяся в ней, используется реже, чем информация, хранящаяся в кэш-памяти первого уровня, но зато по объёму памяти он больше.
Кэш третьего уровня (L3 cache). Находиться внутри процессора. По объему больше чем память первого и второго уровней(512Кб-2Мб). Увеличивает пропускную способность памяти.
Основная память. Намного больше по объёму, чем кэш-память, и значительно менее быстродействующая.
Многоуровневая кэш-память позволяет снизить требования наиболее производительных микропроцессоров к быстродействию основной динамической памяти. Так, если сократить время доступа к основной памяти на 30%, то производительность хорошо сконструированной кэш-памяти повыситься только на 10-15%. Кэш-память, как известно, может достаточно сильно влиять на производительность процессора в зависимости от типа исполняемых операций, однако ее увеличение вовсе не обязательно принесет увеличение общей производительности работы процессора. Все зависит от того, насколько приложение оптимизировано под данную структуру и использует кэш, а также от того, помещаются ли различные сегменты программы в кэш целиком или кусками.
Кэш-память не только повышает быстродействие микропроцессора при операции чтения из памяти, но в ней также могут храниться значения, записываемые процессором в основную память; записать эти значения можно будет позже, когда основная память будет не занята. Такая кэш-память называется кэшем с обратной записью (write back cache). Её возможности и принципы работы заметно отличаются от характеристик кэша со сквозной записью (write through cache), который участвует только в операции чтения из памяти.
Шина - это канал пересылки данных, используемый совместно различными блоками системы. Шина может представлять собой набор проводящих линий в печатной плате, провода, припаянные к выводам разъемов, в которые вставляются печатные платы, либо плоский кабель. Информация передается по шине в виде групп битов. В состав шины для каждого бита слова может быть предусмотрена отдельная линия (параллельная шина), или все биты слова могут последовательно во времени использовать одну линию (последовательная шина). К шине может быть подключено много приемных устройств - получателей. Обычно данные на шине предназначаются только для одного из них. Сочетание управляющих и адресных сигналов, определяет для кого именно. Управляющая логика возбуждает специальные стробирующие сигналы, чтобы указать получателю, когда ему следует принимать данные. Получатели и отправители могут быть однонаправленными (т.е. осуществлять только либо передачу, либо прием) и двунаправленными (осуществлять и то и другое). Однако самая быстрая процессорная шина не сильно поможет, если память не сможет доставлять данные с соответствующей скоростью.
Типы шин:
Шина данных. Служит для пересылки данных между процессором и памятью или процессором и устройствами ввода-вывода. Эти данные могут представлять собой как команды микропроцессора, так и информацию, которую он посылает в порты ввода-вывода или принимает оттуда.
Шина адресов. Используется ЦП для выбора требуемой ячейки памяти или устройства ввода-вывода путем установки на шине конкретного адреса, соответствующего одной из ячеек памяти или одного из элементов ввода-вывода, входящих в систему.
Шина управления. По ней передаются управляющие сигналы, предназначенные памяти и устройствам ввода-вывода. Эти сигналы указывают направление передачи данных (в процессор или из него).
BTB (Branch Target Buffer) - буфер целей ветвления. В этой таблице находятся все адреса, куда будет или может быть сделан переход. Процессоры Athlon еще используют таблицу истории ветвлений (BHT - Branch History Table), которая содержит адреса, по которым уже осуществлялись ветвления.
Регистры - это внутренняя память процессора. Представляют собой ряд специализированных дополнительных ячеек памяти, а также внутренние носители информации микропроцессора. Регистр является устройством временного хранения данных, числа или команды и используется с целью облегчения арифметических, логических и пересылочных операций. Над содержимым некоторых регистров специальные электронные схемы могут выполнять некоторые манипуляции. Например, "вырезать" отдельные части команды для последующего их использования или выполнять определенные арифметические операции над числами. Основным элементом регистра является электронная схема, называемая триггером, которая способна хранить одну двоичную цифру (разряд). Регистр представляет собой совокупность триггеров, связанных друг с другом определённым образом общей системой управления. Существует несколько типов регистров, отличающихся видом выполняемых операций.
Особенности и различия процессоров Intel и AMD
64-разрядные процессоры AMD и Intel
Технология
Intel придерживается стандарта EPIC (Explicitly Parallel Instruction Computing). Данная технология создавалась специально для крупных серверов и некоторых рабочих станций. Возможности EPIC огромны: во-первых, это высокая скорость выполнения операций с плавающей запятой. Во-вторых, поддержка распараллеливания. И, в-третьих, благодаря улучшению считывания данных из памяти, скорость обмена информацией резко возрастает.
AMD избрал иной путь к 64-разрядности. Производители прибавили 32 к уже имеющимся разрядам и получили новую архитектуру x86-64. Новая технология отличается от старой лишь префиксом 64. В новом процессоре был сделан ряд улучшений, в первую очередь ядра процессора. Это позволило получить новый уровень быстродействия как для 32, так и для 64-разрядных систем.
Итоги: AMD переходит на новый уровень без применения новых технологий. Это приводит к полной совместимости как 32, так и 64-разрядных приложений. Intel же стремится показать себя лишь в 64 разрядах.
Архитектура
В новых процессорах были сделаны большие изменения, которые повлекли за собой производительность и совместимость со старыми платформами.
В AMD были добавлены режимы совместимости и 64-битные адресные регистры. Они позволяют расширить адресуемое пространство оперативной памяти и избавиться от существующего ограничения в 4 Гб, которое создает ощутимые трудности при построении систем обработки информации. Для ускорения работы с памятью используется технология NUMA, позволяющая работать напрямую с памятью, минуя системную шину и набор микросхем. Такое нововведение было названо HyperTransport и появилось в первом чипсете Golem.
В Intel все намного сложнее. Из-за интенсивного пути развития, компания в корне поменяла архитектуру.
. Режимы совместимости со старыми платформами.
. Уменьшение количества ошибок, так как против них созданы две независимых технологии. Главной является EMCA, которая позволяет вести контроль и протоколирование всех ошибок, возникающих во время работы процессора. И второстепенная технология ECC, позволяющая предварительно обрабатывать код и вести контроль четности.
. Поддержка многопроцессорности. Так как компания Intel ориентировала свой процессор для крупных серверов, то позаботилась и о мультипроцессорности. Процессор был снабжен рядом микросхем, которые позволяют вести быстрый обмен с памятью. Теперь для работы с «мозгами» используются методы чередования, буферизации и деления модулей памяти. При этом процессор работает с 64 гигабайтами оперативки с пропускной способностью 4,2 Гб/сек.
Совместимость
Intel создал ряд регистров для полной совместимости старых приложений. В итоге получается, что все 64-разрядные инструкции выполняются как обычно, иные же обрабатываются технологией IA-32. Эмуляция есть эмуляция, никакой производительности при этом не происходит, поэтому Itanium целиком и полностью ориентирован для 64-разрядных платформ.
В AMD все намного сложнее. Для улучшения производительности со старыми платформами были придуманы специальные режимы.
Архитектура AMD 64 предусматривает два главных режима работы: Long и Legacy. В первом открываются все достоинства технологии x86-64. Для полной совместимости над старыми приложениями существует подрежим совместимости, в котором способны обрабатываться 32/16-разрядные инструкции. В режиме Legacy процессор работает по принципу обычной x86-архитектуры. Преимуществом такой системы режимов является то, что процессор можно эксплуатировать до выхода стабильных релизов 64-разрядных операционных систем. Помимо этого существует несколько преимуществ x86-64 над IA-64:
. Быстродействие в обработке 32-разрядных инструкций. Связано с тем, что после перехода в режим совместимости не происходит никакой эмуляции, процессор обрабатывает данные с большой скоростью. Этого нет в Itanium, поскольку там все инструкции выполняются в 64 разрядах.
. Полная совместимость с x86-архитектурой. В Itanium подобное реализовано не полностью.
. Одновременная работа 16/32/64 приложений. Благодаря введению режимов, становится возможным обрабатывать ряд разных инструкций одновременно. Это сказывается на производительности и улучшает совместимость.
Применение
Intel изначально поставил перед собой задачу выполнить распараллеливание процессов в одном кремниевом устройстве. Как правило, этот процессор используют на мощных серверах с большими базами данных либо в банковских системах, где нельзя ошибаться. AMD же ориентировался как нечто среднее между 32 и 64 разрядами. Конечно, он встречается в крупных серверах, но также может использоваться в обычных рабочих станциях, ибо подстроен как под x86-64, так и под x86-архитектуру.
Цена
Intel просит за свое изобретение ни много ни мало $1200. Причем раньше процессор стоил в три раза дороже: около $4k. Учитывая, сколько будет стоить материнская плата под процессор, можно сделать вывод денег на сервер придется потратить немало.
У AMD цена на Athlon 64 составляет всего $417. Остальные 64-разрядные процессоры стоят от $300 до $600, что значительно ниже цен Intel.
Отличия процессоров Pentium и Celeron, Athlon и Duron
Процессор Celeron является бюджетной версией соответствующего main-stream процессора, на основе ядра которого он был создан. У процессоров Celeron в два или в четыре раза меньше кэш памяти второго уровня. Так же у них по сравнению с соответствующими "родителями" понижена частота системной шины. У процессоров Duron по сравнению с Athlon в 4 раза меньше кэш памяти и заниженная системная шина 200МHz (266MHz для Applebred), хотя существуют и "полноценные" Athlon c FSB 200MHz. Так же уже появились урезанные по кэшу Bartonы, ядро которых носит название Thorton. Есть задачи, в которых между обычными и урезанными процессорами почти нет разницы, а в некоторых случаях отставание довольно серьёзное. В среднем же, при сравнении с неурезанным процессором той же частоты, отставание это равно 10-30%. Зато урезанные процессоры имеют тенденцию лучше разгоняться из-за меньшего объёма кэш памяти и стоят при этом дешевле. Необходимо отметить, что процессоры Celeron работают весьма плохо по сравнению с полноценными P4 - отставание в некоторых ситуациях достигает 50%. Это не касается процессоров Celeron D,в которых кэш второго уровня составляет 256 кбайт (128 кбайт в обычных Celeron) и отставание уже не такое большое.
Основные недостатки процессоров фирм AMD и Intel
Во-первых, у AXP (и Athlon 64) вместо частоты пишется рейтинг, т. е. например 2000+ процессор реально работает на частоте 1667Mhz, но по эффективности работы он соответствует Athlon (Thunderbird) 2000Mhz. Основным недостатком недавно считалась температура. Но последние модели (на ядрах Thoroughbred, Barton и т. д.) по тепловыделению сравнимы Pentium 4, ну а самые последние, на момент написания реферата, модели от Intel (P4 Extreme Edition) греются иногда и значительно больше. По надёжности процессоры теперь тоже не сильно уступают P4, они хоть и не могут пропускать такты при перегреве, но обзавелись встроенным термодатчиком. Athlon XP на ядре Barton обзавелись похожей функцией BusDisconnect - она "отключает" процессор от шины во время холостых тактов, но она фактически бессильна при перегреве от повышенной нагрузки - тут вся "ответственность" перекладывается на термоконтроль материнской платы. "Крепкость" кристалла хоть и повысилась, но из-за уменьшенной площади ядра фактически осталась прежней. Поэтому вероятность повреждения кристалла хоть и стала меньше, но существует. А вот у Athlon 64 процессорный кристалл наконец-то был спрятан под теплорассеивателем (heat spreader), поэтому его повредить будет чрезвычайно сложно. Все неполадки приписываемые AMD часто являются следствием неустановленных или неправильно установленных универсальных драйверов для чипсетов VIA (VIA 4 in 1 Service Pack) или драйверов чипcетов других производителей (AMD, SIS, ALi).
Работают процессоры Atholn XP и Pentium 4 в разных приложениях очень по-разному. Например, в сложных математических вычислениях, архивации, кодировании в MPEG4, P4 часто "обыгрывает" AXP. Но есть и ряд программ, лучше работающих с AXP. В основном это - игры. Для обычного пользователя стоит ориентироваться именно на них, так как перекодировка в любом случае требует много времени, а играм, наоборот, необходимо провести все вычисления как можно быстрее. Уже выпущены процессоры AXP Barton с 400Mhz шиной и принципиально новые K8.
Новые разработки компаний Intel и AMD
Двуядерный процессор
Классический критерий производительности в виде мегагерцев был заменён параллелизмом, когда два ядра в одном чипе позволяют увеличить производительность, поделив между собой нагрузку.
Однако многие приложения не оптимизированы и не могут получить преимущество от дву- или многоядерных окружений. Чтобы использовать несколько процессоров, программное обеспечение должно разбиваться на несколько параллельных потоков. Такой подход позволяет распределить нагрузки по всем доступным вычислительным ядрам, снижая время вычислений сильнее, чем это можно было сделать с помощью одной тактовой частоты. Впрочем, большинство программ сегодня не умеют использовать возможности двуядерных или многоядерных чипов.
Двуядерные процессоры, являются лучшим выбором для тех пользователей, кто желает собрать систему, максимально защищённую по инвестициям на будущее. Но эра одноядерных процессоров в многопроцессорных конфигурациях ещё не закончилась. В качестве примера можно привести цену разумного двухпроцессорного компьютера с одноядерными процессорами с системой, оснащённой передовым двуядерным процессором.
Популярные двуядерные процессоры AMD и Intel стоят около $1000 - примерно столько стоит целый готовый компьютер. В то же время, одноядерные процессоры, работающие на такой же тактовой частоте, обойдутся всего в $300-$350.
Для нашего сравнения были взяты процессоры профессионального уровня, а именно: AMD Opteron и Intel Xeon. AMD просит около $1100 за двуядерный Opteron 275 (2,2 ГГц), в то время как пара одноядерных Opteron 248 обойдётся всего в $700.
Если посмотреть на Intel, то здесь ситуация аналогична. Двуядерный Xeon на 2,8 ГГц стоит около $1100, а два сравнимых 2,8-ГГц одноядерных Xeon обойдутся примерно в $550. Два 3,2-ГГц Xeon стоят около $700.
Платформы AMD
Платформы AMD |
Однопроцессорная система, один двуядерный CPU |
Двухпроцессорная система, один двуядерный CPU |
Двухпроцессорная система, два одноядерных CPU |
Платформа |
Socket 939 |
Socket 940 |
Socket 940 |
Процессоры |
Athlon 64 X2 4400+ (2,2 ГГц) $520 |
Opteron 275 (2,2 ГГц) $1100 |
x Opteron 248 (2,2 ГГц) $700 |
Материнская плата |
$200 |
$280 |
$280 |
Память |
x 1 Гбайт DDR400 $200 |
x 1 Гбайт DDR400 ECC регистровая $250 |
x 512 Мбайт DDR400 ECC регистровая $250 |
Общая цена |
$920 |
$1630 |
$1230 |
Комментарии |
Нельзя модернизировать |
Можно добавить второй двуядерный процессор |
Одноядерные процессоры можно заменить двуядерными чипами Каждый процессор использует собственную память |
В этом исследовании использовались комплектующие среднего класса стоимости. Ориентир был взят на чипсет nVidia nForce4 Professional. Цена двухпроцессорных материнских плат для Socket 940 подразумевает, что каждый процессор оснащается выделенной памятью. Выбирались самые доступные модули памяти от популярных производителей, которые можно было установить в наши материнские платы (4x 512 Мбайт для двухпроцессорной конфигурации против 2x 1 Гбайт для двуядерных конфигураций с одним CPU).
Платформа Intel
Платформа Intel
Однопроцессорная система, один двуядерный CPU |
Двухпроцессорная система, один двуядерный CPU |
Двухпроцессорная система, два одноядерных CPU |
|
Платформа |
Socket 775 |
Socket 604 |
Socket 604 |
Процессоры |
Intel Pentium Processor Extreme Edition 840 (3,2 ГГц) $1000 |
Intel Xeon Dual Core Processor 2,8 ГГц $1100 |
2x Intel Xeon Processor 3,2 ГГц (2 Мбайт кэша) $700 |
Материнская плата |
$200 |
$280 |
$280 |
Память |
x 1 Гбайт DDR2-667 $250 |
x 1 Гбайт DDR2-400 ECC регистровая $250 |
x 1 Гбайт DDR2-400 ECC регистровая $250 |
Суммарная цена |
$1450 |
$1630 |
$1230 |
Комментарии |
Нельзя модернизировать Pentium D 840 даёт примерно такую же производительность, хотя стоит на $500 меньше. Но он не поддерживает Hyper-Threading. |
Можно добавить второй двуядерный процессор Два ядра и четыре потока благодаря Hyper-Threading |
Одноядерные процессоры можно заменить двуядерными чипами Два процессора и четыре потока благодаря Hyper-Threading. |
У Intel, популярные двуядерные чипы приводят к суммарной цене, существенно превышающей одноядерные двухпроцессорные машины.
Технологии создания процессора со сдвоенным ядром
Сегодня существует три возможных способа создавать двуядерные чипы. Первый заключается в создании тесно связанных двух ядер на едином кристалле. Второй способ - сочетать два обычных ядра на едином кристалле. Третий вариант - разместить два ядра на разных кристаллах в одной упаковке. Первый подход тесно связанных ядер позволяет разработчикам связать между собой отдельные блоки процессора, что потенциально даёт возможность увеличения производительности, в то время как два других решения менее дорогие в разработке и производстве.
Последний вариант, является самым дешёвым способом вступления в двуядерную эру, поскольку он позволяет получить максимально высокий уровень выхода годных кристаллов. При этом каждое ядро можно протестировать и отсеять по тем или иным дефектам.
У размещения двух, в целом, независимых ядер в одну упаковку есть существенный недостаток. Каждый раз, когда одно ядро пожелает получить данные, с которыми работает второе ядро, необходим доступ к системной шине. Несложно представить, что на шину в данном случае ляжет двойная нагрузка. И это характерно не только для 65-нм чипов Presler со сдвоенным ядром, но и для 90-нм двуядерных Smithfield, у которых два ядра находятся на едином кристалле. С другой стороны, дизайн с общим кэшем приводит к проблеме распределения кэша между двумя ядрами.
Intel анонсировала появление общего кэша L2 только в новой микро-архитектуре, которая появится во второй половине 2006 года: процессоры Woodcrest для серверов, Conroe для настольных ПК и Merom для мобильных компьютеров. Вероятно, AMD пойдёт на такой же шаг с выпуском процессоров для Socket M2: Windsor (двуядерный) и Orleans Athlon 64 (версия Revision F).
Сравнение процессоров AMD Athlon 64 и Pentium 4 Extreme Edition
Athlon 64
Пока у AMD появились такие процессоры:
две версии для настольных применений это Athlon 64 3200+ с тактовой частотой 2000 МГц, одноканальным контроллером памяти DDR400 и разъемом Socket 754 и Athlon 64 FX-51 с тактовой частотой 2200 МГц, разъемом Socket 940 и двухканальным контроллером регистровой памяти DDR400.
и две версии мобильных Athlon 64 модели 3200+ и 3000+, которые из-за высокого тепловыделения (в районе 80 ватт) смогут применяться лишь в ноутбуках класса "замена десктопа".
По сути, вычислительное ядро процессоров AMD Athlon 64 это лишь немного измененное ядро прежних Athlon XP.
Однако эти изменения вместе позволяют значительно улучшить производительность. Основные принципиальные особенности новой микроархитектуры AMD64:
Поддержка 64-битной адресации памяти и 64-битные регистры общего назначения при полной совместимости с 32-битными приложениями;
Возросшая до 1 Мбайта эксклюзивная кэш-память второго уровня (L2);
Вдвое (с 64 до 128 бит) увеличенная ширина шины кэш-памяти L2;
Возросло число ступеней вычислительных конвейеров;
Поддержка инструкций SSE2;
Улучшенная схема предсказания переходов;
Интегрированный в процессор контроллер DDR-памяти;
Высокоскоростная шина Hyper-Transport, при помощи которой процессор соединяется с чипсетом;
Защитная металлическая теплорассеивающая крышка;
Встроенная электронная схема для защиты кристалла от перегрева.
Наиболее важными факторами улучшения производительности новых процессоров AMD даже на прежних 32-разрядных приложениях являются возросший объем кэш-памяти, большая скорость работы с кэш-памятью L2 и встроенный контроллер двухканальной DDR-памяти.
Intel Pentium 4 Extreme Edition
Помимо технологии Hyper-Threading, системной шины 800 МГц и тактовой частоты 3,2 ГГц, его основной особенностью является кэш-память третьего уровня объемом 2 Мбайт, расположенная на самом кристалле и работающая на частоте ядра процессора. Она сосуществует с обычным "нортвудовским" кэшем L2 512 кбайт, но кэш у Пентиумов инклюзивный, поэтому суммарный объем для кэширования данных из системной памяти будет не 2,5 Мбайт, а только 2 Мбайт. А кэш L2, имеющий скорость, большую, чем у L3, будет в этом случае кэшировать данные из кэш-памяти L3, а не из системной памяти.
Кристалл нового Pentium 4 происходит от серверных процессоров Xeon MP на 0,13-микронном ядре Gallatin и не является будущим Prescott. Тем не менее, его все же специально доработали для поддержки системной шины 800 МГц и упаковали в корпус от нынешних Pentium 4. Поэтому процессор Pentium 4 Extreme Edition 3,2 ГГц не может работать в многопроцессорных конфигурациях, зато полностью совместим со всеми нынешними материнскими платами на двухканальных чипсетах Intel 875/865 даже без обновления BIOS. Внешне Extreme Edition от обычного Pentium 4 можно отличить лишь по большему количеству фильтрующих конденсаторов с обратной стороны корпуса.
Extreme Edition имеет полный набор прежних признаков Pentium 4 на ядре Northwood и в придачу к ним дополнительный кэш L3 объемом 2 Мбайт. Который виден, в том числе, при непосредственных измерениях латентности кэш-памяти. Причем латентность кэша L3 оказалась всего вдвое больше, чем у быстродействующего L2.
Программа CPU-Z назвала это ядро как "Northwood", что, конечно, не совсем так, хотя вполне допускается, что во всем, кроме добавочного кэша L3 и схем, его обслуживающих, эти ядра действительно совпадают. Тем не менее, нынешние Нортвуды для системной шины имеют степпинг F29, тогда как Extreme Edition "всего" F25, а вышедшие год назад первые P4 с технологией HT имели степпинг F27. Таким образом, кристалл нового Pentium 4 продолжает не линейку Northwood, а совсем другую линейку кристаллов Intel кристалла Gallatin.
Исходя из этого, число транзисторов у Pentium 4 Extreme Edition составляет почти 170 миллионов, что втрое больше, чем у Northwood, хотя площадь и тепловыделение возросло не столь сильно: площадь менее, чем вдвое, а тепловыделение менее, чем на 15%. "Новый" кристалл использует то же напряжение питания, но предельная рабочая температура корпуса снизилась до 64 градусов вместо 70 для процессоров с частотой 3,2 ГГц. Максимальный ток потребления возрос с 67,4 до 72,3 ампер, однако это не требует переделки уже существующих стабилизаторов на материнских платах, как не требуется и более мощных кулеров. Для длительных испытаний нового процессора использовался именно стандартный новый боксовый кулер, и в хорошо проветриваемом корпусе никаких проблем перегрева при этом не возникало.
Заключение
В настоящее время компьютеры превратились в мощные высокопроизводительные устройства. По всем основным показателям они в сотни раз превосходят первоначальную модель, а стоят обычно даже дешевле. Если бы такими же темпами развивалось, скажем, автомобилестроение, то сейчас за несколько тысяч долларов предлагались бы автомобили, передвигающиеся со скоростью космических ракет и вмещающих сотни человек.
Я предпринял это исследование, так как мне очень интересна эта тема, я хотел больше знать о строении и функциях процессора, и самое главное я хотел узнать, какой же микропроцессор самый высокопроизводительный на сегодняшний день. Я сравнивал следующие процессоры: Intel Pentium Extreme Edition и процессоры AMD Athlon 64 FX-51, AMD Athlon 64 3200+, AMD Athlon XP 3200+. Прежде всего, следует отметить, что AMD удалось создать новую аппаратную платформу, которая призвана стать в самое ближайшее время технологической основой всех решений этой корпорации. Чтобы оценить серьезность намерений AMD, достаточно лишь отметить, что уже к середине 2005 года доля процессоров, основанных на 64-разрядных ядрах, превышает в спектре продукции AMD 50%. О поддержке 64-разрядной платформы AMD заявили едва ли не все ведущие производители аппаратного обеспечения, в том числе - разработчики наборов системной логики (nVidia, VIA, SiS, ULi), материнских плат (ASUS, MSI, TYAN, Gigabyte, ECS, AOPEN, EPoX и многие другие). Известные разработчики ПО, в том числе - Microsoft - тоже не остаются в стороне, планируя к выпуску 64-разрядные версии своих продуктов.
Список литературы
http://www.3dnews.ru/cpu/athlon64fx-p4ee/index02.htm
http://www.thg.ru/cpu/20051108/index.html
http://hardwade.narod.ru/index/cpu/1.htm
Для подготовки данной работы были использованы материалы с сайта http://referat.ru