Будь умным!


У вас вопросы?
У нас ответы:) SamZan.net

. Архитектура ЭВМ ВС ~ комплекс общих вопросов построения существующих в первую очередь для пользователя и

Работа добавлена на сайт samzan.net:


1. Архитектура ЭВМ (ВС) – комплекс общих вопросов построения, существующих в первую очередь для пользователя, интересующегося главным образом возможностями машины (вычислительной системы), а не деталями ее технического исполнения.

Структура ЭВМ (ВС) является компонентом архитектуры и отражает совокупность элементов, узлов и связей между ними. Она не включает принцип действия.

кластеры – современные суперкомпьютерные системы

однопроцессорные - процессор по очереди выбирает команды программы и также по очереди обрабатывает данные.

В многопроцессорной обработке процессоры могут использоваться для выполнения одной последовательности команд во множественных контекстах , множественные последовательности команд в единственном контексте , или множественные последовательности команд во множественных контекстах.

Многомашинная система - это вычислительный комплекс, включающий в себя несколько компьютеров (каждый из которых работает под управлением собственной операционной системы), а также программные и аппаратные средства связи компьютеров, которые обеспечивают работу всех компьютеров комплекса как единого целого.

РОСИ - любая система, охватывающая несколько взаимодействующих компьютеров.

2. I поколение. 1945-1954 гг. Первые цифровые ЭВМ. Элементарная база – вакуумные лампы. Порядка 18 тысяч ламп.

II поколение. 1955-1964 гг. Появились первые суперкомпьютеры (ILLIAC-IV). Основа – транзисторы.

III поколение. 1965-1974 гг. Малые интегральные схемы, средние (IBM360).

III,5 поколение. 1975-1984 гг. БИС – большие интегральные схемы, БИС памяти. Аппаратные средства - встроенные матричные процессоры (ускорители), развитие суперЭВМ, многопроцессорные системы, персональные компьютеры, рабочие станции.

IV поколение. 1985г. Сверхбольшие интегральные схемы, сверхБИС памяти. Аппаратные средства - компьютерные сети, услуги, предоставляемые компьютерными сетями. Распределенная обработка информации, экспертные системы, базы знаний.

V и последующие поколения ( с 1990г). ЭВМ сверхвысокой производительности и сверхбольшой памяти. Быстродействие – 1012-1017 операций/сек. Организация систем искусственного интеллекта с использованием баз знаний.

3.Главные направления повышения производительности: увеличение рабочей частоты и организация параллельных режимов работы.

требования к параллельной обработки:

а) Решение задачи за наиболее короткий интервал времени.

б) Решение за один и тот же интервал как можно больше задач

Перспективы и проблемы использования высокопроизводительных ВС параллельной обработки информации

Пути повышения производительности:

1.Увеличение рабочей частоты и быстродействия элементной базы.

2.Совершенствование организации выполнения команд и операций. RISC-архитектуры.

3.Сокращение временных затрат при обращении к памяти (вводятся параллельно функционирующие модули памяти, Кеш-памяти (1, 2 и т.д. уровня)); увеличение числа регистров общего назначения.

4.Широкое использование прерываний для организации взаимодействия с канальными контроллерами.

5.Конвейерная организация обработки данных.

6.Одновременное выполнение множества операций на разных устройствах. Это одно из самых эффективных и перспективных направлений.

4.Основные преимущества параллельных вычислительных систем по сравнению с однопроцессорными:

a. Возможность обеспечения высокой производительности за счет параллельной реализации алгоритма решения задачи или пакета задач;

b. Возможность многократного увеличения производительности независимо от рабочей частоты;

c. Возможность получения высокой достоверности результатов путем введения дублирования (троирования и т.д.);

d. Обеспечение надежности системы за счет структурной и информационной избыточности;

e. Высокие эксплуатационные свойства системы за счет использования более развитых операционных систем.

5. 1. Способы параллельной и параллельно-последовательной обработки.

1) Многоэлементная одновременная обработка:

УО

УО

УО

УО

                          …

1)Многостадийная (многосегментная, конвейерная) обработка:

УО

УО

УО

УО

 

1)Комбинированная обработка:

в каждом прямоугольнике "УО"

Уровни обработки (гранулярность обработки):

а) Программы (задачи); части программ, задач. Реализация обычно на основе центральных процессоров, мощных универсальных процессоров.

б) Команды. В команды включается как обращение к памяти (чтение/запись операндов), так и выполнение операции. Реализуется на основе процессорных элементов (множество одинаковых процессорных элементов, SIMD - архитектуры).

в) Операции. Выполнение операции, не включая обращение к памяти. Обычно реализация осуществляется на основе множественных АЛУ, взаимодействующих с регистрами общего назначения.

6(1). В основе классификации лежат понятия «потоки команд», «потоки данных».Выделяют 4 класса:

1.Одиночный поток команд - одиночный поток данных (ОПК – ОПД, SISD, ОКОД).Простейшая архитектура однопроцессорной ЭВМ. уу

ЗУ

УУ

Пр

 Зу     опк

                                 опл                 пр

  1. Одиночный поток команд - множественный поток данных (ОПК-МПД, SIMD, ОКМД).

ЗУ

УУ

Пр1

ПрN

                                                                                   уу

Power PC;                                       

ЗУ

УУ

Пр1

ПрN

Connection Machine (16тыс. элемен-                  пд1  по1

тарных процессоров)

ПС-2000, 3000; MMX; MX;                                     пдN   поN

Сигнальный процессор ADSP2116X   ПД1

(2 процессора SIMD);

ILLIACIV;  ПДN

Матричные системы;

Цифровые интегрирующие структуры

Множественный поток команд - множественный поток данных (МПК – МПД, MIMD, МКМД).

ЗУ

Пр

У

Пр

УУ

Пр

УУ

Многопроцессорные системы.

Эльбрус3 (16 процессоров.). Grey

многопроцессорные суперсерверы.

МВС на основе транспьютеров,

Pentium-ов;

Alpha (2 млрд. операций/сек);

ТМS 320С8x;

Процессоры с множественными АЛУ,

суперскалярные архитектуры.

6(2). 

зу   уу

     пр

     уу

     пр

     ....

    Уу

     Пр

Множественный поток команд - одиночный поток данных (МПК – ОПД, MISD, МКОД).

Конвейерные системы (многостадийные).

ЗУ

УУ

Пр

Пр

Пр

Зу      уу

     Пр   пр .... пр

Конвейер используется в суперскалярных архитектурах, других современных системах.

7. Проблемы:

1.Обработка связана с постоянной перезаписью результатов вычислений в память (побочный эффект, главная проблема).

2.Параллельная обработка информации должна описываться на специальном языке; должны быть введены специальные средства обработки. Для параллельной обработки необходимо вводить специальные многомерные описания (в рамках векторного описания).

Пути решения проблемы:

3.Расширение каналов передачи данных между центральным процессором и памятью.

4.Введение Кэш-памяти, в частности, многоуровневой Кэш-памяти (до 3-х уровней).

5.Отказ от использования архитектур (неймановских), имеющих побочный эффект. Направление создания потоковых машин и редукционных машин.

6.Организация таких архитектур, в которых считанные из памяти данные проходят как можно больше этапов обработки, прежде чем снова попадут в память. Конвейерные принципы, однородные структуры, систолические структуры.

8.

Развитие архитектур с полным набором команд (CISK-архитектур) столкнулось с рядом проблем.

Реализация большого количества сложных команд привела к необходимости использовать примерно 50% ресурсов кристалла для устройства управления.

Устройство управления реализуется на основе микропрограммного принципа, в основе которого – использование ПЗУ и сложных с логической точки зрения обрамляющих ПЗУ устройств.

В связи с отмеченным выше, оказываются длинными цепи прохождения сигнала в пределах такта. Это приводит к ограничению рабочей частоты, и сдерживает ее повышение даже при переходе к более высокочастотной базе.

RISC особенность: используются простейшие, но часто используемые команды (инструкции). Как правило, одна инструкция выполняется за такт. Сложные операции собираются из этих простейших команд с использованием подпрограмм. Ограничено количество способов адресации. Существует небольшое число форматов команд, преобладают фиксированные размеры и функциональное назначение команды. Широко используется жесткая логика (не используются принципы микропрограммного управления). Появляется возможность существенного сокращения ресурсов кристалла за счет уменьшения устройства управления. Обычно увеличивается количество регистров общего назначения.

9. В потоковой вычислительной модели для описания вычислений используется ориентированный граф потоков данных (dataflow graph). Этот граф состоит из узлов или вершин, отображающих операции, и ребер или дуг, показывающих потоки данных между  теми  вершинами  графа,  которые  они соединяют. Показать с использованием структурной схемы сущность управления вычислительным процессом в современных микропроцессорах на основе принципа готовности данных.

Пример. a = (b+c)*(b-c). Для отображения хода процесса используются специальные «фишки». Потоковые принципы описываются с помощью графов и сетей Петри.

10.

Механизм редукционных машин основан на принципе редукции, т.е. сокращения посредством перезаписи строк символов (формул) в программе или сокращения в графах.

Запуск вычислений осуществляется при необходимости получения данных.

Пример. Исходные данные: граф программы, находящийся в памяти.                    a = (b+c)*(b-c).В памяти:

Нет побочного эффекта. Реализуется последовательность решения математических выражений. Это направление удобно для параллельной реализации.

22. По классификации потоки команд - потоки данных эти архитектуры относятся к типу SIMD.

Можно выделить два основных направления:

матричный процессор с локальной памятью;

матричный процессор с общей памятью.

Матричный процессор с локальной памятью. Имеется множество одинаковых процессорных элементов (как правило, они простые). На все процессоры одновременно поступает одна и та же команда или группа команд (SIMD). Каждый процессорный элемент использует данные из своей индивидуальной памяти (или оперативной памяти). Имеется возможность обмена данными или условиями перехода через сеть связи между процессорными элементами. Количество ПЭ – от 8-и до 16-и тысяч. Обычно ПЭ своих средств ввода-вывода не имеют.

П – память;  ПЭ – процессорный элемент.

11(2). Матричный процессор с общей памятью. МП – модуль памяти. ПЭ могут выполняться в виде отдельных процессоров, в значительной мере упрощенных; могут изготавливаться на пластине как множество ПЭ.                                      

Матричный процессор с общей памятью. МП – модуль памяти. ПЭ могут выполняться в виде отдельных процессоров, в значительной мере упрощенных; могут изготавливаться на пластине как множество ПЭ

ПЭ-ты коммутируются сетью связи в соответствии с алгоритмом решения задачи. Каждый ПЭ настраивается на выполнение соответствующей одинаковой для всех команды или группы команд. В современных многоядерных процессорах ПЭ являются в значительной мере высокофункциональными с развитой системой команд (например, процессоры для обработки графической информации).

12. Процессорная матрица: 16384 ПЭ; один ПЭ имеет локальную память 1024 бит.

Разрядно-модульная матричная ОКМД

ПЭ связан с четырьмя соседними элементами. ПЭ однобитовые, коды поступают последовательные, все элементы настраиваются на выполнение одной команды. Переходная память для стыковки и подготовки форматов.

13. Pentium MMX (простейшая организация SIMD-архитектуры в микропроцессоре)

Система команд Pentium MMX имеет 57 специальных дополнительных команд, ориентированных на мультимедийные алгоритмы; введено специальное дополнение в виде устройства ММХ. Добавлено: 8 ММХ регистров, появились новые команды. Добавлены типы данных (8 упакованных байт в 64 битовом пакете, четыре 16 битовых слова, упакованные двойные слова по 32 бита (два слова) и учетверенное слово 64 бита).

 Пример выполнения команды ММХ.

Выполнение умножения с накоплением четырех 16 разрядных слов на другие 4 слова, при этом используются 3 команды MMX.

На Pentium-е без использования MMX требуется 12 команд для выполнения таких действий. В PentiumMMX реализуется параллельно-конвейерный принцип.

Команды:1. Загрузка операндов в ММХ регистр:

16р

     А3

16р

       А2

16р

       А1

16р

      А0

2. Умножение и сложение содержимого ММХ регистра и памяти:

     А3

       А2

       А1

      А0

ММХ регистр

const

3. Сложение результата с содержимым аккумулятора:

     В3

В2

В1

В0

А3*В3+А2*В2

А1*В1+А0*В0

АСС1

АСС2

В итоге в аккумуляторе накапливаются результаты.

 Особенности реализации SIMD в микропроцессоре PowerPC (G5)

Имеется 128-и разрядный блок векторной обработки, который параллельно функционирует с имеющимся целочисленным блоком и блоком обработки с плавающей точкой.Данные, которые могут обрабатываться: 16 8-и битовых целых (и символы) или 8 16-и битовых целых (и символы), или 4 32-х битовых целых чисел или чисел с плавающей запятой.

В блоке векторной обработки предусматривается 32 регистра по 128 разрядов (как регистры общего назначения). Их можно использовать для хранения исходных данных.

Команды могут содержать до 3-х входных операндов и один выходной. Общее количество команд – 162, включая векторную обработку.

14. 

Имеется 128-и разрядный блок векторной обработки, который параллельно функционирует с имеющимся целочисленным блоком и блоком обработки с плавающей точкой. Данные, которые могут обрабатываться: 16 8-и битовых целых (и символы) или 8 16-и битовых целых (и символы), или 4 32-х битовых целых чисел или чисел с плавающей запятой. В блоке векторной обработки предусматривается 32 регистра по 128 разрядов (как регистры общего назначения). Их можно использовать для хранения исходных данных. Команды могут содержать до 3-х входных операндов и один выходной. Общее количество команд – 162, включая векторную обработку.

 

Могут реализовываться не только массовые скалярные операции, но и сложные векторные операции (скалярное умножение векторов, матриц) и операции, работающие с несколькими регистрами.

15. Процессоры имеют гранулярность на уровне операций. АЛУ обслуживаются регистром, а не общей памятью.Особенность системы: множество одновременно работающих АЛУ; используется многопортовый регистровый файл.

Для управения n АЛУ могут использоваться длинные микрокоманды, состоящие из n полей, и каждое поле управляет отдельным АЛУ. АЛУ может носить как универсальный по набору команд (микроинструкций), так и специализированный характер.Данный принцип организации лежит в основе построения операционных ядер современных микропроцессоров, в частности, суперскалярных архитектур, ядер многоядерных процессоров. В основе реализации АЛУ - конвейерный принцип, на основе которого достигается получение одного результата за один такт.

Особенности организации работы современных процессоров с многими АЛУ согласуются с методологией RISK-архитектуры.

16. Сущность конвейера команд состоит в выполнении последовательности повторов операций. Например:

  1. Выборка команды.
  2. Декодирование команды.
  3. Преобразование адреса операнда.
  4. Выборка операнда.
  5. Выполнение операции.
  6. Сохранение результата.

Одновременно может выполняться до   6-и операций управления. Длительности выполнения операций должны быть равны (обычно 1-му такту). Для каждой из стадий используются специальные аппаратные средства. онвейер применяется, чтобы повысить производительность. Операционные устройства обработки данных также должны быть конвейерного типа. Проблемы, возникающие при работе конвейера:

1)при использовании результата предыдущей операции в последующей возникают проблемы, связанные с пересылкой этих результатов; 2)определение адреса операнда для данной команды с помощью предыдущей;

3)проблема изменения последовательности выполнения команд (с условным переходом);4)совпадают стадии выборки операндов для разных стадий;5)конфликты в доступе к памяти;6)проблемы при прерываниях;7)если конвейер рассчитан на одно тактовые стадии, то возникает проблема при выполнении более длительных стадий.

20. ALU  - блоки целочисленной обработки (ОУ);

БРЗ - блоки регистров для целочисленных операндов;

БФА – блок формирования адреса операндов (один для выборки, другой для записи операндов);

FPU –устройство обработки с плавающей точкой;

MMX – SIMD-обработка целочисленных операндов; 8, 16, 32-х разрядные операнды на базе 128-разрядного регистра;

SEE – пакетные 128-битные SIMD-операции с плавающей точкой и перестройкой разрядности;

SEE2 – комбинирование MMXи SЕE.

Особенности:

- Гарвардская структура с разделением потоков команд и данных.

- Суперскалярная архитектура, обеспечивающая параллельное выполнение нескольких команд в параллельно работающих исполнительных устройствах.

- Динамическое изменение последовательности команд по готовности данных.

- Конвейерное исполнение команд и операций на функциональных операционных устройствах.

- Предсказание направления ветвления.

В основе  построения операционных устройств ядра – RISC-архитектура.

42 млн. транзисторов н7а кристалле.

Архитектура микропроцессора в целом : CISK+RISK.

17. Конвейерный принцип – принцип обработки информации, который является базовым для современных вычислительных операционных устройств.

Особенностью конвейерной системы является то, что каждое устройство обработки (сегмент) настраивается на выполнение определенного алгоритма, обрабатываемая информация проходит через совокупность последовательно включенных устройств обработки.

Пример. Конвейер обработки (сложения) 2-х чисел с плавающей точкой. Выделим стадии обработки:

  1. Нормализация чисел.
  2. Сравнение порядков.
  3. Сдвиг мантисс и выравнивание порядков.
  4. Сложение мантисс.
  5. Нормализация результата.

Конвейер относится к системам с МПК-ОПК (MISD).

Во времени:

Время работы конвейера на одном шаге оценивается устройством обработки информации с максимальной длительностью выполнения операции в этом устройстве. Выделяются конвейерные устройства скалярной и векторной обработки. Векторная обработка может обеспечивать более высокую производительность конвейерной системы

22. В многопроцессорных системах гранулярность на уровне задач; в каждой ЭВМ свой счетчик команд. По классификации потоки-команд-потоки данных относятся к MIMD архитектурам.

1. Системы с общей памятью.

Число процессоров ограничивается обстоятельствами, которые возникают при конфликтах при обращении к памяти. От сети связи зависит эффективность всей многопроцессорной системы.

2. Системы с распределенной (индивидуальной) памятью (с коммутацией сообщений).

ЛП – локальная память.

В системе у каждого процессора имеется своя память и проблема конфликтов не столь актуальна.

Одна из наиболее серьезных проблем в проектировании многопроцессорных систем – необходимость использования сложных систем связи. В идеале, для обеспечения высокой производительности и минимизации задержек при обмене информацией между процессорами и ОЗУ, желательно обеспечивать возможность связи в любой момент времени по принципу "каждый с каждым”, однако при построении таких систем уже при небольшом количестве процессоров сеть связи оказывается очень сложной.

23. Одношинная система:

Таким способом более 4-х процессоров не подключают.

Мультиплексная общая шина:

Матричный коммутатор:

К – сложный коммутирующий элемент.

Полная сеть:

Звездообразная сеть:

23. Матричная сеть:

Матричная сеть типа «тор»:

Сеть типа «цепочка»:

Кольцевая сеть:

                             

Древовидная сеть:

24. 22 процессоров, 2 связи на входе каждого процессора, не более двух участков для перехода от одного процессора к другому:

23 вершин (процессоров). 3 связи на входе каждого процессора. Чтобы перейти из одной вершины в любую другую, нужно пройти не более 3-х участков:

В общем случае: 2L  – количество процессоров, L связей на входе каждого процессора. Чтобы перейти из одной вершины в любую другую, нужно пройти не более L-х участков. При формировании трафика связи между двумя процессорами эффективно используется особенность нумерации расположения соседних процессоров: их номера всегда отличаются  только в значении одного из битов.

Например,  в системе на 16384 процессоров (214) каждый процессор имеет 14 входов/выходов, чтобы реализовать все соединения. Между каждой парой процессоров расстояние не более 14 участков.

25. Выделяется  три типа ОС:

-Централизованная ОС (по типу «ведущий/ведомый»)

-Децентрализованная ОС (с раздельным выполнением заданий)

-Смешанные ОС (с симметричным выполнением заданий)

Централизованные ОС:

- управляющие функции реализуются только в одном из процессоров, который может быть выбран оператором (или заложен программно как центральный), исполнительские функции распределены по другим процессорам;

- к исполнению управляющих программ имеет доступ только один центральный процессор, в связи с чем в системе не возникают конфликтные ситуации (блокировки), связанные с общим доступом;

- при сбое в ведущем процессоре возможен отказ системы в целом. Необходимо предусмотреть специальные средства перезапуска системы;

- в случае, если решается много мелких задач и ведущий процессор перегружен управляющими функциями, то возможно резкое снижение  производительности системы в целом.

25. Децентрализованные ОС:

- каждое задание полностью обслуживается одним процессором, то есть каждый процессор выполняет и управленческие и исполнительские  функции;

- при отказе одного из процессоров в целом, система может не потерять работоспособность. В этом случае задача процессора вышедшего из строя перераспределяется на другой процессор. Однако при этом требуется восстановление вычислительной системы, повторный запуск программ и это представляет непростую по реализации задачу;

- операции ввода/вывода могут выполняться процессором, на который эта задача возложена. Каждый процессор может иметь свою дополнительную память;

- если один процессор перегружен, а другие простаивают, то система характеризуется низкой эффективностью.

Смешанная ОС:

- каждое задание может обслуживаться одновременно несколькими процессорами (и управленческие и исполнительские функции), при  этом обеспечивается возможность равномерной загрузки процессоров.

- при выходе из строя отдельного процессора может сохраняться работоспособность

- самая сложная ОС.

26.

- архитектура МВС с индивидуальной памятью у каждого микропроцессора;

- сетевой интерфейс поддерживают 4 связи (на рис. link);

- система  связи – тор;

- возможно расширение архитектуры (рис. – базовая архитектура);

- каждый процессор – однокристальный;

- имеются порты памяти (для внешних блоков ОП);

- потребляет порядка 100 Вт (немалая мощность);

- 100 млн. транзисторов.

20. ALU  - блоки целочисленной обработки (ОУ);

БРЗ - блоки регистров для целочисленных операндов;

БФА – блок формирования адреса операндов (один для выборки, другой для записи операндов);

FPU –устройство обработки с плавающей точкой;

MMX – SIMD-обработка целочисленных операндов; 8, 16, 32-х разрядные операнды на базе 128-разрядного регистра;

SEE – пакетные 128-битные SIMD-операции с плавающей точкой и перестройкой разрядности;

SEE2 – комбинирование MMXи SЕE.

Особенности:

- Гарвардская структура с разделением потоков команд и данных.

- Суперскалярная архитектура, обеспечивающая параллельное выполнение нескольких команд в параллельно работающих исполнительных устройствах.

- Динамическое изменение последовательности команд по готовности данных.

- Конвейерное исполнение команд и операций на функциональных операционных устройствах.

- Предсказание направления ветвления.

В основе  построения операционных устройств ядра – RISC-архитектура.

42 млн. транзисторов н7а кристалле.

Архитектура микропроцессора в целом : CISK+RISK.

18. Архитектуры:

- Суперскалярная (одноядерная, однопотоковая, распределение команд осуществляется компилятором для параллельной работы на множественных операционных устройствах ядра, гранулярность на уровне операций (команд)).

- Мультискалярная – одноядерная многопотоковая, многонитевая, мультитредовая, имеет место автоматическое создание потоков команд для параллельной обработки на операционных устройствах ядра.

- VLIW – архитектура: при работе на уровне распараллеливания команд анализируется окно команд; с помощью компилятора формируется длинное командное слово, содержащее столько полей, сколько имеется АЛУ, что позволяет усовершенствовать процесс управления и загрузки множественными АЛУ, упростить устройство управления, реализовать анализ последовательности команд (обычно анализ реализуют аппаратно).

Суперскалярная основа, гранулярность – на уровне операций (команд).

- Мультипроцессорная (многопроцессорная) – параллелизм на уровне выполнения задач (гранулярность – задача, часть программы). Нужны априорные знания о программе. Вопросы распараллеливания решаются компилятором и программистом. Возможно построение на основе суперскалярных многоядерных процессоров.

- Многоядерная – ядра обычно на основе суперскалярной архитектуры, многопотоковые, гранулярность на уровне операций (команд), формирование потоков компилятором.

19.    УОПТ, УОФТ –  устройства обработки с плавающей или фиксированной точкой (АЛУ).Особен архит: в буф упорядочивания команд выделяется окно из последовательности команд, из этого окна выбираются команды, данные для которых готовы; эти команды анализируются, на каком из устройств могут быть реализованы (множество АЛУ с плавающей точкой или с фиксированной точкой), по мере освобождения подходящих устройств эти команды направляются для исполнения на эти устройства.Присут. элемент нарушения принципа неймановск архит: последоват выполн команд опред-ся готовностью данных для их исполнения.Каждое АЛУ работает на основе конвейерного принципа. Распараллеливание осуществляется на уровне команд

20. ALU  - блоки целочисленной обработки (ОУ);

БРЗ - блоки регистров для целочисленных операндов;

БФА – блок формирования адреса операндов (один для выборки, другой для записи операндов);

FPU –устройство обработки с плавающей точкой;

MMX – SIMD-обработка целочисленных операндов; 8, 16, 32-х разрядные операнды на базе 128-разрядного регистра;

SEE – пакетные 128-битные SIMD-операции с плавающей точкой и перестройкой разрядности;

SEE2 – комбинирование MMXи SЕE.

Особенности:

- Гарвардская структура с разделением потоков команд и данных.

- Суперскалярная архитектура, обеспечивающая параллельное выполнение нескольких команд в параллельно работающих исполнительных устройствах.

- Динамическое изменение последовательности команд по готовности данных.

- Конвейерное исполнение команд и операций на функциональных операционных устройствах.

- Предсказание направления ветвления.

В основе  построения операционных устройств ядра – RISC-архитектура.

42 млн. транзисторов н7а кристалле.

Архитектура микропроцессора в целом : CISK+RISK.

21. Первый Gray был создан в 1976-м году, выпущен – в 78-м году. Процессор имел объем 1м3, выполнял до 250 млн. операций/сек. Состав Gray: 4 секции (12 устройств):

- секция функциональных устройств (АЛУ);

- секция регистров;

- секция управления программой;

- секция памяти и ввода-вывода.

4 независимые группы функциональных устройств:

- адресная группа;

- скалярная группа;

- группа операций с плавающей запятой;

- векторная группа.

АЛУ – это практически конвейерный процессор. Число сегментов в одном конвейере – до 14. Длительность одного шага (сегмента) – 12.5 нс. Число операций – 128. В мультипрограммном режиме могут одновременно выполняться 63 задачи. Имеется активизирующий компилятор с ФОРТРАНА, который распознает параллельные участки для векторных команд.

Большую роль играют быстрые регистры:

- адресные (А-регистры) -24-х разрядные, 8 шт.;

- скалярные (S-регистры) -64-х разр., 8 шт.;

- векторные (V-регистры) – 64 элемента*64 разр.,8 шт.

Время обращения к регистру 6 нс. Ввод-вывод – по 24-м каналам (6*4 канала).

22. В многопроцессорных системах гранулярность на уровне задач; в каждой ЭВМ свой счетчик команд. По классификации потоки-команд-потоки данных относятся к MIMD архитектурам.

1. Системы с общей памятью.

Число процессоров ограничивается обстоятельствами, которые возникают при конфликтах при обращении к памяти. От сети связи зависит эффективность всей многопроцессорной системы.

2. Системы с распределенной (индивидуальной) памятью (с коммутацией сообщений).

ЛП – локальная память.

В системе у каждого процессора имеется своя память и проблема конфликтов не столь актуальна.

Одна из наиболее серьезных проблем в проектировании многопроцессорных систем – необходимость использования сложных систем связи. В идеале, для обеспечения высокой производительности и минимизации задержек при обмене информацией между процессорами и ОЗУ, желательно обеспечивать возможность связи в любой момент времени по принципу "каждый с каждым”, однако при построении таких систем уже при небольшом количестве процессоров сеть связи оказывается очень сложной.

23. Одношинная система:

Таким способом более 4-х процессоров не подключают.

Мультиплексная общая шина:

Матричный коммутатор:

К – сложный коммутирующий элемент.

Полная сеть:

Звездообразная сеть:

23. Матричная сеть:

Матричная сеть типа «тор»:

Сеть типа «цепочка»:

Кольцевая сеть:

                             

Древовидная сеть:

24. 22 процессоров, 2 связи на входе каждого процессора, не более двух участков для перехода от одного процессора к другому:

23 вершин (процессоров). 3 связи на входе каждого процессора. Чтобы перейти из одной вершины в любую другую, нужно пройти не более 3-х участков:

В общем случае: 2L  – количество процессоров, L связей на входе каждого процессора. Чтобы перейти из одной вершины в любую другую, нужно пройти не более L-х участков. При формировании трафика связи между двумя процессорами эффективно используется особенность нумерации расположения соседних процессоров: их номера всегда отличаются  только в значении одного из битов.

Например,  в системе на 16384 процессоров (214) каждый процессор имеет 14 входов/выходов, чтобы реализовать все соединения. Между каждой парой процессоров расстояние не более 14 участков.

25. Выделяется  три типа ОС:

-Централизованная ОС (по типу «ведущий/ведомый»)

-Децентрализованная ОС (с раздельным выполнением заданий)

-Смешанные ОС (с симметричным выполнением заданий)

Централизованные ОС:

- управляющие функции реализуются только в одном из процессоров, который может быть выбран оператором (или заложен программно как центральный), исполнительские функции распределены по другим процессорам;

- к исполнению управляющих программ имеет доступ только один центральный процессор, в связи с чем в системе не возникают конфликтные ситуации (блокировки), связанные с общим доступом;

- при сбое в ведущем процессоре возможен отказ системы в целом. Необходимо предусмотреть специальные средства перезапуска системы;

- в случае, если решается много мелких задач и ведущий процессор перегружен управляющими функциями, то возможно резкое снижение  производительности системы в целом.

25. Децентрализованные ОС:

- каждое задание полностью обслуживается одним процессором, то есть каждый процессор выполняет и управленческие и исполнительские  функции;

- при отказе одного из процессоров в целом, система может не потерять работоспособность. В этом случае задача процессора вышедшего из строя перераспределяется на другой процессор. Однако при этом требуется восстановление вычислительной системы, повторный запуск программ и это представляет непростую по реализации задачу;

- операции ввода/вывода могут выполняться процессором, на который эта задача возложена. Каждый процессор может иметь свою дополнительную память;

- если один процессор перегружен, а другие простаивают, то система характеризуется низкой эффективностью.

Смешанная ОС:

- каждое задание может обслуживаться одновременно несколькими процессорами (и управленческие и исполнительские функции), при  этом обеспечивается возможность равномерной загрузки процессоров.

- при выходе из строя отдельного процессора может сохраняться работоспособность

- самая сложная ОС.

26.

- архитектура МВС с индивидуальной памятью у каждого микропроцессора;

- сетевой интерфейс поддерживают 4 связи (на рис. link);

- система  связи – тор;

- возможно расширение архитектуры (рис. – базовая архитектура);

- каждый процессор – однокристальный;

- имеются порты памяти (для внешних блоков ОП);

- потребляет порядка 100 Вт (немалая мощность);

- 100 млн. транзисторов.


27. Типичная многопроцессорная система с многими процессорами и коммутаторами:

- МП содержит 5 полнофункциональных процессоров, 4 из которых -  реализуют исполнительские функции, а 1 – управляющие;

- каждый процессор за 1 такт может выполнить несколько RISK – операций;

- главный процессор более полнофункциональный  и работает с плавающей точкой;

- порт JTAG – подключение системы контроля и отладки, дополнительного ОЗУ;

-  контроллер обмена;

-  видеоконтроллер;

- суммарная производительность – 2 млрд. RISK – команд (при частоте 40-50 МГц).

28. Характеристики Cray С90:

- 16 процессоров;

- векторно-конвейерная архитектура позволяет решать задачи с матричными данными. Выделяется вектор однотипных данных, который потом передается потоком на конвейер. Также имеются и суперскалярные операции;

- имеются адресные регистры А, скалярные регистры S, векторные регистры, промежуточные регистры – B  и Т.  Все регистры связаны с памятью.

- ФУ – все конвейерного типа и выдают результат за один такт

- может выполняться скалярная обработка с зацеплением.

Характеристики Cray T90:

- 640 вычислительных узлов,  в каждом узле по 8 векторных процессоров, то есть в сумме 5120 процессоров;

- пиковая производительность одного процессора 8 Gflops. Для всей системы – 40 Tflops.

29. МВС – 1000 – российская  разработка (НПО «Квант»). В основе системы лежат микропроцессоры фирмы DEC “Alpha 2116” на 500 МГц. В 2001-ом году система содержала 1152 процессора (с производительностью 1 Tflops)- 18 стоек по 64 процессора на каждой стойке.

Особенность построения:

Исполнительские процессорные узлы базируются на МП Alpha, а процессоры для реализации коммуникационных функций взаимодействия – TMS320C44.

Характеристики системы:

- TMS320C44 имеет 4 связи, связь между узлами – топология двухмерного тора.

- базовая архитектура на 16 процессоров (базовый модуль).

- максимальная длинна связи между двумя процессорами не более трех участков

- возможно наращивание архитектуры модуля до 64 процессоров, при этом длина пути не более 5-ти участков.

-дальнейшее объединение – на основе свободных линков.

30. Российская разработка. Эльбрус-1 включала 4 процессора. Эльбрус-2 10 процессоров, в каждом процессоре -10 специализированных операционных устройств. Эльбрус-3 – в 1991г.

ОП – оперативная память (содержится до 8-и модулей). ПВВ – процессоры ввода-вывода (до 8-и процессоров). НМД – накопители на магнитных дисках. МКТ – модульные комплексы телеобработки. УВВ – устройства ввода-вывода. ЦП – центральные процессоры (до 16-и процессоров). В системе содержатся сотни каналов телеобработки данных.

Глобальная оперативная память - до 2-х Гб.

В процессоре есть 7 АЛУ конвейерного типа. В конвейере один сегмент – 10нс. Пиковая производительность одного процессора – 700 млн. результатов/сек.

Пиковая производительность 16-ти процессорной конфигурации – 10млрд.результатов/сек.

Обеспечивается параллельное обращение по 8-и каналам к ОП.

Команды выбираются на исполнение по готовности данных. Просматривается до 30-и команд.

В системе Эльбрус используется язык высокого уровня ЭЛЬ-76.

Имеется конвейер команд. Одновременно реализуется две альтернативы при условных переходах. Используется виртуальная память (единое адресное пространство).

Компиляция выполняется на микропрограммные коды.

31. Транспьютеры – это однокристальные универсальные ЭВМ, предназначенные для организации параллельной обработки информации многопроцессорных систем. Каждый транспьютер – это универсальная ЭВМ, имеющая соответствующий набор команд и архитектуру.

Особенность транспьютерных систем: наличие 4-х, 6-и или более специальных портов, используемых для построения многопроцессорных систем, для обмена информацией с другими транспьютерами.

Транспьютеры эффективны также в автономном использовании. К настоящему времени уступили свое место сигнальным процессорам, функционально реализующим аналогичные возможности по построению многопроцессорных систем.

Тактовые частоты: 20-30 (Т800). Используется для программирования язык ОККАМ.

32. В качестве примера рассмотрим использование транспьютера для реализации операции «Бабочка» (быстрое преобразование Фурье). Исходные комплексные  данные:

Вычислительный процесс состоит в формировании:

Необходимо расчленить обработку вещественных и мнимых компонентов. Для (1) имеем:

Для (2) имеем:

Перегруппируем (3), выделив вещественную и мнимую компоненты, и получим:

Транспьютерная система:

33. Многоядерный микропроцессор содержит два и более вычислительных ядер на одном кристалле. Впервые в 1994г. на кристалле был реализован двухядерный процессор. Сущность многопоточности – использование нескольких потоков микрокоманд на одноядерном или многоядерном процессоре.

Ниже на рисунке иллюстрируется эволюция микропроцессоров от простейшего традиционного до многопотокового многоядерного.

Эволюция СМР:

а) традиционный микропроцессор;

б) простейшая версия CMP;

в) СMP с общей кэш-памятью второго уровня;

г) многопотоковая версия CMP.

34. Кластер представляет собой два или более компьютеров, которые объединяются с помощью сетевых технологий на базе шинной архитектуры или коммутатора и предоставляются пользователю в качестве единого информационно-вычислительного ресурса. Такие суперкомпьютерные системы являются самыми дешевыми, поскольку собираются на базе стандартных комплектующих элементов, процессоров, коммутаторов, дисководов и внешних устройств.

Классические суперкомпьютеры в отличие от кластерных вычислительных систем характеризуются колоссальной стоимостью. В середине 90-х годов прошлого века на рынке появились недорогие и эффективные микропроцессоры и коммуникационные решения. Появилась реальная возможность создавать установки ”суперкомпьютерного” класса из составных частей массового производства. Это и предопределило появление кластерных вычислительных систем, являющихся отдельным направлением развития компьютеров с массовым параллелизмом.

Состав и мощность узлов могут меняться даже в рамках одного кластера, что дает возможность создавать, в частности, неоднородные системы. В качестве операционных систем используются чаще всего стандартные: Linux, Windows NT, Solaris.

Для классических супер-ЭВМ по сравнению с кластерными системами характерен более высокий показатель отношения производительности к потребляемой энергии. Переход кластерных систем к экзафлопсной производительности (1018 операций в сек.) связан с возможным потреблением энергии одной ВС 120 МГватт.

35. Любые вычислительные устройства можно считать параллельной вычислительной системой, если они работают одновременно и их можно использовать для решения одной задачи. Компьютер, состоящий из компьютеров, - это своего рода метакомпьютер.

Объединив различные вычислительные ресурсы в рамках единой сети, можно оперативно формировать специальную вычислительную среду. Работая в такой среде, пользователь лишь выдает задание на решение задачи, а остальное метакомпьютер делает сам: ищет доступные вычислительные ресурсы, отслеживает их работоспособность, осуществляет передачу данных. Пользователь может даже не узнать, ресурсы какого именно компьютера были ему предоставлены.

По аналогии с электрической сетью распределенная вычислительная среда в англоязычной литературе получила название Grid или ”вычислительная сеть”. Совершенствование операционных средств в организации метакомпьютинга привело к появлению направления под названием ”облачные вычисления”.

Особенности метакомпьютера:

- обладает огромными аппаратными и программными ресурсами, которые несравнимы с ресурсами обычных компьютеров;

- является распределенным по своей природе;

- может динамически менять конфигурацию. Какие-то компьютеры к нему подсоединяются и делегируют права на использование своих ресурсов, какие-то отключаются и становятся недоступными;

- неоднороден. В состав метакомпьютера могут входить системы с принципиально различной архитектурой;

- объединяет ресурсы различных организаций.


36. Производительность является объективной мерой оценки эффективности вычислительной системы. Она определяется как функция от частоты, архитектуры процессора, может зависеть и от класса решаемых задач. Оценка производительности – один из главных факторов, который имеет место при сравнении ВС.

Основные показатели производительности:

- Пиковая производительность процессора без учета времени обращения к ОЗУ (MOP, Mflops, Mips);

- Системная производительность технических и программных средств (на основе тестовых оценочных программ);

- Номинальная производительность – среднее число команд, выполняемых подсистемой «процессор - память» с учетом их среднестатического веса в выбранном классе задач.

- Эксплуатационная производительность. Оценивается на реальной рабочей нагрузке при выполнении типовых пакетов прикладных программ в основных областях применения (обработка текстов, СУБД, САПР, компиляторы).

Способы тестового измерения производительности:

1. Тесты, которые создают крупные производители для внутреннего применения.  Подобного типа тесты  рассчитаны  на  какую-либо конкретную фирменную архитектуру и имеют локальные характер применения (например, для рекламирования своей продукции).

2. Стандартные тесты, формирующиеся независимыми аналитиками (Linpack) или группами, объединяющими крупных производителей компьютеров (SPEC, TPC) – универсальные тесты для широкого спектра применения.

3. Тесты для тестирования специальных пакетов (специализированные).

37. Скалярное произведение 2-х векторов.

X=(x1, x2, x2)

Y=(y1, y2, y3)

X.Y=x1y1+x2y2+x3y3

Векторное произведение 2-х векторов.

X=ix1+jx2+kx3

Y=iy1+jy2+ky3

38.

  1.  Понятие “архитектура “  ЭВМ и системы. Системы однопроцессорные,  многопроцессорные, многомашинные, распределенной обработки информации, кластеры.  Понятие “структура “ ЭВМ.
  2.  Основные исторические вехи в развитии аппаратных и программных средств ЭВМ.
  3.  Пути повышения производительности ВС и требования к ВС параллельной обработки. Современные проблемы на пути повышения производительности ВС.
  4.  Основные преимущества параллельных вычислительных систем по сравнению с однопроцессорными.
  5.  Способы параллельной обработки. Уровни обработки (гранулярность обработки).
  6.  Классификация вычислительных систем с функциональной точки зрения  (потоки команд-потоки данных). Примеры систем в соответствии с этой классификацией.
  7.  Проблемы неймановской архитектуры. Пути решения проблем.
  8.  Особенности процессоров с  CISC и RISC архитектурой.
  9.  Вычислительная модель с потоком данных. Редукционные машины.
  10.   Показать с использованием структурной схемы сущность управления вычислительным процессом в современных микропроцессорах на основе принципа готовности данных.
  11.   Матричные процессоры с SIMD обработкой информации (направления в построении архитектур).
  12.   Процессор SIMD-архитектуры для обработки двухмерных изображений, передаваемых из космоса.
  13.   Особенности архитектур современных микропроцессоров с SIMD-обработкой информации (Pentium MMX).
  14.   Особенности архитектур современных микропроцессоров с SIMD-обработкой информации (PowerPC (G5)).
  15.   Процессоры с многими АЛУ.
  16.   Процессоры с конвейеризацией команд. Проблемы, возникающие при работе конвейера.
  17.   Конвейерное операционное устройство (на примере).
  18.   Направления развития современных архитектур микропроцессоров.
  19.   Суперскалярная архитектура и направления ее развития. Примеры.

  1.  Понятие “архитектура “  ЭВМ и системы. Системы однопроцессорные,  многопроцессорные, многомашинные, распределенной обработки информации, кластеры.  Понятие “структура “ ЭВМ.
  2.  Основные исторические вехи в развитии аппаратных и программных средств ЭВМ.
  3.  Пути повышения производительности ВС и требования к ВС параллельной обработки. Современные проблемы на пути повышения производительности ВС.
  4.  Основные преимущества параллельных вычислительных систем по сравнению с однопроцессорными.
  5.  Способы параллельной обработки. Уровни обработки (гранулярность обработки).
  6.  Классификация вычислительных систем с функциональной точки зрения  (потоки команд-потоки данных). Примеры систем в соответствии с этой классификацией.
  7.  Проблемы неймановской архитектуры. Пути решения проблем.
  8.  Особенности процессоров с  CISC и RISC архитектурой.
  9.  Вычислительная модель с потоком данных. Редукционные машины.
  10.   Показать с использованием структурной схемы сущность управления вычислительным процессом в современных микропроцессорах на основе принципа готовности данных.
  11.   Матричные процессоры с SIMD обработкой информации (направления в построении архитектур).
  12.   Процессор SIMD-архитектуры для обработки двухмерных изображений, передаваемых из космоса.
  13.   Особенности архитектур современных микропроцессоров с SIMD-обработкой информации (Pentium MMX).
  14.   Особенности архитектур современных микропроцессоров с SIMD-обработкой информации (PowerPC (G5)).
  15.   Процессоры с многими АЛУ.
  16.   Процессоры с конвейеризацией команд. Проблемы, возникающие при работе конвейера.
  17.   Конвейерное операционное устройство (на примере).
  18.   Направления развития современных архитектур микропроцессоров.
  19.   Суперскалярная архитектура и направления ее развития. Примеры.




1. Фразеология
2. .01.2013 г. цены приведены в руб.
3. Менеджмент Опыт работы 09
4. Понятие и признаки преступления
5. Конструирование из бумаги с детьми 5-7 лет
6. Комбинат Восток в 20092011 гг
7. тема сбыта и рыночная доля
8. Правовой институт государственной тайны в Российской Федерации
9. е ЛИЧНОЕ ОТКРЫТОЕ ПЕРВЕНСТВО САНКТПЕТЕРБУРГА И ЛЕНИНГРАДСКОЙ ОБЛАСТИ ПО АРМЛИФТИНГУ ТЯГЕ РУЧКИ ROLLING THUND
10. Литература - Терапия острые экзогенные отравления
11. ТЕМА- МЕТОДИКА ОРГАНІЗАЦІЇ СПОРТИВНОГО ТУРИСТСЬКОГО КЛУБУ ПЛАН 1
12. Основы философии Философия ее предмет и роль в жизни человека и общества
13. тематики и экономики где все связи в экономическом процессе носят случайный характер
14. МОДУЛЬ ’ 1 ПЛАСТИЧЕСКАЯ И РЕКОНСТРУКТИВНАЯ ХИРУРГИЯ В ОФТАЛЬМОЛОГИИ Содержательный модуль ’ 1 Практич.html
15. Петербургская Государственная Медицинская
16. Черепномозговая травма ЧМТ собирательное понятие охватывающее разнообразные виды и степени механ
17. тематика 1 Каб ’31 9.html
18. Реферат- Samba
19. тема исходный текст шифрованный текст КЛЮЧ шифрованный текст исходный текст
20. і Введення та редагування БД