Многомашинные вычислительные системы (ММС)

Многопроцессорные вычислительные системы (МПС)

Архитектура с параллельными процессорами

Классификация архитектур ВС с параллельной обработкой данных

Примеры архитектур вычислительных систем

ASMP - асимметричная мультипроцессорная обработка

Симметричная мультипроцессорная обработка (SMP)

Параллельная архитектура с векторными процессорами (PVP)

1.55M

Категория:

Электроника

Похожие презентации:

Многопроцессорные вычислительные системы

Параллельные вычислительные системы

Многомашинные и многопроцессорные вычислительные системы

Многопроцессорные вычислительные системы. Лекция 21

Параллельные вычислительные системы. Введение

Архитектура параллельных вычислительных систем

Архитектура параллельных вычислительных систем. Лекция 2

Параллельная обработка данных. Лекция №1

Вычислительные машины, комплексы, системы и сети

Архитектура параллельных вычислительных систем

Вычислительные системы

1. Вычислительные системы

2. Понятие вычислительной системы

Вычислительная система (ВС) совокупность взаимосвязанных и
взаимодействующих процессоров или
ЭВМ, периферийного оборудования и
программного обеспечения,
предназначенная для сбора, хранения,
обработки и распределения информации.

3. Цели создания ВС

Создание ВС преследует следующие
основные цели:
повышение производительности системы за
счет ускорения процессов обработки
данных;
повышение надежности и достоверности
вычислений;
предоставление пользователям
дополнительных сервисных услуг и т.д.

4. Основная особенность ВС

Отличительной особенностью ВС по отношению к
ЭВМ является наличие в них нескольких
вычислителей, реализующих параллельную
обработку.
Параллелизм выполнения операций существенно
повышает быстродействие системы и увеличивает
надежность (при отказе одного компонента
системы его функции может взять на себя
другой),
Но, в то же время, в значительной степени
усложняет управление вычислительным
процессом, использование технических и
программных ресурсов.
Эти функции выполняет операционная система ВС.

5. Классы архитектур

По типу вычислительные системы
различаются на
многомашинные и
многопроцессорные ВС.

6. Многомашинные вычислительные системы (ММС)

Многомашинные вычислительные системы (ММС)
появились исторически первыми. Уже при
использовании ЭВМ первых поколений использовали
комплекс машин, схематически показанный на рис.
Каждая из них сохраняет возможность автономной
работы и управляется собственной ОС.

7.

Положения 1 и 3 электронного ключа (ЭК) обеспечивало режим
повышенной надежности. При этом одна из машин выполняла
вычисления, а другая находилась в “горячем” или “холодном”
резерве, т.е. в готовности заменить основную ЭВМ. Положение
2 электронного ключа соответствовало случаю, когда обе
машины обеспечивали параллельный режим вычислений. Здесь
возможны две ситуации:
а) обе машины решают одну и ту же задачу и периодически
сверяют результаты, решения. Тем самым обеспечивался режим
повышенной достоверности, уменьшалась вероятность
появления ошибок в результатах вычислений. Примерно по
такой же схеме построены управляющие бортовые
вычислительные комплексы космических аппаратов, ракет,
кораблей. Например, американская космическая система
“Шатл” содержала пять вычислительных машин, работающих
по такой схеме;
б) обе машины работают параллельно, но обрабатывают
собственные потоки заданий. Возможность обмена
информацией между машинами сохраняется. Этот вид работы
относится к режиму повышенной производительности. Она
широко используется в практике крупных вычислительных
центров, оснащенных несколькими ЭВМ высокой
производительности.

8. Многопроцессорные вычислительные системы (МПС)

Многопроцессорные вычислительные системы (МПС)
строятся при комплексировании нескольких
процессоров.
В качестве общего ресурса они имеют общую
оперативную память (ООП). Параллельная работа
процессоров и использование ООП обеспечиваются под
управлением единой общей операционной системы.

9. Многопроцессорные вычислительные системы (МПС)

По сравнению с ММС здесь достигается наивысшая
оперативность взаимодействия вычислителей-процессоров.
Однако МПС имеют и существенные недостатки.
Они в первую очередь связаны с использованием ресурсов
общей оперативной памяти. При большом количестве
комплексируемых процессоров возможно возникновение
конфликтных ситуаций, когда несколько процессоров
обращаются с операциями типа “чтение” и “запись” к одним и
тем же областям памяти.
Помимо процессоров к ООП подключаются все каналы
(процессоры ввода-вывода), средства измерения времени и т.д.
Поэтому вторым серьезным недостатком МПС является
проблема коммутации абонентов и доступа их к ООП.
Накопленный опыт построения подобных систем показал, что они
эффективны при небольшом числе комплексируемых процессоров (2,4 до
10). В отечественных системах Эльбрус обеспечивалась возможность
работы до десяти процессоров, до 32 модулей памяти, до 4 процессоров
ввода-вывода и до 16 процессоров связи. Все связи в системе
обеспечивались коммутаторами.

10. Архитектура с параллельными процессорами

УУ
АЛУ
…
АЛУ
ОЗУ
АЛУ

11. Архитектура с параллельными процессорами

Здесь несколько АЛУ работают под управлением
одного УУ. Это значит множество данных может
обрабатываться по одной программе, т.е. по
одному потоку команд.
Высокое быстродействие такой архитектуры можно
получить только на задачах, в которых
одинаковые вычислительные операции
выполняются одновременно на различных
однотипных наборах данных.

12. Классификация архитектур ВС с параллельной обработкой данных

В 1966 г. М. Флинном была предложена
классификация архитектур ВС на основе
понятия потока, под которым понимается
последовательность элементов, команд и
данных, обрабатываемая процессором.
Эта система классификации описывает 4 базовых
класса:
1. ОКОД (SISD);
2. ОКМД (SIMD);
3. МКОД (MISD);
4. МКМД (MIMD).

13. Архитектура ОКОД

ОКОД (Одиночный поток Команд и Одиночный
поток Данных) еще называется
SISD
(Single Instruction stream/ Single Data
stream).
Память команд
П1
Поток данных
Результаты
Память данных

14. Архитектура ОКОД

Охватывает все однопроцессорные и
одномашинные варианты систем, т.е. с одним
вычислителем.
Все ЭВМ классической архитектуры попадают в
этот класс.
Здесь параллелизм вычислений обеспечивается
путем совмещения выполнения операций
отдельными блоками АЛУ, а также параллельной
работой устройств ввода-вывода информации и
процессора.

15. Архитектура ОКМД

ОКМД (Одиночный
поток Команд и
Множественный
поток Данных) еще
называется
Память команд
Поток команд
Пn
П2
SIMD
(Single
Instruction stream/
Multiple Data stream).
П1
Поток данных
Результаты
Память данных

16. Архитектура ОКМД

предполагает создание структур векторной или матричной
обработки.
Системы этого типа обычно строятся как однородные, т. е.
процессорные элементы, входящие в системы, идентичны,
и все они управляются одной и той же
последовательностью команд. Однако каждый процессор
обрабатывает свой поток данных.
По этой схеме строились системы: первая суперЭВМ –
ILLIAC-IV, затем Cyber – 205, Gray – I, II, III,
отечественные ПС 2000, ПС 3000.
Элементы технологии SIMD реализованы в процессорах
Intel начиная с Pentium MMX (1997 г.).

17. Архитектура МКОД

МКОД (Множественный поток Команд и
Одиночный поток Данных) еще называется
MISD
(Multiple Instruction stream/ Single Data
stream).
Память команд
Поток команд
Процессоры
Поток данных
П1
П2
П3
Память данных
Результаты

18. Архитектура МКОД

Предполагает построение своеобразного
процессорного конвейера, в котором
результаты обработки передаются от
одного процессора к другому по цепочке.
Конвейерная схема нашла применение в
скалярных процессорах суперЭВМ.

19. Архитектура МКМД

Память команд
МКМД
(Множественный
Поток команд
поток Команд и
Процессоры
П
П
…
Множественный
Процессоры
поток Данных) еще
П
П
…
называется
Процессоры
MIMD
(Multiple
П
П
…
Результаты
Instruction stream/ Поток данных
Multiple Data
Память данных
stream).
n1
n2
21
22
11
12

20. Архитектура МКМД

предполагает, что все процессоры системы
работают по своим программам с собственным
потоком команд.
Подобные системы могут быть многомашинными и
многопроцессорными.
Такая схема использования ВС часто применяется
на многих крупных вычислительных центрах для
увеличения пропускной способности центра.
Большой интерес представляет возможность
согласованной работы ЭВМ (процессоров), когда
каждый элемент делает часть общей задачи.

21. Примеры архитектур вычислительных систем

22. ASMP - асимметричная мультипроцессорная обработка

ASMP (ASymmetric MultiProcessing) асимметричная мультипроцессорная обработка архитектура суперкомпьютера, в которой каждый
процессор имеет собственную оперативную
память.
При этом процессоры взаимодействуют между
собой, передавая друг другу сообщения через
общую шину (MPP-архитектура) или с
использованием межпроцессорных связей (при
небольшом числе процессоров).

23. MPP - архитектура

MPP (massive parallel processing) – массивно-параллельная архитектура.
Главная особенность такой архитектуры состоит в том, что память
физически разделена. В этом случае система строится из отдельных
модулей, содержащих процессор, локальный банк операционной памяти
(ОП), коммуникационные процессоры (роутеры) или сетевые адаптеры,
иногда – жесткие диски и/или другие устройства ввода/вывода.
По сути, такие модули представляют собой полнофункциональные
.
компьютеры
Доступ к банку ОП из
данного модуля
имеют только
процессоры (ЦП) из
этого же модуля.
Модули соединяются
специальными
коммуникационными
каналами.

24. MPP - архитектура

Главным преимуществом систем с раздельной памятью является
хорошая масштабируемость: в отличие от SMP-систем, в машинах с
раздельной памятью каждый процессор имеет доступ только к своей
локальной памяти, в связи с чем не возникает необходимости в
потактовой синхронизации процессоров. Практически все рекорды по
производительности на сегодня устанавливаются на машинах именно
такой архитектуры, состоящих из нескольких тысяч процессоров
(ASCI Red, ASCI Blue Pacific).
Недостатки:
отсутствие общей памяти заметно снижает скорость
межпроцессорного обмена,
каждый процессор может использовать только ограниченный объем
локального банка памяти;
Вследствие указанных архитектурных недостатков требуются значительные
усилия для того, чтобы максимально использовать системные ресурсы.
Именно этим определяется высокая цена программного обеспечения для
массивно-параллельных систем с раздельной памятью.
Системами с раздельной памятью являются суперкомпьютеры МВС-1000, IBM RS/6000 SP,
SGI/CRAY T3E, системы ASCI, Hitachi SR8000, системы Parsytec.
Машины последней серии CRAY T3E от SGI, основанные на базе процессоров Dec Alpha
21164 с пиковой производительностью 1200 Мфлопс/с (CRAY T3E-1200), способны
масштабироваться до 2048 процессоров.

25. Симметричная мультипроцессорная обработка (SMP)

SMP (Symmetric MultiProcessing) симметричная мультипроцессорная обработка архитектура суперкомпьютера, в которой группа
процессоров работает с общей оперативной
памятью и пользуется общими внешними
устройствами.
При симметричной многопроцессорной обработке
операционная система и приложения могут
использовать любой доступный процессор.

26. Симметричная мультипроцессорная обработка (SMP)

Память служит, в частности, для передачи сообщений
между процессорами, при этом все вычислительные
устройства при обращении к ней имеют равные права и
одну и ту же адресацию для всех ячеек памяти. Поэтому
SMP-архитектура называется симметричной.
SMP-система строится на
основе высокоскоростной
системной шины, к
слотам которой
подключаются
функциональные блоки:
процессоры (ЦП),
подсистема ввода/вывода
(I/O) и т. п.

27. Симметричная мультипроцессорная обработка (SMP)

Основные преимущества SMP-систем:
простота и универсальность для программирования.
Архитектура SMP не накладывает ограничений на модель
программирования. Для них существуют довольно
эффективные средства автоматического
распараллеливания;
простота эксплуатации. Как правило, SMP-системы
используют систему кондиционирования, основанную на
воздушном охлаждении, что облегчает их техническое
обслуживание;
относительно невысокая цена.
Недостатки:
системы с общей памятью плохо масштабируются.

28. Гибридная архитектура (NUMA)

NUMA (Non-Uniform Memory Access) - cистемы с
неоднородным доступом к памяти.
NUMA подразумевает использование каждым процессором
своего локального блока памяти (объединение по
высокоскоростной шине).
Гибридная архитектура совмещает достоинства систем с
общей памятью и относительную дешевизну систем с
раздельной памятью.
Суть этой архитектуры – в особой организации памяти, а
именно: память физически распределена по различным
частям системы, но логически она является общей, так что
пользователь видит единое адресное пространство.

29. Гибридная архитектура (NUMA)

Система построена из однородных базовых модулей (плат), состоящих
из небольшого числа процессоров и блока памяти. Модули объединены
с помощью высокоскоростного коммутатора. Поддерживается единое
адресное пространство, аппаратно поддерживается доступ к удаленной
памяти, т.е. к памяти других модулей. При этом доступ к локальной
памяти осуществляется в несколько раз быстрее, чем к удаленной.

30. Гибридная архитектура (NUMA)

По существу, архитектура NUMA является MPP (массивнопараллельной) архитектурой, где в качестве отдельных
вычислительных элементов берутся SMP (cимметричная
многопроцессорная архитектура) узлы.
Достоинства NUMA:
лучше масштабируется (больше число CPU чем в SMP,
без усложнения аппаратной реализации),
прекрасно подходит для не пересекающихся по общим
данным процессов,
простота реализации виртуальных машин.
Наиболее известными системами архитектуры cc-NUMA являются: HP
9000 V-class в SCA-конфигурациях, SGI Origin3000, Sun HPC 15000,
IBM/Sequent NUMA-Q 2000. На сегодня максимальное число
процессоров в cc-NUMA-системах может превышать 1000 (серия
Origin3000).

31. Параллельная архитектура с векторными процессорами (PVP)

PVP (Parallel Vector Process) – параллельная архитектура с
векторными процессорами.
Основным признаком PVP-систем является наличие
специальных векторно-конвейерных процессоров, в
которых предусмотрены команды однотипной обработки
векторов независимых данных, эффективно
выполняющиеся на конвейерных функциональных
устройствах.
Как правило, несколько таких процессоров (1-16) работают
одновременно с общей памятью (аналогично SMP) в
рамках многопроцессорных конфигураций. Несколько
узлов могут быть объединены с помощью коммутатора
(аналогично MPP).

32. Параллельная архитектура с векторными процессорами (PVP)

Поскольку передача данных в векторном формате
осуществляется намного быстрее, чем в скалярном
(максимальная скорость может составлять 64 Гбайт/с, что
на 2 порядка быстрее, чем в скалярных машинах), то
проблема взаимодействия между потоками данных при
распараллеливании становится несущественной.
И то, что плохо распараллеливается на скалярных машинах,
хорошо распараллеливается на векторных. Таким образом,
системы PVP-архитектуры могут являться машинами
общего назначения (general purpose systems).
Однако, поскольку векторные процессоры весьма дорого
стоят, эти машины не могут быть общедоступными.

33.

Наиболее популярны три машины PVP-архитектуры:
1.
CRAY X1, SMP-архитектура. Пиковая производительность
системы в стандартной конфигурации может составлять десятки
терафлопс.
EC SX-6, NUMA-архитектура. Пиковая производительность
системы может достигать 8 Тфлопс, производительность одного
процессора составляет 9,6 Гфлопс. Система масштабируется с
единым образом операционной системы до 512 процессоров.
3. Fujitsu-VPP5000 (vector parallel
processing), MPP-архитектура.
Производительность одного процессора
составляет 9.6 Гфлопс, пиковая
производительность системы может
достигать 1249 Гфлопс, максимальная
емкость памяти – 8 Тбайт.
2.

34. Кластерная архитектура

Кластер представляет собой два или более компьютеров
(часто называемых узлами), объединяемые при помощи
сетевых технологий на базе шинной архитектуры или
коммутатора и предстающие перед пользователями в
качестве единого информационно-вычислительного
ресурса.
В качестве узлов кластера могут быть выбраны серверы,
рабочие станции и даже обычные персональные
компьютеры. Узел характеризуется тем, что на нем
работает единственная копия операционной системы.
Преимущество кластеризации для повышения
работоспособности становится очевидным в случае сбоя
какого-либо узла: при этом другой узел кластера может
взять на себя нагрузку неисправного узла, и пользователи
не заметят прерывания в доступе

35. ТОП 500 СуперЭВМ

1 место:
СУПЕРКОМПЬЮТЕР FUGAKU (ЯПОНИЯ)
Создан корпорацией Fujitsu совместно со
специалистами Рикэн. Он способен совершать более
415 квадриллионов вычислений в секунду.
Ядра: 7 630 848,
Память: 5 087 232 ГБ,
Производительность: 442 010 терафлоп/с.
"Фугаку" задействован более чем в сотне
различных исследований, в том числе
связанных с пандемией, разработками в
области искусственного интеллекта и
прогнозированием погоды.
"Фугаку" - одно из наименований
священной для японцев горы Фудзи.

36. ТОП 500 СуперЭВМ

2 место
САММИТ —(США)
Производитель - IBM .
Ядра: 2 414 592,
Память: 2 801 664 ГБ,
Процессор: IBM POWER9 22C
3,07 ГГц,
Производительность: 148 600
терафлоп/с,

37. ТОП 500 СуперЭВМ

3 место
SIERRA —(США)
Производитель - IBM / NVIDIA / Мелланокс.
Ядра: 1 572 480,
Память: 1 382 400 ГБ,
Процессор: IBM
POWER9 22C 3,1
ГГц,
Производительность:
94 640 терафлоп/с.

38. ТОП 500 СуперЭВМ РОССИЯ

11 место
SSC-21 — APOLLO 6500 GEN10 PLUS
ПРОИЗВОДИТЕЛЬ - HPE
Ядра: 204 160,
Память: 225 280 ГБ,
Процессор: AMD EPYC 7543
32C 2,8 ГГц,
Производительность: 25 177
терафлоп/с
Samsung Electronics

39. ТОП 500 СуперЭВМ РОССИЯ

19 место
Червоненкис - ЯНДЕКС
Ядра: 193 440,
Память: 199 680 ГБ,
Процессор: AMD EPYC 7702
64C 2 ГГц,
Производительность: 21 530
терафлоп/с,
Производитель: ЯНДЕКС,
NVIDIA

40.

Россия переместилась с 11-го на седьмое место
среди стран, имеющих системы суперкомпьютеров,
следует из рейтинга TOP 500. В рейтинг попали три
суперкомпьютера от «Яндекса» — «Червоненкис»
(занял 19-е место), «Галушкин» (36-е) и «Ляпунов»
(40-е), два от Сбербанка — Christofari Neo (43-е) и
Christofari (72-е), Lomonosov-2 от МГУ (241-е), а также
Grom от компании МТС (294-е) (для сравнения: у
Китая – 206).
Самый мощный из общественно известных российских
суперкомпьютеров — «Червоненкис» находится в Сасове
(Рязанская область). Там же находится и «Ляпунов».
Суперкомпьютер «Галушкин» находится во Владимире, а
«Кристофари» и «Кристофари Нео» в Москве, в Сколково. Также,
в Москве находятся «Ломоносов-2» (МГУ) и ещё один
не вошедший в TOP500 — суперкомпьютер Росгидромета
России производительностью 1,2 петафлопс.

English Русский Правила