ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 26.10.2023
Просмотров: 656
Скачиваний: 2
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
СОДЕРЖАНИЕ
АРХИТЕКТУРЫ, ХАРАКТЕРИСТИКИ, КЛАССИФИКАЦИЯ ЭВМ
3. ФУНКЦИОНАЛЬНАЯ И СТРУКТУРНАЯ
4. ПРИНЦИПЫ ОРГАНИЗАЦИИ ПОДСИСТЕМЫ ПАМЯТИ ЭВМ И ВС
ОРГАНИЗАЦИЯ СИСТЕМНОГО ИНТЕРФЕЙСА И ВВОДА/ВЫВОДА ИНФОРМАЦИИ
МНОГОПРОЦЕССОРНЫЕ И МНОГОМАШИННЫЕ ВЫЧИСЛИТЕЛЬНЫЕ СИСТЕМЫ
Расширения SSE2, SSE3, SSSE3, SSE4
Расширение SSE2, введенное в состав Pentium 4 Northwood, значи- тельно расширяет возможности обработки нескольких операндов по принципу SIMD по сравнению с SSE. В нем используется 144 новых команды, обеспечивающих одновременное выполнение операций над несколькими операндами, которые располагаются в памяти и в 128- разрядных регистрах ХММ. В регистрах могут храниться и одновре- менно обрабатываться два числа с плавающей запятой в формате двой- ной точности (64 разряда) или 4 числа в формате одинарной точности (32 разряда), любые целочисленные типы данных, способные разме- ститься в 128-разрядных регистрах.
Расширение SSE2, представляя собой симбиоз ММХ и SSE, обла- дает большей гибкостью и позволяет добиваться впечатляющего приро- ста производительности. Команды SSE2 существенно повышают эф- фективность процессора при реализации трехмерной графики и Интер-
нет-приложений, обеспечение сжатия и кодирования аудио- и видео- данных и в ряде других приложений.
Расширение SSE3, введенное в состав Pentium 4 Prescott, включает 5 новых операций с комплексными числами, 5 потоковых операций над числами с плавающей запятой, 2 команды для синхронизации потоков и одну специальную инструкцию для применения при кодировании видео.
Расширение SSSE3 (Supplemental SSE3 – дополнительное потоко- вое SIMD-расширение 3) появилось в процессорах с микроархитектурой Intel Core и поддерживается процессором Intel Atom. Новыми в SSSE3, по сравнению с SSE3, являются 16 уникальных
команд, работающих с упакованными целыми данными. Каждый из них может работать как с 64-битными (ММХ), так и с 128-битными (ХММ) регистрами, поэтому Intel в своих материалах ссылается на 32 новые команды. Новые ин- струкции включают работу со знаком, сдвиги, перемешивание байт, умножение, горизонтальное сложение/вычитание целых.
Расширение_SSE4.1'>Расширение SSE4.1 появилось в первом процессоре Intel c 45 нм техпроцессом (кодовое наименование Penryn). Набор команд SSE4.1 вклю- чает 47 новых инновационных инструкций, основными из которых являют- ся примитивы векторизации для компиляторов и ускорители кодирования видеозаписей с высоким расширением и обработки фотоизображений.
Расширение SSE4.2 разработано Intel для процессоров с новой микроархитектурой Nehalem. Введенные в набор SSE4.2 инструкции ориентированы на ускорение обработки строк и текстовой информации. Ни одна из SSE4 инструкций не работает с 64-битными ММХ-
регистрами, только с 128-битными ХММ-регистрами.
Расширения AES-NI
Расширение AES-NI (Advanced Encryption Standard New Instructions) – набор из 6 новых SIMD-инструкций, ускоряющий процесс шифрования и дешифрования информации по стандарту AES. Стандарт AES является стандартом шифрования США, принятым в 2000 г. Он специфицирует алгоритм Rijndael, который представляет собой симмет- ричный блочный шифр, работающий с блоками длиной 128 бит, и ис- пользует ключи длиной 128, 192 и 256 бит. По заявлению правительства США для взлома шифрования при использовании 128-битного ключа потребуется 149 триллионов лет.
Расширения AVX
Новое расширение AVX (Advanced Vector Extensions) – расшире- ние системы команд х86 для микропроцессоров с новой микроархитек- турой Intel Sandy Bridge (2010 г.) и процессоров AMD Bulldozer (2011 г.),
анонсированная Intel в 2008 г., представляет различные улучшения, но- вые инструкции и новую схему кодирования машинных кодов. Размер векторных регистров SIMD увеличивается со 128 (ХММ) до 256 бит (регистры YMM). Существующие 128-битные инструкции будут ис- пользовать только младшую половину новых YMM-регистров. В буду- щем возможно расширение до 512 или 1024 бит. Набор инструкций AVX позволяет использовать любую двухоперандную инструкцию ХММ в трехоперандном виде без модификации двух регистров- источников, с отдельным регистром для результата. Добавлены ин- струкции с количеством операндов более трех. Новая система кодиро- вания машинных кодов VEX предоставляет новый набор префиксов ко- да, которые расширяют пространство возможных машинных кодов. Ис- пользование YMM-регистров поддерживают операционные системы: Windows 7, Windows Server 2008 R2, Linux (версия ядра 2.6.30).
Расширение AVX подходит для интенсивных вычислений с плава- ющей точкой в мультимедийных
, научных и финансовых задачах. Уве- личивает степень параллелизма и пропускную способность в веще- ственных SIMD-вычислениях.
Расширения AVX2, FMA3, BMI
Набор инструкций AVX2 является расширением набора AVX и используется в процессорах с новой микроархитетурой Haswell. Глав- ное отличие нового набора инструкций AVX2 от прежней версии AVX заключается в том, что если ранее 256-битные операции с AVX реги- страми были доступны только для операнда с плавающей запятой, а для целочисленных операндов были доступны лишь 128-битные операции, то в AVX2 256 операции стали доступны и для целочисленных операн- дов.
Кроме того в AVX2 появилась улучшенная поддержка сдвигов и перестановок в векторных операциях. Есть и новые инструкции, ис- пользуемые для сборки нескольких (4-х или 8-ми) несвязанных элемен- тов в один векторный элемент, благодаря чему есть возможность более полно загружать 256-битные AVX регистры.
Новый набор инструкций FMA3 (Fused Multiply Add) использу- ется в процессорах с новой микроархитетурой Haswel и предназначен для проведения операций совмещённого умножения и сложения над 3- мя операндами. Использование операций FMA3 позволяет более эффек- тивно реализовать операции деления, извлечение квадратного корня, умножения векторов и матриц и т.д. Набор FMA3 включает 36 инструк-
ций с плавающей запятой для выполнения 256-битных вычислений и 60 инструкций для 128-битных векторов.
В набор команд BMI (Bit Manipulation Instructions) входят 15 ска- лярных инструкций для битовых операций, которые работают с цело- численнами регистрами общего
назначения.
Эти инструкции разбиты на три группы:
-
манипуляции на отдельными битами, такие как вставка, сдвиг и извлечение бит; -
подсчет битов, например, подсчет ведущих нулей в записи чисел; -
целочисленное умножение произвольной точности.
Данный набор инструкций позволяет ускорять ряд специфических операций, используемых, например, при шифровании.