Файл: 351-400.pdf

Скачать файл (0,68Мб)

Заказать решение

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 24.12.2021

Просмотров: 1264

Скачиваний: 6

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Ускорение целочисленного умножения 3 6 1

a v

Рис. 7.37. Суммирование ЧП с помощью дерева Уоллеса (вариант 1):

— логика

суммирования; б

—

точечная диаграмма

Умножитель (рис. 7.38) состоит из трех ступеней с высотами 4,3,2 и содержит

16 схем «И», 3 полусумматора, 5 полных сумматоров. Сложение векторов сумм

и переносов в последнем каскаде реализуется четырехразрядным сумматором с по-

следовательным распространением переноса, однако чаще для ускорения привле-
каются более эффективные схемы распространения переноса, например параллель-

ная.

Отметим, что избыточность кодирования, заложенная в алгоритм Уоллеса, при-

водит к тому, что возможно построение различных вариантов схемы дерева. Так,

на рис. 7.39 показана иная реализация дерева Уоллеса для четырехразрядных опе-
рандов.

Как видно, новый вариант схемы никакого выигрыша в аппаратурном плане не

дает.

Схема Уоллеса считается наиболее быстрой, но в то же время ее структура наи-

менее регулярна, из-за чего предпочтение отдается иным древовидным структу-
рам. Основная сфера использования умножителей со схемой Уоллеса — перемно-
жение чисел большой разрядности. В этом случае быстродействие имеет превали-
рующее значение.

При умножении чисел небольшой разрядности более распространена другая схема

сжатия суммирования ЧП — схема дерева Л. Дадда. В ее основе также лежит де-
рево Уоллеса, но реализуемое минимальным числом сумматоров.

3 6 2

Глава 7. Операционные устройства вычислительных машин

Рис.

7.38. Умножитель 4 х 4 со структурой дерева Уоллеса

Рис.

7.39. Суммирование ЧП с помощью дерева Уоллеса (вариант 2):

а —

логика

суммирования;

б —

точечная диаграмма

Схема редукции, предложенная Л. Даддом, начинается с определения высоты

промежуточных матриц частичных произведений: d

-2 и

j+l

= [

1,5 х

dj ]

, пока

dj < п.

Значения для

приведены в табл. 7.3.

Ускорение целочисленного умножения 3 6 3

Таблица 7.3. Таблица высот промежуточных матриц в алгоритме Дадда

Так, 32-разрядный умножитель на базе дерева Дадда имеет высоты промежу-

точных матриц 29,19,13,9,6,4,3 и 2. На j-й от конца ступени умножителя исполь-
зуется минимальное число ПС и СМ, позволяющее сократить число битов в столбце

Если высота столбца, включая переносы, равна h, то число полусумматоров ( N

I 1 C

)

и полных сумматоров

)

составляет:

На рис. 7.40 описан умножитель 4 x 4 , реализующий алгоритм дерева Дадда.

Для этого требуется 16 схем "И", два полусумматора, четыре полных сумматора

и шестиразрядный сумматор. Схема содержит три ступени с высотами промежу-

точных матриц: 4,3 и 2. На этапе суммирования вектора сумм и вектора переносов
необходим (2n - 2)-разрядный сумматор.

Рис, 7.40. Суммирование ЧП с помощью дерева Дадда для случая чисел без знака:

а —

логика

суммирования;

б —

точечная диаграмма

Схема умножения чисел в дополнительном коде, рассмотренная примени-

тельно к матричному умножителю, может быть адаптирована

для умножите-

ля со схемой Дадда. В таком случае схема сжатия приобретает вид, показан-

ный на рис. 7.41.

3 6 4 Глава 7. Операционные устройства вычислительных машин

Рис. 7 . 4 1 . Суммирование ЧП в дополнительном коде с помощью дерева Дадда:

а —

логика

суммирования;

б —

точечная диаграмма

Различия методов Уоллеса и Дадда являются следствием разных подходов к ре-

шению задачи "компрессии" суммирования. Алгоритм Уоллеса ориентирован на

сжатие кодов как можно раньше, на самых ранних этапах, а алгоритм Дадда стре-

мится это сделать по возможности позже, то есть наибольший уровень сжатия от-
носит к завершающим стадиям.

Сравнивая схемы Уоллеса и Дадда, можно отметить, что число каскадов сжа-

тия в них одинаково, однако количество используемых полусумматоров и полных
сумматоров в схеме Дадда меньше (при подсчете числа элементов обычно не учи-
тывают многоразрядные сумматоры, предназначенные для окончательного сложе-
ния векторов сумм и переносов). С другой стороны, на этапе сложения векторов
сумм и переносов в варианте Уоллеса требуется сумматор с меньшим числом раз-
рядов (в нашем примере — 4 против 6).

У обеих схем имеется общий недостаток — нерегулярность структуры, особен-

но у дерева Уоллеса.

Схема перевернутой лестницы

(overturned stairs), предложенная в [169], явля-

ет собой одну из попыток сделать древообразную структуру более регулярной,
а значит, облегчить ее реализацию в интегральном исполнении. «Лестница»стро-
ится из базовых блоков трех видов (рис. 7.42,

а),

которые авторы назвали «вет-

вью» (branch), «соединителем» (connector) и «корнем» (root).

Базовые элементы объединяются, образуя дерево, имеющее

входов, Подоб-

ная схема на 18 входов показана на рис. 7.42,

Как видно, дерево имеет достаточ-

Ускорение целочисленного умножений

3 6 5

Рис.

7.42. Перевернутое дерево:

—

базовые блоки;

— структура дерева на 18 входов

но регулярную структуру, однако нужно учитывать, что веса отдельных входов

различаются. Кроме того, конструкция умножителя получается сложной.

Сравнительная оценка схем умножения

с матричной и древообразной структурой

В табл. 7.4 приведены данные по производительности различных видов умножи-
телей, выполненных средствами интегральной схемотехники. Быстродействие
умножителей характеризуется коэффициентом при величине задержки

В ОДНОМ

логическом элементе.

Таблица

7.4. Сравнение производительности умножителей в интегральном исполнении*

—

разрядность сомножителей.