ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 05.12.2023
Просмотров: 90
Скачиваний: 1
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
х86, MMX SSE SSE2 SSE3 3DNOW
Архитектура ЦП Конвейер
Сегодняшние процессоры обеспечивают совмещение выполнения нескольких последовательно расположенных команд во времени, образуя конвейерную обработку. Процессор разделяет выполнение команды на этапы. Каждый этап называется ступенью.
При конвейерной обработке на выполнение каждого этапа отводится 1 такт тактовой частоты. В каждом новом такте заканчивается выполнение одной команды и начинается выполнение новой. Этот процесс называется поточной обработкой .
Конвейеризация повышает производительность процессора, но она не сокращает время выполнения отдельной команды. Выигрыш получается за счет того, что обрабатывается сразу несколько команд.
Суперскалярный процессор наличие - двух конвейеров.
Суперконвейерный - более 5 этапов в конвейере
Подобное решение резко повышало производительность ЦП. Применяется много конвейерная обработка. Конвейер оказывает заметное влияние на скорость выполнения линейных участков программ, которые могут выполняться параллельно, за исключением операций с плавающей точкой и команд переходов.
Архитектура ЦП Встроенные устройства
Основными компонентами центрального процессора являются ядро, кэш-память и шина.
Ядро процессора выполняет инструкции. Операнды инструкций хранятся в регистрах. Размер регистров определяет разрядность процессора. Понятие «ядро» имеет и топологический смысл — оно размещено в центре микросхемы процессора, а по его периферии располагаются кэш-память и другие блоки. Один и тот же тип процессора может быть построен на различных «ядрах». Сегодня мы имеем многоядерные системы. Размещается 2, 4, 6, 8 ядер на одном кристалле.
Многоядерные процессоры
содержат несколько ядер в одном корпусе.
Ядро процессора выполняет главную функцию – математические вычисления на базе определенного набора инструкций. Любое процессорное ядро имеет свое кодовое название. Количество ядер в одном процессоре зависит от модельного ряда, которое создал производитель. Многоядерные процессоры создаются для многозадачной среды(ОС, где выполняется несколько задач одновременно).
Кэш-память
Кэш-память (RAM cache) — высокоскоростная статическая (SRAM) память, использующаяся для ускорения доступа к данным, хранящимся в более медленной, но дешевой динамической (DRAM) памяти.
Ускорение доступа производится, когда процессор многократно обращается к одним и тем же данным или командам программы. Кэш сохраняет последние данные, команды, и процессор быстро считывает их из кэша.
КЭШ является своего рода буфером, согласующим быстрый процессор и относительно медленную оперативную память, что значительно ускоряет процесс обработки данных.
Бывает 2 типа: L1 и L2 (уровни 1 и 2 от англ. level — «уровень»)
Кэш L1 изначально был интегрирован в кристалл процессора и является его неотъемлемой частью. В нем размешаются инструкции процессора и данные для этих инструкций. Большой кэш L1 очень полезен в условиях многозадачности, так как он хранит так называемый контекст задач, т.е. информацию, необходимую для переключения на эти задачи при поочередном выполнении.
Размер 2*32Кб , 2*64Кб , 2*128Кб , 2*256 Кб.
Кэш L2 служит для компенсации разницы частоты работы процессора и ОЗУ. Располагается или на мат. плате или в корпусе процессора, отдельно от его ядра. Основным его параметром является размер: чем он больше, тем быстрее работает система. Но память эта дорогостоящая, поэтому размер Кэша является компромиссом между производительностью и стоимостью системы. Типичные размеры кэшпамяти для разных процессоров (512Кб, 1Мб, 2Мб, 4Мб)
Кэш позволяет повысить производительность за счет уменьшения случаев ожидания поступления информации из более медленной ОП. Нужные команды и данные берутся из более быстрого Кэша, куда заранее заносятся.
Использование двух КЭШей исключает конфликты при считывании информации, идет одновременное считывание.
Архитектура ЦП Шина процессора
Связь процессора с другими устройствами на системной плате, в частности с основной памятью, осуществляется через шину процессора. Заметим, что раньше и основная память, и процессор находились на одной шине, которая называлась системной.
Сейчас для повышения производительности процессор имеет собственную шину. (1200МГц 1066МГц, 800МГц, 533МГц, 333МГц).
УПРОЩЕННАЯ ЛОГИЧЕСКАЯ СХЕМА ОДНОЯДЕРНОГО ПРОЦЕССОРА
Информационная магистраль (шина)
Шина данных (8, 16, 32, 64 бита) |
Шина адреса (16, 20, 24, 32, 36, 64 бита) |
Шина управления |
Оперативная память
Процессор
Шина данных
Шина управления
Шина адреса
Кэш-память 2-го уровня
Арифметико-логическое устройство
Целых чисел Чисел с плавающей запятой
Кэш-память данных 1-го уровня
Кэш-память команд 1-го уровня
Декодер команд
Архитектура ЦП
В процессоре можно выделить еще следующие основные части:
блок предсказания ветвлений (адреса перехода –БПАП);
блок вычислений с плавающей точкой;
средства обнаружения ошибок ЦП
Контроль ветвлений программы
Если в программе встречается условный или безусловный переход, то после декодирования инструкции перехода и получения адреса процессор начинает считывать данные с нового адреса. Ясно, что до получения этого адреса конвейер простаивает.
Подобная ситуация происходит достаточно часто, поэтому для снижения "негативных" последствий ветвлении программы все переходы, встречающиеся в программе, запоминаются в специальном буфере адресов переходов (branch target buffer). При выполнении инструкции перехода процессор проверяет наличие адреса в буфере и начинает чтение программы с этого адреса.
В случае безусловного перехода создается таблица "истории" переходов, исходя из которой процессор решает будет произведен переход или нет, и начинает выполнение инструкций с предсказанного адреса - так называемое опережающее исполнение (speculative execution).
Понятно, что если адрес предсказан неправильно, то все выполнение прекращается, конвейер очищается и начинается исполнение с правильного адреса. Поэтому весьма важно, чтобы вероятность правильного прогноза была наиболее высокой. В современных процессорах она лежит в пределах 80-90%.
Блок предсказания адреса перехода позволяет повысить производительность за счет экономии времени путем предсказания возможных путей выполнения разветвляющего алгоритма..
Блок вычислений с плавающей точкой FPU (Floating Point Unit).
Данный блок обеспечивает выполнение операций с плавающей точкой и мультимедийных операций ММХ. Обычно он содержит свой отдельный конвейер, так как правило, такие операции могут исполняться только в одном конвейере. На производительность блока FPU в последнее время стали обращать внимание из-за появления множества приложений, написанных для команд ММХ или для работы с трехмерной графикой, не говоря уже о чисто вычислительных задачах..
Являясь очень сложными устройствами, современные процессоры имеют возможности настройки своих параметров. Например, в процессорах Pentium можно отключать второй конвейер или блок предсказания ветвлений, что позволяет оценить прирост производительности, обеспечиваемый этими элементами ядра процессора. Кроме того, практически все процессоры имеют свою так называемую визитную карточку -
специальную инструкцию, которая помогает однозначно идентифицировать процессор. Данная инструкция называется CPUID и выдает ИМЯ фирмы разработчика, тип семейств, модель и версию процессора, а также показывает его основные свойства, в частности наличие блока FPU или ММХ.
Средств обнаружения ошибок ЦП
Наличие средств обнаружения ошибок ЦП.
В ЦП имеются устройства самотестирования для проверки работоспособности большинства элементов процессора.
Используя специальный формат данных: бит четности, т.е. к каждому операнду добавляется бит четности, в результате все числа становятся четными, появление нечетного числа – сигнал о сбое при работе процессора.
ПРОИЗВОДИТЕЛЬНОСТЬ ПРОЦЕССОРА
В настоящее время производительность процессора увеличивается путем совершенствования архитектуры процессора.
Во-первых, в структуру процессора вводится кэш-память 1-го и 2-го уровней, которая позволяет ускорить выборку команд и данных и тем самым уменьшить время выполнения одной команды.
Во-вторых, вместо одного ядра процессора используется два ядра, что позволяет повысить производительность процессора примерно на 80%.
Средства термозащиты процессоров. Вы время работы процессоры сильно нагреваются — их температура достигает 7О...9О°С. Перегрев процессора грозит большими неприятностями, вплоть до полного выхода его из строя. Он может просто перегореть, как любой электрический прибор. Поэтому конструкция процессора должна предусматривать эффективную систему охлаждения.
Собственно системный блок компьютера и так оснащен вентилятором, но он предназначен в основном для охлаждения самого блока питания и лишь частично для охлаждения материнской платы с установленным на ней процессором. Для современных процессоров, которые имеют мощность 40...70 Вт, этого недостаточно. Поэтому центральный процессор снабжен своей собственной системой охлаждения. Она состоит из радиатора, который крепится непосредственно на корпусе процессора, и вентилятора, который охлаждает ребра радиатора.
Кулер для процессора
Радиатор. Это металлическая пластина с ребристой поверхностью, за счет него существенно увеличивается теплообмен процессора с окружающей средой. Площадь поверхности кристалла процессора чрезвычайно мала и не превышает нескольких квадратных сантиметров. Это совершенно недостаточно для эффективного отвода тепловой мощности, рассеиваемой процессором. Благодаря ребристой поверхности радиатор в сотни раз увеличивает площадь своего теплового контакта с окружающей средой.
В настоящее время используются различные типы радиаторов.
Кулер для процессора
Типы радиаторов
Прессованные (экструзионные) радиаторы. Это наиболее простые, дешевые и распространенные радиаторы. Для их производства используется алюминий — металл с достаточно высокой теплопроводностью. Радиаторы изготавливаются методом прессования, что позволяет получить достаточно сложный профиль поверхности и достичь хороших теплоотводящих свойств.
Складчатые радиаторы. Отличаются довольно интересным технологическим исполнением: на базовой пластине радиатора пайкой или с помощью специальных теплопроводящих паст закрепляется тонкая металлическая лента, свернутая в гармошку, складки которой играют роль ребристой поверхности. Такие радиаторы обычно изготавливаются из меди — она имеет более высокую теплопроводность, чем алюминий.
Типы радиаторов
Кованые (холодноформированные) радиаторы. Для их изготовления используется технология холодного прессования, которая позволяет формировать поверхность радиатора в виде стрежней различного сечения. Основной материал — алюминий, но иногда для улучшения теплоотводящих свойств в основание устанавливают медные пластины. Это довольно сложная технология, поэтому кованые радиаторы дороже «экструзионных» и «складчатых», но не всегда лучше в плане тепловой эффективности.
Точеные радиаторы. На сегодня это наиболее дорогостоящие изделия, поскольку их производство основано на высокоточной механической обработке монолитных заготовок. Они отличаются не только самыми высокими эксплуатационными характеристиками, но и высокой ценой. Изготавливаются из меди и аллюминия.
Вентиляторы
Вентиляторы.
На сегодня даже самые совершенные радиаторы не справляются с задачей эффективного охлаждения высокопроизводительных процессоров.
Существенно улучшить теплообмен можно только с помощью специальных микровентиляторов — кулеров (от англ. cool — «охлаждать»), которые устанавливаются над радиатором и обдувают его ребра струей воздуха. Как и любой другой вентилятор, кулер состоит из электродвигателя, на оси которого закреплена крыльчатка.
Основной характеристикой вентилятора является его производительность — величина, показывающая объем прокачиваемого воздушного потока. Типичные значения расхода — 10 …80 кубических дюймов в минуту.
Чем больше производительность вентилятора, тем лучше он охлаждает процессор.