Паралелизам на нивоу наредбе

Паралелизам на нивоу наредбе (енгл. Instruction-level parallelism, ILP) мери колико се операција, у једном рачунарком програму, могу извршити истовремено. Потенцијално преклапање инструкција се назива паралелизам на нивоу наредбе.

Постоје два приступа паралелизму на нивоу наредбе:

Хардверски
Софтверски

Хардверски ниво ради на основу динамичког паралелизма, док софтверски ниво ради на основу статичког паралелизма.^[1] Pentium процесор ради на основу динамичких секвенци паралелног извршавања док Itanium процесор ради на основу паралелизма на статичком нивоу.

Размотримо следећи програм:

e = a + b
f = c + d
m = e * f

Трећа операција зависи од резултата прве и друге операције, тако да се не може добити резултат док се не изврше прве две до краја. Међутим, прве две операције не зависе од других операција тако да се могу извршити истовремено. Ако претпоставимо да се свака операција може завршити у једној јединици времена, онда се овај програм може извршити, укупно, у две јединице времена (добијамо паралелизам на нивоу наредбе 3/2).

Циљ дизајнера компајлера и процесора је да идентификује предност паралелизма на нивоу наредбе и да ту предност искористи што је више могуће. Обични програми се углавном пишу по моделу секвенцијалног извршавања где се инструкције извршавају јена за другом и редоследом који одређује програмер. Паралелизам на нивоу наредбе омогућава процесору и компајлеру преклапање извршавања више инструкција. Може чак дозволити и промену редоследа по коме се инструкције извршавају.

Колико паралелизам на нивоу наредбе постоји у програмима, директно зависи од апликације. У одређеним областима, као што су графика и научна израчунавања, ова врста паралелизма може постојати у великој количини. Међутим, преоптерећења, као што је криптографија, излажу много мање паралелизма.

Микроархитектонске технике које искоришћавају паралелизам на нивоу наредбе:

Проточна обрада инструкциија, где се извршавања више инструкција могу делимично преклапати.
Суперскаларно извршавање, веома дугачке речи инструкција (енгл. very long instruction word, VLIW) и уско повезани EPIC концепти, у којима се више јединица за извршавање користе за паралелно извршавање више инструкција.
Ванредна извршавања (енгл. out-of-order execution, OOE), где се инструкције извршавају у произвољном редоследу који не нарушава зависности података. Ова техника је независна и од проточне обраде и од суперскаларне технике. Тренутна имплементација OOE динамички (нпр. док се програм извршава и без помоћи компајлера) изводи ILP из обичних програма. Алтернативно, може се извести овај паралелизам у времену компајлирања и некако се пренети ова информација хардверу. Због комплексности скалирања OOE технике, индустрија је преиспитала скупове инструкција које експлицитно шифрују више независних операција по инструкцији.
Преименовање регистара, односно техника која се користи да се избегне непотребна серијализација програмских операција које су наметнуте поновном употребом регистара тих операција. Ова техника се користи да би се омогућила "ванредно" извршавање.
Спекулативно извршавање које омогућава извршавање целих инструкција или делова инструкција пре провере да ли би ова извршавања уопште требало да се десе. Форма спекулативног извршавања која се често користи је контрола тока спекулација где се инструкције (које су прошле контролу тока) извршавају пре него што се утврди мета контроле тока. Користе се и још неколико других форми, укључујући спекулативно извршавање које воде предикција вредности, предикција зависности меморије и предикција кашњења кеша.
Предикција гранања, која се корсити да би се избегло одуговлачење ради решаваља контроле зависности. Користи се са спекулативним извршавањем.

Архитектуре токова података су друга класа архитектура где се ILP експлицитно наглашава.

Последњих година, ILP технике су се користиле да би обезбедиле побољшање перформансе упркос повећању разлика између фреквенција рада процесора и времену приступа меморије (рани дизајни ILP-а, као што је IBM 360, су користили технике да савладају ограничења наметнута релативно малим фајловима регистара). Тренутно, кеш пенал за промашај у главној меморији кошта неколико стотина процесорских циклуса. Док је углавном могуће искористити ILP да би дпустио таква кашњења, трошкови повезаног ресурса и расипања енергије су несразмерни. Шта више, комплексност и честа кашњења основних хардверских структура резултују смањење фрекверије рада, и тиме поништавајући било какве бенефиције. Отуда су се наведене технике показале као неадекватне да очувају процесор од одуговлачења за податке ван чипа. Уместо тога, индустрија се креће ка експлоатисању паралелизма вишег нивоа који се може експлоатисати преко техника као што су multiprocessing и multithreading.^[2]

Види још[уреди | уреди извор]

Референце[уреди | уреди извор]

^ Hennessy, John L.; Patterson, David A. Computer Architecture: A Quantitative Approach.
^ Reflections of the Memory Wall

Литература[уреди | уреди извор]

Hennessy, John L.; Patterson, David A. Computer Architecture: A Quantitative Approach.

Спољашње везе[уреди | уреди извор]

[1] Hennessy, John L.; Patterson, David A. Computer Architecture: A Quantitative Approach.

[2] Reflections of the Memory Wall

[1]

[2]

п р у Процесорске технологије
Архитектура	Харвардска Харвардска (модификована) Фон Нојманова Протока података Поређењe процесорских архитектура
Скуп инструкција	ASIP CISC EDGE EPIC MISC OISC RISC VLIW NISC ZISC
Дужина речи	1-bit 4-bit 8-bit 9-bit 10-bit 12-bit 15-bit 16-bit 18-bit 22-bit 24-bit 25-bit 26-bit 27-bit 31-bit 32-bit 33-bit 34-bit 36-bit 39-bit 40-bit 48-bit 50-bit 60-bit 64-bit 128-bit 256-bit 512-bit променљива
Проточна обрада (рачунарство)	Instruction pipelining In-order & out-of-order execution Branch predictor Преименовање регистара Спекулативно извршавање Hazards Bubble
Паралелизам	Bit Bit-serial Word Instruction Scalar Суперскаларност Data Vector Task Thread
Вишенитна обрада	Временска вишенитна обрада Simultaneous multithreading Hyper-threading
Флинова подела	SISD SIMD MISD MIMD SPMD
Типови	Digital signal processor Микроконтролер System on a chip Cellular
Компоненте	Аритметичко-логичка јединица Barrel shifter Floating-point unit Back-side bus Мултиплексер Demultiplexer Registers Јединица за управљање меморијом Бафер асоцијативног превођења Cache Register file Микропрограм Управљачка јединица Clock rate
Располагање енергијом	APM ACPI Динамичко скалирање учестаности Dynamic voltage scaling Clock gating

п р у Паралелна обрада
Опште	Рачунарство у облаку Суперрачунар Кластер рачунари Дистрибуирано рачунарство Мрежно рачунарство
Нивои	Паралелизам на нивоу бита Паралелизам на нивоу наредбе Паралелизам података Паралелизам задатака
Вишенитна обрада	Временска вишенитна обрада Истовремена мултинитност Hyper-threading
Теорија	Амдалов закон Густафсонов закон Ефикасност трошкова Karp–Flatt metric Паралелно успоравање Паралелно убрзавање
Елементи	Процес (рачунарство) Нит (рачунарство) Влакно (рачунарство) PRAM Инструкцијски прозор
Координација	Мултипроцесор Конхерентност меморије Конхерентност кеша Поништење кеша Баријера (рачунарство) Синхронизација (рачунарство) Application checkpointing
Програмирање	Модели паралелног програмирања Иплицитан паралелизам Експлицитан паралелизам Concurrency (Конкурентност) Флинова подела SISD SIMD MISD MIMD SPMD Нит (рачунарство) Не-блокирајући алгоритми
Хардвер	Мултипроцесор Симетрична вишепроцедуралност Асиметрична вишепроцедуралност Полупроводничка меморија NUMA COMA Расподељена меморија Дељена меморија Расподељена општа меморија MPP Суперскаларност Векторски процесор Суперрачунар Беовулф кластер
API	Ateji PX POSIX нити OpenMP OpenHMPP OpenACC PVM MPI UPC TBB Boost.Thread Глобални низови Charm++ Cilk/Cilk Plus Coarray Fortran OpenCL CUDA Dryad C++ AMP
Проблеми	Неометан паралелизам Закључавање софтвера Скалабилност Стање трке Deadlock Livelock Изгладњивање Детерминистрички алгоритам Успоравање паралелизма
Категорија: Паралелни рачунарски системи