Експериментални дизајн

Из Википедије, слободне енциклопедије
Иди на навигацију Иди на претрагу
Експериментални дизајн са пуним факторским дизајном (лево), респонсна површина полинома другог реда (десно)

Експериментални дизајн (ДОЕ, ДОX, или дизајн експеримената) је дизајн било којег задатка који има за циљ да опише или објасни варијацију информација под условима за које је постављена хипотеза да одражавају варијацију. Термин се генерално повезује са експериментима у којима дизајн уводи услове који директно утичу на варијацију, али се такође може односити на дизајн квази-експеримената, у којима су природни услови који утичу на варијације одабрани за посматрање.

У свом најједноставнијем облику, експеримент има за циљ да предвиди исход увођењем промене предуслова, која је представљена са једном или више независних варијабли, које се такође називају „улазне варијабле” или „предикторске варијабле”. Промена једне или више независних варијабли се генерално претпоставља да доводи до промене једне или више зависних варијабли, које се такође називају „излазне варијабле” или „варијабле одговора”. Експериментални дизајн може такође идентификовати контролне варијабле које се морају одржавати константним како би се спречило да спољни фактори утичу на резултате. Експериментални дизајн укључује не само избор одговарајућих независних, зависних и контролних варијабли, већ и планирање испоруке експеримента под статистички оптималним условима, с обзиром на ограничења расположивих ресурса. Постоји више приступа за одређивање скупа пројектних тачака (јединствене комбинације поставки независних варијабли) које ће се користити у експерименту.

Главни проблеми у експерименталном дизајну укључују утврђивање валидности, поузданости и репликабилности. На пример, ова три аспекта могу бити делимично решина пажљивим одабиром независних варијабли, чиме се смањује ризик од грешке у мерења и осигурава да је документација методе довољно детаљна. Повезани проблеми укључују постизање одговарајућих нивоа статистичке моћи и осетљивости. Исправно дизајнирани експерименти унапређују знање из природних и друштвених наука и инжењерства. Остале апликације укључују маркетинг и креирање смерница. Проучавање дизајна експеримената је важна тема у метанауци.

Историја[уреди]

Систематска клиничка испитивања[уреди]

Године 1747, док служио као хирург на ХМС Солсбери, Џејмс Линд спровено је систематско клиничко испитивање ради поређивања лекова за скорбут.[1] То систематско клиничко испитивање представља врсту експерименталног дизајна.

Линд је одабрао 12 људи са брода, сви од којих су патили од скорбута. Линд је ограничио своје субјекте на мушкарце који су „били међусобно слични колико је то било могуће”, односно, он је применио строге улазне захтеве да би се умањиле ирелевантне варијације. Он их је поделио у шест парова, дајући сваком пару различите допуне њиховој основној исхрани током периода од две недеље. Третмани су били лекови који су у то време били предложени:

Цитрусни третман је окончан након шест дана кад им је понестало воћа, али до тада је један морнар већ био спреман за дужност, док се други готово опоравио. Изузев тога, само једна група (јабуковача) показала је одређени учинак лечења. Остатак посаде је веројатно служио као контрола, али Линд није известио о резултатима из било које контролне (нетретиране) групе.

Статистички експерименти[уреди]

Иницијални допринос разводју теорије статистичког закључивања је направио Чарлс Сандерс Перс са радовима „Илустрације логике науке” (1877–1878) и „Теорија вероватног закључивања” (1883). У ове две публикације он је нагласио значај закључивања заснованог на рандомизацији у статистици.

Рандомизовани експерименти[уреди]

Чарлс Сандерс Перс је рандомно распоредио волонтере у слепом, понављено-мереном дизајну да би проценио њихову способност да дискриминирају тежине.[2][3][4][5] Персов експеримент инспирисао је друге истраживаче у психологији и образовању, који су развили истраживачку традицију рандомизираних експеримената у лабораторијама и специјализованим уџбеницима током 1800-их.[2][3][4][5]

Оптимални дизајнови за регресионе моделе[уреди]

Чарлс Сандерс Перс је исто тако допринео првој публикацији на енглеском језику о оптималном дизајну за регресионе моделе из 1876. године.[6] Пионирски оптимални дизајн за полиномску регресију предложио је Гергон 1815. године. Кирстен Смит је 1918. објавила оптималне дизајне за полиноме шестог степена (и мање).

Секвенце експеримената[уреди]

Употреба низа експеримената, где дизајн сваког може зависити од резултата претходних експеримената, укључујући и могућу одлуку да се заустави експериментисање, обухваћена је пољем секвенционе анализе. Пионирски допринос овом пољу[7] је учинио Абрахам Валд у контексту секвенцијалних тестова статистичких хипотеза.[8] Херман Черноф је написао преглед оптималних секвенцијалних дизајна,[9] док је С. Закс испитивао адаптивне дизајне.[10] Један специфичан тип секвенцијалног дизајна је „дворуки бандит”, који се може генерализовати у вишеструког бандита, на којем је ране радове извршио Херберт Робинс 1952. године.[11]

Фишерови принципи[уреди]

Методологију дизајнирања експеримената предложио је Роналд Фишер у својим иновативним књигама: Уређење теренских експеримената (1926) и Дизајн експеримената (1935). Велики део његовог пионирског рада бавио се пољопривредним применама статистичких метода. Као свакодневни пример, описао је како се може тестирати хипотеза даме која густира чај, да извесна дама може само по укусу да разликује да ли је млеко или чај први стављен у шољу. Ове методе су нашле широку примену у физичким и друштвеним наукама, и још увек се користе у пољопривредном инжењерству. Оне се разликују од дизајна и анализе рачунарских експеримената.

Поређење

У неким областима студија није могуће имати независна мерења према метролошком стандарду који се може пратити. Поређења између третмана су много вреднија и обично су пожељнија, и често се пореде са научном контролом или традиционалним третманом који служи као основа.

Рандомизација

Случајно додељивање је процес радномног сврставања појединаца у групе или различите групе у експерименту, тако да сваки појединац популације има исту шансу да постане учесник у студији. Случајно распоређивање појединаца у групе (или услова унутар групе) разликује ригорозан, „прави” експеримент од опсервацијске студије или „квази-експеримента”.[12] Постоји опсежна математичка теорија која истражује последице алоцирања јединица на третмане помоћу неког случајног механизма (као што су табеле случајних бројева или употреба уређаја за рандомизацију као што су карте за игру или коцке). Додељивање јединица лечењу насумично има тенденцију да ублажи пометање, које узрокују да се ефекти узроковани факторима који нису део третмана појављују као резултат третмана.

Ризици повезани са рандомном алокацијом (као што је озбиљна неравнотежа у кључној карактеристици између третиране групе и контролне групе) могу се израчунати и стога се могу управљати до прихватљивог нивоа користећи довољно експерименталних јединица. Међутим, ако је популација подељена на неколико субпопулација које се некако разликују, а истраживање захтева да свака субпопулација буде једнака по величини, може се користити стратификовано узорковање. На тај начин, јединице у свакој субпопулацији су рандомизиране, али не и цели узорак. Резултати експеримента могу се поуздано генерализовати из експерименталних јединица на већу статистичку популацију јединица само ако су експерименталне јединице случајни узорак из веће популације; вероватна грешка такве екстраполације зависи, између осталог, од величине узорка.

Статистичка репликација

Мерења су обично предмет варијација и мерне несигурности; стога се она понављају и целокупни експерименти се репликују како би се идентификовали извори варијација, боље проценили стварни ефекти третмана, додатно ојачала поузданост и ваљаност експеримента, и да би се увећало постојеће познавање теме.[13] Међутим, одређени услови морају бити испуњени пре него што се започне репликација експеримента: оригинално истраживачко питање је објављено у рецензираном часопису или широко цитирано, истраживач је независан од оригиналног експеримента, истраживач мора прво покушати да понови оригиналне налазе користећи оригиналне податке, и извештај треба да наведе да је спроведена студија репликациона студија која је покушала да прати оригиналну студију што је могуће стриктније.[14]

Блокирање

Блокирање је нерандомно распоређивање експерименталних јединица у групе (блокове/мноштва) које се састоје од јединица које су сличне једна другој. Блокирање смањује познате али ирелевантне изворе варијација између јединица и на тај начин омогућава већу прецизност у процени извора варијација које се проучавају.

Ортогоналност
Пример ортогоналног факторског дизајна

Ортогоналност се односи на облике поређења (контрасте) које се могу легитимно и учинковито спроводити. Контрасти могу бити представљени векторима и скупови ортогоналних контраста су некорелирани и независно дистрибуирани ако су подаци нормални. Због те независности, сваки ортогоналан третман пружа различите информације од других третмана. Ако постоји Т-третмана и Т-1 ортогоналних контраста, све информације које се могу прикупити из експеримента могу се добити из скупа контраста.

Факторски експерименти

Ови екперименти обухватају употребу факторских експеримената, уместо методе један по један фактор. Они су ефикасни у процени ефеката и могућих интеракција неколико фактора (независних варијабли). Анализа дизајна експеримента изграђена је на основи анализе варијансе, колекције модела који деле уочену варијансу у компоненте, према томе које факторе експеримент мора проценити или тестирати.

Референце[уреди]

  1. ^ Дунн, Петер (јануар 1997). „Јамес Линд (1716-94) оф Единбургх анд тхе треатмент оф сцурвy”. Арцхивес оф Дисеасе ин Цхилдхоод: Фетал анд Неонатал Едитион. 76 (1): 64—65. ПМЦ 1720613Слободан приступ. ПМИД 9059193. дои:10.1136/фн.76.1.Ф64. Приступљено 2009-01-17. 
  2. 2,0 2,1 Пеирце, Цхарлес Сандерс; Јастроw, Јосепх (1885). „Он Смалл Дифференцес ин Сенсатион”. Мемоирс оф тхе Натионал Ацадемy оф Сциенцес. 3: 73—83. 
  3. 3,0 3,1 Хацкинг, Иан (септембар 1988). „Телепатхy: Оригинс оф Рандомизатион ин Еxпериментал Десигн”. Исис. 79 (3): 427—451. ЈСТОР 234674. МР 1013489. дои:10.1086/354775. 
  4. 4,0 4,1 Степхен M. Стиглер (новембар 1992). „А Хисторицал Виеw оф Статистицал Цонцептс ин Псyцхологy анд Едуцатионал Ресеарцх”. Америцан Јоурнал оф Едуцатион. 101 (1): 60—70. ЈСТОР 1085417. дои:10.1086/444032. 
  5. 5,0 5,1 Трудy Дехуе (децембар 1997). „Децептион, Еффициенцy, анд Рандом Гроупс: Псyцхологy анд тхе Градуал Оригинатион оф тхе Рандом Гроуп Десигн”. Исис. 88 (4): 653—673. ПМИД 9519574. дои:10.1086/383850. 
  6. ^ Пеирце, C. С. (1876). „Ноте он тхе Тхеорy оф тхе Ецономy оф Ресеарцх”. Цоаст Сурвеy Репорт: 197—201. , ацтуаллy публисхед 1879, НОАА ПДФ Епринт.
    Репринтед ин Цоллецтед Паперс 7, параграпхс 139–157, алсо ин Wритингс 4, пп. 72–78, анд ин Пеирце, C. С. (1967). „Ноте он тхе Тхеорy оф тхе Ецономy оф Ресеарцх”. Оператионс Ресеарцх. 15 (4): 643—648. ЈСТОР 168276. дои:10.1287/опре.15.4.643. 
  7. ^ Јохнсон, Н.L. (1961). "Сеqуентиал аналyсис: а сурвеy." Јоурнал оф тхе Роyал Статистицал Социетy, Сериес А. Вол. 124 (3), 372–411. (пагес 375–376)
  8. ^ Wалд, А. (1945) "Сеqуентиал Тестс оф Статистицал Хyпотхесес", Анналс оф Матхематицал Статистицс, 16 (2), 117–186.
  9. ^ Херман Цхернофф, Сеqуентиал Аналyсис анд Оптимал Десигн, СИАМ Монограпх, 1972.
  10. ^ Зацкс, С. (1996) "Адаптиве Десигнс фор Параметриц Моделс". Ин: Гхосх, С. анд Рао, C. Р., (Едс) (1996). "Десигн анд Аналyсис оф Еxпериментс," Хандбоок оф Статистицс, Волуме 13. Нортх-Холланд. ISBN 0-444-82061-2. (pages 151–180)
  11. ^ Robbins, H. (1952). „Some Aspects of the Sequential Design of Experiments”. Bulletin of the American Mathematical Society. 58 (5): 527—535. doi:10.1090/S0002-9904-1952-09620-8. 
  12. ^ Creswell, J.W. (2008), Educational research: Planning, conducting, and evaluating quantitative and qualitative research (3rd edition), Upper Saddle River, NJ: Prentice Hall. 2008, p. 300. ISBN 0-13-613550-1
  13. ^ Dr. Hani (2009). „Replication study”. Приступљено 27. 10. 2011. 
  14. ^ Burman, Leonard E.; Robert W. Reed; James Alm (2010), „A call for replication studies”, Public Finance Review, 38 (6): 787—793, doi:10.1177/1091142110385210, Приступљено 27. 10. 2011 

Literatura[уреди]

  • Peirce, C. S. (1877–1878), "Illustrations of the Logic of Science" (series), Popular Science Monthly, vols. 12-13. Relevant individual papers:
    • (1878 March), "The Doctrine of Chances", Popular Science Monthly, v. 12, March issue, pp. 604–615. Internet Archive Eprint.
    • (1878 April), "The Probability of Induction", Popular Science Monthly, v. 12, pp. 705–718. Internet Archive Eprint.
    • (1878 June), "The Order of Nature", Popular Science Monthly, v. 13, pp. 203–217.Internet Archive Eprint.
    • (1878 August), "Deduction, Induction, and Hypothesis", Popular Science Monthly, v. 13, pp. 470–482. Internet Archive Eprint.
    • Peirce, C. S. (1883), "A Theory of Probable Inference", Studies in Logic, pp. 126-181, Little, Brown, and Company. (Reprinted 1983, John Benjamins Publishing Company, ISBN 90-272-3271-7)

Спољашње везе[уреди]