Нацрт:Сложено претраживање података

С Википедије, слободне енциклопедије

Сложено претраживање података описује истраживачко поље које се бави применом претраживања података, машинског учења и статистике, па све до информација које су добијене из образовних оквира (као што су универзитети и паметни туторски системи). На високом нивоу, овa област тражи решења за развој и побољшање метода за истраживање ових података, који често имају више нивоа смисaoне хијерархије, у циљу откривања нових увида о начинима на које људи уче кроз контекст оваквих поставки. [1] Чинећи то, сложено претраживање података је допринело теоријама учења које су истраживали истраживачи у образовној психологији и наукамa o учењу. [2] Ова област је уско повезана са аналитиком учења, и ове две области се међусобно пореде и супротстављају. [3]

Дефиниција[уреди | уреди извор]

Претраживање података се односи на технике, алате и истраживања, и моделовано је за аутоматско екстраховање значења из великих база података које су произашле из, или су повезане са активностима учења људи у образовним окружењима. Ови подаци су врло често опсежни, детаљно изанализирани и прецизни. На пример, неколико система за управљање учењем (LMS) прате информације, нпр. могу да прате рад сваког ученика и њихов приступ предмету учења, колико пута је ученик приступио предмету и колико се минута корисник задржао на одређеном предмету. Затим, кроз пример интелигентних туторских система, можемо видети како се подаци бележе сваки пут када ученик предложи решење проблема. Они могу прикупити време за предају рада, без обзира на то да ли се решење подудара са очекиваним решењем, количину времена која је прошла од последњег уноса, редослед којим су решења унесене у програмски интерфејс и сл. Прецизност ових података је таква да чак и прилично кратка сесија у рачунарском окружењу за учење ( нпр. 30 минута) може произвести велику количину података који захтевају даљу анализу.

У другим случајевима подаци нису толико детаљно изанализирани. На пример, препис са факултета може да садржи временски уређену листу предмета које је студент похађао, оцену коју је студент добио на сваком предмету и када је студент изабрао или променио академску спрему . ЕDМ користи обе врсте података да би открио корисне информације о различитим типовима ученика и о начину њиховог учења, структури подручја знања и ефекту стратегија подучавања, које су уграђене у различита окружења за учење. Ове анализе нас опскрбљују новим информацијама, које би било тешко распознати уколико бисмо посматрали само сирове, необрађене податке. На пример, анализирање података из LМS-а може нам помоћи у откривању везе између предмета учења, којима су студенти имао приступ током похађања наставе и њихове коначне оцене. Слично томе, анализа преписа података ученика, може открити везу између оцена студената из одређеног предмета и њихове одлуке да промене свој смер образовања. Такве информације нам пружају увид у модел образовног окружења, што омогућава ученицима, наставницима, школским администраторима и творцима образовне политике да доносе утемељене одлуке о томе како да узајамно делују, да обезбеде и да управљају образовним садржајем.

Историја[уреди | уреди извор]

Иако анализа образовних података сама по себи није нова вештина, недавни напредак у образовној технологији, укључујући све већи значај снаге процене и способности уочавања фино изанализираних података о употреби рачунарског образовног окружења. Све ове компоненте су допринеле повећаности интересовања за развој техника за анализу велике количине података прикупљених у образовним окружењима. Ово интересовање преточено је у низ ЕDМ радионица одржаних од 2000. до 2007. године, у оквиру неколико међународних истраживачких конференција . [4] Група истраживача основала је 2008. годишњу међународну конференцију на тему ЕDМ-а, од којих се прва одржала у Монтреалу, Квебек, Канада. [5]

Како је интересовање за ЕDM наставило да расте, истраживачи ЕDM-а су 2009. године основали академски часопис под називом Journal of Educational Data Mining(Часопис о претраживању података у области образовања). Овај часопис је требало да омогући лакшу размену и ширење резултата истраживања. 2011. истраживачи ЕDM-а основали су Међународно друштво за претраживање података у области образовања, како би лакше повезали истраживаче ЕDМ-а и наставили да напредују у овој области.

Увођењем јавно доступних база података о образовању 2008. године, попут: Pittsburgh Science of Learning Centre Data shop, (отворен репозиторијум података и скуп повезаних алата за визуелизацију и анализу) и Републичког завода за статистику, јавни скупови података учинили су прикупљање образовних података много приступачнијим и изводљивијим, а самим тим су допринели и њиховом расту. [6]

Циљеви[уреди | уреди извор]

Рајан С. Бејкер и Калина Јасеф [7] утврдили су следећа четири циља ЕDM-а:

  1. Предвиђање будућих ученичких навика - Коришћењем студентског моделирања, овај циљ може бити постигнут стварањем студентских модела који се односе на особине ученика, укључујући разматрање детаљних информација, као што су знање ученика, понашање и мотивација при учењу. Такође се мери њихово корисничко искуство, као и укупно задовољство самим процесом учења.
  2. Откривање или побољшање модела домена - Кроз различите методе и примене ЕDМ-а могуће је откривање нових и побољшања постојећих модела. Примери укључују илустрацију образовног садржаја, за укључивање ученика и одређивање оптималних наставних редоследа, како би подржали стил учења ученика.
  3. Изучавање ефеката образовне подршке који се могу постићи кроз система учења.
  4. Унапређење научног знања о учењу и ученицима кроз изградњу и имплементацију студентских модела, поље истраживања ЕDM-a и технологије и софтвера који се употребљавају.

Корисници и заинтересоване стране[уреди | уреди извор]

Постоје четири главна корисника и заинтересоване стране укључене у руковођење претраживања података у пољу образовања. Они укључују следеће категорије:

  • Ученици - Ученици су заинтересовани за разумевање потреба студената и метода за побољшање искуства и учинковитости ученика. [8] На пример, ученици могу профитирати и од откривеног знања, користећи EDM алате како би предложили активности и изворе, које могу користити у зависности од њиховог односа према електронском учењу и увида у прошле активности или у примере сличних ученика. [9] А што се тиче млађих ученика, претраживање образовних података, може такође информисати родитеље о напретку њиховог детета у процесу учења. [10] Такође је неопходно ефикасно груписати ученике у електронском окружењу. Изазов је коришћење сложених података за учење и тумачење ових група кроз развијање примењивих модела. [11]
  • Учитељи - Учитељи покушавају да разумеју процес учења и методе које могу применити у циљу побољшања својих наставних метода. Наставници могу да примене EDM, да би утврдили најбољи начин организације и да би саставили наставни план и програм, пронашли најбоље методе за достављање информација о курсевима и алате које ће користити за ангажовање својих ученика за достизање оптималних резултата учења. [12] Нарочито дестилација података, која се користи за људску технику вредновања, и она пружа прилику наставницима да профитирају од самог коришћења EDM-а, јер им омогућава да брзо препознају обрасце понашања, што може подржати њихове наставне методе током трајања часова, или им пак може помоћи да побољшају будуће часове. Натавници могу одредити показатеље који утичу на задовољство ученика и њихову ангажованост на предмету, а могу пратити и њихов напредак у учењу.
  • Истраживачи - Истраживачи се фокусирају на развој и процену ефикасности техника претраживања података. Годишња међународна конференција за истраживаче започела је 2008. године, претходећи оснивању Јournal of Educational Data Mining, 2009. године. Широк спектар тема у ЕDM-у тичу се коришћења претраге података, како би се побољшала ефикасност образовних институција у напредовању ученика.
  • Администратори - Администратори су одговорни за расподелу ресурса за примену у институцијама. Како се институције све више сматрају одговорним за успех ученика, администрирање ЕDМ апликација постаје све чешће у образовним окружењима. Факултети и саветници су више укључени у процес идентификовања и обраћања студентима којима је потребна нека врста помоћи при учењу. Међутим, понекад је изазов пренети информације доносиоцима одлука, како би они могли благовремено и ефикасно да спроведу доношење поднетог захтева.

Фазе[уреди | уреди извор]

Како су истраживања на пољу претраживања образовних података наставила да расту, безброј техника претраживања података примењено је у различитим образовним контекстима. У сваком од ових случајева, главни циљ је превести необрађене податке у корисне информације о процесу учења, како би се донеле боље одлуке о плану и путањи окружења за учење. Дакле, EDM се обично састоји од четири фазе: [2] [4]

  1. Прва фаза ЕDM процеса (не рачунајући претходну обраду) је откривање веза међу подацима. То укључује претрагу кроз репозиторијум података из образовног окружења, с циљем проналажења постојаних односа између променљивих . Коришћено је неколико алгоритама за идентификовање таквих односа, укључујући класификовање, регресију, кластеризацију, анализу фактора, анализу друштвених мрежа, претраживање правила удруживања и секвенцијално претраживање узорака .
  2. Откривени односи морају бити потврђени, како би се избегло прекомерно прилагођавање .
  3. Проверене везе се потом користе за предвиђање будућих догађаја у окружењу за учење.
  4. Предвиђања се користе да подрже процесе доношења одлука и политику доношења одлука.

Током треће и четврте фазе подаци се често визуализују или на неки други начин филтрирају, да би били спремни за људско просуђивање. [2] Велика количина истраживања је спроведена у најбољим праксама за визуелизацију података .

Главни приступи[уреди | уреди извор]

Од општих категорија горе поменутих метода, предвиђање, нагомилавање конструкција и претраживање података, сматрају се универзалним методама у свим врстама претраживања података; међутим, Откривање уз помоћ модела и Дестилација података за људско вредновање, сматрају се истакнутијим приступима у оквиру претраживања образовних података. [6]

Откриће уз помоћ модела[уреди | уреди извор]

Уз помоћ методе Откривање помоћу модела, модел се развија предвиђањем, груписањем или управљањем знања уз помоћ људског расуђивања, а затим њихов коришћењем као компоненти у некој даљој анализи, наиме у предвиђању и претраживању односа између њих. [6] У методи предвиђања, креиран модел се користе за предвиђање нове променљиве . За употребу претраживања односа, створени модел нам омогућава анализу између нових предвиђања и додатних променљивих у учењу. У многим случајевима, откривање уз помоћ модела користи већ утврђене моделе предвиђања, који су већ доказали карактеристику уопштавања у различитим контекстима.

Кључне примене ове методе укључују откривање односа између понашања ученика, карактеристика и контекстуалних променљивих у окружењу за учење. [6] Даље откривање општих и специфичних истраживачких питања кроз широк спектар контекста такође се може истражити узв помоћ баш ове методе.

Филтрирање података за просуђивање[уреди | уреди извор]

Људи могу доносити закључке о подацима који могу бити изван опсега који пружа аутоматизована метода тражења података . [6] За сврху тражења образовних података, подаци за људско просуђивање су подељени на основу две кључне улоге: идентификације и класификације .

У циљу идентификације, подаци се филтрирају како би се људима омогућило да уоче добро познате шаблоне, који би иначе могли да буду тешки за превођење. На пример, крива учења, класична за образовне студије, је образац који веома лепо осликава однос између учења и искуства које се стиче током времена.

Подаци се такође издвајају у сврхе класификовања карактеристика података, који се за обраду образовних података користе за подршку развоју модела предвиђања. Класификација изузетно помаже убрзавању развоја модела предвиђања.

Циљ ове методе је да сумира и прикаже информације на користан, интерактиван и визуелно привлачан начин како би се разумеле велике количине података о образовању и подржало доношење одлука . [8] Ова метода је нарочито корисна за наставнике у разумевању информација о употреби и ефикасности у активностима на курсу. Кључне апликације за дестилацију података за људску просудбу укључују препознавање образаца у учењу ученика, понашања, могућности за сарадњу и означавање података за будућу употребу у моделима предвиђања. [6]

Апликације[уреди | уреди извор]

Списак примарних примена ЕDM-а пружају Кристофер Ромеро и Себастијан Вентура. [4] У њиховој таксономији, подручја примене EDM-a су:

  • Анализа и визуелизација података
  • Пружање повратних информација за инструкторе који подржавају
  • Препоруке студентима
  • Предвиђање успеха ученика
  • Моделовање ученика
  • Откривање нежељеног понашања ученика
  • Груписање ученика
  • Анализа друштвене мреже
  • Израда концептуалних мапа
  • Израда програма за учење - EDM се може применити на системе за управљање курсевима као што је Моодле отвореног кода. Моодле садржи податке о употреби који укључују разне активности корисника, као што су резултати тестова, количина завршених читања и учешће на форумима за дискусију . Алати за рударење подацима могу се користити за прилагођавање активности учења сваком кориснику и прилагођавање темпа којим студент завршава курс. Ово је посебно корисно за онлајн курсеве са различитим нивоима компетенција.
  • Планирање и заказивање

Ново истраживање о мобилним окружењима за учење такође сугерише да истраживање података може бити корисно. Ископавање података може се користити за пружање персонализованог садржаја мобилним корисницима, упркос разликама у управљању садржајем између мобилних уређаја и стандардних рачунара и веб прегледача .

Нове EDM апликације фокусираће се на омогућавање нетехничким корисницима да користе и укључују се у алате и активности за рударење података, чинећи прикупљање и обраду података приступачнијим за све кориснике EDM-а. Примери укључују статистичке и визуелне алате који анализирају друштвене мреже и њихов утицај на исходе учења и продуктивност. [13]

Курсеви[уреди | уреди извор]

  1. У октобру 2013. године, Coursera je понудила бесплатни онлајн курс на тему „Велики подаци у образовању“ који је подучавао како и када треба користити кључне методе за EDM. [14] Овај курс се преименован у edX у лето 2015. године, [15] и од тада наставља да се приказује на годишњем нивоу. Архиви курсева се сада може проступити електронским путем. [16]
  2. Teachers College, Columbia University нуди мастер програм у области Аналитике учења. [17]

Место издавања[уреди | уреди извор]

Знатан део EDM рада објављен је на рецензираној Међународној конференцији о рударству података о образовању, коју је организовало Међународно друштво за истраживање података о образовању .

ЕДМ радови су такође објављени у Јоурнал оф Едуцатионал Дата Мининг (ЈЕДМ).

Многи ЕДМ радови се рутински објављују на сродним конференцијама, као што су вештачка интелигенција и образовање, интелигентни системи подучавања и моделирање корисника, прилагођавање и персонализација .

2011. године, Цхапман & Халл / ЦРЦ Пресс, Таилор и Францис Гроуп објавили су први Приручник о рударству образовних података. Овај ресурс је створен за оне који су заинтересовани за учешће у заједници образовних података. [13]

Такмичења[уреди | уреди извор]

У 2010. години одржан је KDD куп Удружења за рачунарске машине користећи податке из образовног окружења. Скуп података обезбедио је Pittsburgh Science of Learning Center's DataShop а састојао се од преко 1.000.000 тачака података ученика који су користили когнитивног тутора. Шест стотина тимова надметало се за преко 8.000 УСД новчане награде (коју је донирао Фејсбук). Циљ такмичара био је да осмисле алгоритам који би, након учења из пружених података, направио најтачнија предвиђања на основу нових података. Победници су предали алгоритам који је користио генерисање карактеристика (облик учења представљања), случајне шуме и бајесове мреже .

Трошкови и изазови[уреди | уреди извор]

Уз технолошки напредак повезани су и трошкови и изазови повезани са применом ЕDM апликација. То укључује трошкове складиштења евидентираних података и трошкове повезане са ангажовањем особља посвећеног управљању системима података. [18] Штавише, системи података се можда неће увек неприметно интегрисати, па чак и уз подршку статистичких и визуелних алата, стварање поједностављене верзије података може бити тешко. Штавише, одабир података за руковање и анализу такође може бити изазов што почетне фазе чини врло дуготрајним и радно интензивним. Од почетка до краја, ЕDMстратегија и примена захтева да се придржавају приватности и етике за све укључене заинтересоване стране.

Критике[уреди | уреди извор]

  • Генерализација - Истраживање у EDM-у може бити специфично за одређену образовну поставку и време у којем је истраживање спроведено, и као такво, можда неће бити уопштено за друге институције. Истраживање такође указује да је поље вађења образовних података концентрисано у западним земљама и културама, а после тога друге земље и културе можда неће бити представљене у истраживању и налазима. [7] Развој будућих модела треба да размотри примену у више контекста.
  • Приватност - Приватност приватника је стална брига за примену алата за рударење подацима. Уз бесплатне, приступачне и корисничке алате на тржишту, студенти и њихове породице могу бити у опасности због информација које ученици пружају систему учења, у нади да ће добити повратне информације које ће им бити од користи у будућности. Како корисници постају паметни у разумевању приватности на мрежи, администратори образовних алата за рударење података морају бити проактивни у заштити приватности својих корисника и бити транспарентни о томе како и с ким ће се информације користити и делити. Развој ЕДМ алата треба да размотри заштиту приватности појединаца, а да истовремено унапређује истраживање у овој области.
  • Плагирање - Откривање плагијара стални је изазов за наставнике и наставнике било у учионици или на мрежи. Међутим, због сложености повезане са откривањем и спречавањем дигиталног плагијаризма, алати за обраду образовних података тренутно нису довољно софистицирани да би се тачно решили овај проблем. Стога би развој предиктивних способности у питањима везаним за плагијаризам требало да буде фокус у будућим истраживањима.
  • Усвајање - Непознато је колико је широко прихваћено EDM и у којој мери су институције примениле и разматрале спровођење стратегијеEDM. Као такво, нејасно је да ли постоје препреке које спречавају кориснике да усвоје EDM у својим образовним поставкама.

Види још[уреди | уреди извор]

Референце[уреди | уреди извор]

  1. ^ „EducationalDataMining.org”. 2013. Приступљено 2013-07-15. 
  2. ^ а б в R. Baker (2010) Data Mining for Education. In McGaw, B., Peterson, P., Baker, E. (Eds.) International Encyclopedia of Education (3rd edition), vol. 7, pp. 112-118. Oxford, UK: Elsevier.
  3. ^ G. Siemens, R.S.j.d. Baker (2012). „Learning analytics and educational data mining: towards communication and collaboration”. Proceedings of the 2nd International Conference on Learning Analytics and Knowledge: 252—254. 
  4. ^ а б в C. Romero, S. Ventura. Educational Data Mining: A Review of the State-of-the-Art. IEEE Transactions on Systems, Man, and Cybernetics, Part C: Applications and Reviews. 40(6), 601-618, 2010.
  5. ^ "http://educationaldatamining.org/EDM2008/" Retrieved 2013-09-04
  6. ^ а б в г д ђ Baker, Ryan. „Data Mining for Education” (PDF). oxford, UK: Elsevier. Приступљено 9. 2. 2014. 
  7. ^ а б Baker, R.S.; Yacef, K (2009). „The state of educational data mining in 2009: A review and future visions”. JEDM-Journal of Educational Data Mining. 1 (1): 2017. 
  8. ^ а б Romero, Cristobal; Ventura, Sebastian (January—February 2013). „WIREs Data Mining Knowl Discov”. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery. 3 (1): 12—27. doi:10.1002/widm.1075.  Проверите вредност парамет(а)ра за датум: |date= (помоћ)
  9. ^ Romero, Cristobal; Ventura, Sebastian (2007). „Educational data mining: A survey from 1995 to 2005”. Expert Systems with Applications. 33 (1): 135—146. doi:10.1016/j.eswa.2006.04.005. 
  10. ^ „Assessing the Economic Impact of Copyright Reform in the Area of Technology-Enhanced Learning”. Industry Canada. Архивирано из оригинала 13. 4. 2014. г. Приступљено 6. 4. 2014. 
  11. ^ Azarnoush, Bahareh, et al. "Toward a Framework for Learner Segmentation." JEDM-Journal of Educational Data Mining. . 5 (2). 2013: 102—126.  Недостаје или је празан параметар |title= (помоћ).
  12. ^ U.S. Department of Education, Office of Educational Technology. „Enhancing Teaching and Learning Through Educational Data Mining and Learning Analytics: An Issue Brief” (PDF). Архивирано из оригинала (PDF) 11. 6. 2014. г. Приступљено 30. 3. 2014. 
  13. ^ а б Romero, C; Ventura, S.; Pechenizkiy, M.; Baker, R. S. (2010). Handbook of educational data mining. CRC Press. 
  14. ^ „Big Data in Education”. Coursera. Приступљено 30. 3. 2014. 
  15. ^ „Big Data in Education”. edXedxed. Приступљено 13. 10. 2015. 
  16. ^ „Big Data in Education”. Приступљено 17. 7. 2018. 
  17. ^ „Learning Analytics | Teachers College Columbia University”. www.tc.columbia.edu. Приступљено 2015-10-13. 
  18. ^ „How Can Educational Data Mining and Learning Analytics Improve and Personalize Education?”. EdTechReview. Приступљено 9. 4. 2014.