Препознавање покрета

С Википедије, слободне енциклопедије
Дете одушевљено једноставним алгоритмом за препознавање покрета и детекцију положаја руке и кретања

Препознавање покрета (енг. Гестуре рецогнитион) је тема у информатици и препознавању говора са циљем интерпретирања људских покрета помоћу математичких алгоритама. Ови покрети су обично везани за померање било ког дела тела и стања у коме се тело налази (мировање, скакање...), али најчешће потич од покрета руку или лица. Тренутно се највише изучавају покрети руку и лица. Направљени су многи приступи коришћењем камера и алгоритама да би се интерпретирао Знаковни језик. Идентификација и препознавање држања и људског понашања такође је задатак техника препознавања покрета. За препознавање покрета се може рећи да је то начин за рачунаре тј. машине да разумеју људски говор тела, а самим тим то је побољшање у виду боље везе између људи и машина у смислу комуникације која је боља од примитивног уноса текста или коришћења графичко корисничких интерфејса.

Препознавање покрета омогућује људима природну комуникацију и интеракцију са машинама без механичких уређаја. Увек је лакше уперити руком у Рачунарски монитор и покретима руке управљати курсором (што је могуће са детекцијом покрета) него користити механичке улазне уређаје попут миша и тастатуре. Ова технологија може избацити миш, тастатуру, па чак и "тач скрин“ технологију из употребе.

Препознавање покрета може се реализовати помоћу техинка рачунарски вид (цомпутер висион) и обрада слике (имаге процессинг).

Литература која се бави рачунарским видом хватања покрета тј. људских поза и кретања помоћу камера повезаних на рачунар.[1][2]

Типови покрета[уреди | уреди извор]

Код рачунарских интерфејса разлукујемо два типа покрета:[3]Разликујемо онлајн покрете; који се могу сматрати и директно манипулишућим као што су скалирање и ротација. Постоје и офлајн покрети који се обично обрађују после интеракције, на пример круг је нацртан да би активирао контекстни мени.

  • офлајн покрети: Они покрети који се обрађују после интеракције корисника са објектом. Пример тога је покрет који активира мени.
  • онлајн покрети: Покретни који се обрађују директно. Користе се за скалирање или ротацију опипљивих објеката.

За шта се користе?[уреди | уреди извор]

препознавање покрета је корисно за обрађивање информација које људи не могу пренети говором или унети куцањем. Али постоји још доста различитих типива покрета које рачунари могу идентификовати.

  • идентификацију знаковног језика. Као што програми за препознавање говора могу превести говор у текст, одређени типови програма за препознавање покрета могу превести знаковне симболе презентоване као знаковни језик у текст.
  • За медицинску роботику. Користећи одређене сензоре упозоравају на телесно стање пацијента читајући вредности са тих сензора, роботи помажу у рехабилитацији. Најбољи пример је рехабилитација хода.
  • За индикацију правца показивањем. Показивање има одређени смисао у нашем друштву. Да би указали на објекат или локацију засновану на њеној позицији која нам је битна. Коришћење препознавања покрета да би смо открили где нека особа показује је корисно за проналажење контекста исказа или инструкција. Ова апликација је посебно занимљива у пољу роботике.
  • За контролу преко покрета лица. Контролисање рачунара преко покрета лица је веома корисна апликација препознавања покрета за кориснике који нису у физичкој могућности да користе миш или тастатуру. Нарочито праћење ока може бити од користи за контролисање покрета курсора или фокусирања на елементе за приказ.
  • За алтернативне рачунарске интерфејсе. Претходно коришћење миша и тастатуре за интеракцију са рачунаром би могло бити замењено побољшаним препознавањем покрета које би омогућило корисницима извођење уобичајених задатака само покретима руку или лица према камери.[4][5][6]
  • За играчку технологију. Препознавање покрета може бити коришћено за контролу интеракције у видео играма што би играње учинило интерактивнијим и реалнијим.
  • За виртуелне контролере. За неке системе је веома тешко пронаћи и набавити физички контролер, препознавање покрета може се користити као алтернативни контролни механизам. Неки примери тога су коришћење секундарних уређаја у аутомобилу или контролисање тв-а.
  • За даљинско управљање. Махом руке је могуће контролисати различите уређаје ако применимо препознавање покрета на даљинско управљање.

Улога сигнала није да само означи одговарајући одзив већ да одреди и који уређај треба контролисати.[7][8][9]

Улазни уређаји[уреди | уреди извор]

способност праћења човековог кретања и откривање који покрет они изводе може се постићи помоћу многих алата. Иако је одрађено доста истраживања базираних на слика/видео препознавању покрета, постоји још варијација што се тиче алата и окружења коришћених између имплементација.

  • жичана рукавица.Она се користи као улазни уређај и пружа рачунару информације о позицији и ротацији руке користећи магнетске или инерционо-пратеће уређаје. Неке рукавице могу детектовати савијање прстију са великим степеном тачности (5-10 степени), чак могу давати и хаптик повратне информације кориснику. Прва комерцијално доступна рукавица за праћење покрета је била ДатаГлове,[10] рукавица која је могла да детектује позицију руке, савијање и померање прстију. Користи каблове са оптичким влакнима који се спуштају низ задњи део руке. Светлосни пулсеви се креирају када се прсти савију, светло пролази кроз мале отворе и региструје се губитак који даје информације о приближној пози руке.
  • Камере које детектују дубину. Користе се специјалне камере као што су струцтуред лигхт или тиме-оф-флигхт камере. Ове камере праве дубинске мапе онога што камера види на кратким удаљеностима, и користе ове податке да приближно одреде репрезентацију онога што се види. Оне су ефектне за детекцију покрета руке због својих добрих особина на малим удаљеностима.
  • Стерео камере. Користе се 2 камере чије су везе познате, 3Д представљање може се приближно одредити помоћу излаза камера. Да би се добила веза камера користе се позиционе референце као што су леxиан-стрипе или инфраред емитори. У комбинацији са директним мерењем покрета (6Д-Висион) покрети се могу директно детектовати.
  • Покрети засновани на контролерима. Ови контролери се понашају као продужетак тела тако да када се изводе покрети, неки њихови помераји се могу лако забележити помоћу софтвера. Један од примера су покрети миша, где се покрети миша везују за симбол који црта људска рука, на пример wии контролер. Они могу пратити и промене везане за убрзање у времену да би реалније приказали покрете.
  • Једна камера. Стандардна камера се може користити за препознавање покрета где ресурси/околина нису погодни за друге облике препознавања покрета заснованих на покретима помоћу слика. Раније се мислило да једна камера не може бити ефективна као стерео или дубинска камера, али неке компаније и даље испитују ту теорију. Технологија препознавања покрета заснована на софтверу која користи стандардну 2Д камеру може детектовати снажне покрете руке, знакове руке, као и да прати руке или врхове прстију на високим нивоима тачности.

Алгоритми[уреди | уреди извор]

Приказ покрета може се урадити на више начина, у зависности од типа улазних података. Већина техника ослања се на кључним показивачима приказаним у 3Д координатном систему. Засновано на њиховом релативном кретању, покрети се могу детектоваи са великом прецизношћу, у зависности од квалитета улаза и алгоритамског прилаза.
Да бисмо приказали покрете тела, они се прво морају класификовати према основним особинама и треба одредити покрете које изражавају. На пример, у знаковном језику сваки покрет представља реч или фразу. Таксономију која изгледа одговарајућа за интеракцију човек-рачунар предложио је Квик у "Тоwард а Висион-Басед Ханд Гестуре Интерфаце".[11] Он представља неколико интерактивних система покрета са циљем да ухвати цео универзум покрета: 1. Манипулативних; 2. Семафоричких;3. Конверзационих.

Неке литературе разликују два различита концепта код препознавања покрета: заснован на 3Д моделу и заснован на изгледу.[12] Први метод користи 3Д информације елемената делова тела да би прикупио неколико битних параметара као што су позиција длана или заједничке углове. Други метод користи слике или видео за директан приказ.

Додатни чланак[уреди | уреди извор]

Види још[уреди | уреди извор]

Референце[уреди | уреди извор]

  1. ^ Павловиц, V., Схарма, Р. & Хуанг, Т. (1997), "Висуал интерпретатион оф ханд гестурес фор хуман-цомпутер интерацтион: А ревиеw".
  2. ^ Р. Циполла и А. Пентланд, Цомпутер Висион фор Хуман-Мацхине Интерацтион.
  3. ^ Диетрицх Каммер, Мандy Кецк, Георг Фреитаг, Маркус Wацкер, Таxономy анд Овервиеw оф Мулти-тоуцх Фрамеwоркс: Арцхитецтуре, Сцопе анд Феатурес Архивирано на сајту Wayback Machine (25. јануар 2011)
  4. ^ Ларс Бретзнер анд Тонy Линдеберг "Усе Yоур Ханд ас а 3-D Моусе ...", Проц. 5тх Еуропеан Цонференце он Цомпутер Висион (Х. Буркхардт анд Б. Неуманн, едс.), вол. 1406 оф Лецтуре Нотес ин Цомпутер Сциенце, (Фреибург, Германy), пп. 141--157, Спрингер Верлаг, Берлин, Јуне 1998.
  5. ^ Маттхеw Турк анд Матхиас Кöлсцх, "Перцептуал Интерфацес" Архивирано на сајту Wayback Machine (22. јул 2013), Университy оф Цалифорниа, Санта Барбара УЦСБ Тецхницал Репорт 2003-33
  6. ^ Афсхин Сепехри, Yасер Yацооб, Ларрy С. Давис "Емплоyинг тхе Ханд ас ан Интерфаце Девице" Архивирано на сајту Wayback Machine (24. мај 2010), Јоурнал оф Мултимедиа, вол 1, нумбер 2, пагес 18-29
  7. ^ До Јун-Хyеонг, Јунг Јин-Wоо, Сунг хоон Јунг, Јанг Хyоyоунг, Биен Зеунгнам, Адванцед софт ремоте цонтрол сyстем усинг ханд гестуре Архивирано на сајту Wayback Machine (6. јун 2014), Меxицан Интернатионал Цонференце он Артифициал Интеллигенце, 2006
  8. ^ К. Оуцхи, Н. Есака, Y. Тамура, M. Хирахара, M. Дои, Магиц Wанд: ан интуитиве гестуре ремоте цонтрол фор хоме апплианцес, Интернатионал Цонференце он Ацтиве Медиа Тецхнологy, 2005 (АМТ 2005), 2005
  9. ^ Ларс Бретзнер, Иван Лаптев, Тонy Линдеберг, Сöрен Ленман, Yнгве Сундблад "А Прототyпе Сyстем фор Цомпутер Висион Басед Хуман Цомпутер Интерацтион", Тецхницал репорт ЦВАП251, ИСРН КТХ НА/П--01/09--СЕ. Департмент оф Нумерицал Аналyсис анд Цомпутер Сциенце, КТХ (Роyал Институте оф Тецхнологy), СЕ-100 44 Стоцкхолм, Сwеден, Април 23–25, 2001.
  10. ^ Тхомас Г. Зиммерман, Јарон Ланиер, Цхуцк Бланцхард, Стеве Брyсон и Yоунг Харвилл. http://portal.acm.org. "А ХАНД ГЕСТУРЕ ИНТЕРФАЦЕ ДЕВИЦЕ." http://portal.acm.org.
  11. ^ Qуек, Ф., "Тоwард а висион-басед ханд гестуре интерфаце" Процеедингс оф тхе Виртуал Реалитy Сyстем Тецхнологy Цонференце, пп. 17-29, Аугуст 23–26, 1994, Сингапоре
  12. ^ Владимир I. Павловиц, Рајеев Схарма, Тхомас С. Хуанг, Висуал Интерпретатион оф Ханд Гестурес фор Хуман-Цомпутер Интерацтион; А Ревиеw, ИЕЕЕ Трансацтионс он Паттерн Аналyсис анд Мацхине Интеллигенце, 1997

Спољашње везе[уреди | уреди извор]