Prepoznavanje pokreta

Из Википедије, слободне енциклопедије
Иди на навигацију Иди на претрагу
Dete oduševljeno jednostavnim algoritmom za prepoznavanje pokreta i detekciju položaja ruke i kretanja

Prepoznavanje pokreta (eng. Gesture recognition) je tema u informatici i prepoznavanju govora sa ciljem interpretiranja ljudskih pokreta pomoću matematičkih algoritama. Ovi pokreti su obično vezani za pomeranje bilo kog dela tela i stanja u kome se telo nalazi (mirovanje, skakanje...), ali najčešće potič od pokreta ruku ili lica. Trenutno se najviše izučavaju pokreti ruku i lica. Napravljeni su mnogi pristupi korišćenjem kamera i algoritama da bi se interpretirao Знаковни језик. Identifikacija i prepoznavanje držanja i ljudskog ponašanja takođe je zadatak tehnika prepoznavanja pokreta. Za prepoznavanje pokreta se može reći da je to način za računare tj. mašine da razumeju ljudski govor tela, a samim tim to je poboljšanje u vidu bolje veze između ljudi i mašina u smislu komunikacije koja je bolja od primitivnog unosa teksta ili korišćenja grafičko korisničkih interfejsa.

Prepoznavanje pokreta omogućuje ljudima prirodnu komunikaciju i interakciju sa mašinama bez mehaničkih uređaja. Uvek je lakše uperiti rukom u Рачунарски монитор i pokretima ruke upravljati kursorom (što je moguće sa detekcijom pokreta) nego koristiti mehaničke ulazne uređaje poput miša i tastature. Ova tehnologija može izbaciti miš, tastaturu, pa čak i "tač skrin“ tehnologiju iz upotrebe.

Prepoznavanje pokreta može se realizovati pomoću tehinka računarski vid (computer vision) i obrada slike (image processing).

Literatura koja se bavi računarskim vidom hvatanja pokreta tj. ljudskih poza i kretanja pomoću kamera povezanih na računar.[1][2]

Tipovi pokreta[уреди]

Kod računarskih interfejsa razlukujemo dva tipa pokreta:[3]Razlikujemo onlajn pokrete; koji se mogu smatrati i direktno manipulišućim kao što su skaliranje i rotacija. Postoje i oflajn pokreti koji se obično obrađuju posle interakcije, na primer krug je nacrtan da bi aktivirao kontekstni meni.

  • oflajn pokreti: Oni pokreti koji se obrađuju posle interakcije korisnika sa objektom. Primer toga je pokret koji aktivira meni.
  • onlajn pokreti: Pokretni koji se obrađuju direktno. Koriste se za skaliranje ili rotaciju opipljivih objekata.

Za šta se koriste?[уреди]

prepoznavanje pokreta je korisno za obrađivanje informacija koje ljudi ne mogu preneti govorom ili uneti kucanjem. Ali postoji još dosta različitih tipiva pokreta koje računari mogu identifikovati.

  • identifikaciju znakovnog jezika. Kao što programi za prepoznavanje govora mogu prevesti govor u tekst, određeni tipovi programa za prepoznavanje pokreta mogu prevesti znakovne simbole prezentovane kao znakovni jezik u tekst.
  • Za medicinsku robotiku. Koristeći određene senzore upozoravaju na telesno stanje pacijenta čitajući vrednosti sa tih senzora, roboti pomažu u rehabilitaciji. Najbolji primer je rehabilitacija hoda.
  • Za indikaciju pravca pokazivanjem. Pokazivanje ima određeni smisao u našem društvu. Da bi ukazali na objekat ili lokaciju zasnovanu na njenoj poziciji koja nam je bitna. Korišćenje prepoznavanja pokreta da bi smo otkrili gde neka osoba pokazuje je korisno za pronalaženje konteksta iskaza ili instrukcija. Ova aplikacija je posebno zanimljiva u polju robotike.
  • Za kontrolu preko pokreta lica. Kontrolisanje računara preko pokreta lica je veoma korisna aplikacija prepoznavanja pokreta za korisnike koji nisu u fizičkoj mogućnosti da koriste miš ili tastaturu. Naročito praćenje oka može biti od koristi za kontrolisanje pokreta kursora ili fokusiranja na elemente za prikaz.
  • Za alternativne računarske interfejse. Prethodno korišćenje miša i tastature za interakciju sa računarom bi moglo biti zamenjeno poboljšanim prepoznavanjem pokreta koje bi omogućilo korisnicima izvođenje uobičajenih zadataka samo pokretima ruku ili lica prema kameri.[4][5][6]
  • Za igračku tehnologiju. Prepoznavanje pokreta može biti korišćeno za kontrolu interakcije u video igrama što bi igranje učinilo interaktivnijim i realnijim.
  • Za virtuelne kontrolere. Za neke sisteme je veoma teško pronaći i nabaviti fizički kontroler, prepoznavanje pokreta može se koristiti kao alternativni kontrolni mehanizam. Neki primeri toga su korišćenje sekundarnih uređaja u automobilu ili kontrolisanje tv-a.
  • Za daljinsko upravljanje. Mahom ruke je moguće kontrolisati različite uređaje ako primenimo prepoznavanje pokreta na daljinsko upravljanje.

Uloga signala nije da samo označi odgovarajući odziv već da odredi i koji uređaj treba kontrolisati. [7][8][9]

Ulazni uređaji[уреди]

sposobnost praćenja čovekovog kretanja i otkrivanje koji pokret oni izvode može se postići pomoću mnogih alata. Iako je odrađeno dosta istraživanja baziranih na slika/video prepoznavanju pokreta, postoji još varijacija što se tiče alata i okruženja korišćenih između implementacija.

  • žičana rukavica.Ona se koristi kao ulazni uređaj i pruža računaru informacije o poziciji i rotaciji ruke koristeći magnetske ili inerciono-prateće uređaje. Neke rukavice mogu detektovati savijanje prstiju sa velikim stepenom tačnosti (5-10 stepeni), čak mogu davati i haptik povratne informacije korisniku. Prva komercijalno dostupna rukavica za praćenje pokreta je bila DataGlove,[10] rukavica koja je mogla da detektuje poziciju ruke, savijanje i pomeranje prstiju. Koristi kablove sa optičkim vlaknima koji se spuštaju niz zadnji deo ruke. Svetlosni pulsevi se kreiraju kada se prsti saviju, svetlo prolazi kroz male otvore i registruje se gubitak koji daje informacije o približnoj pozi ruke.
  • Kamere koje detektuju dubinu. Koriste se specijalne kamere kao što su structured light ili time-of-flight kamere. Ove kamere prave dubinske mape onoga što kamera vidi na kratkim udaljenostima, i koriste ove podatke da približno odrede 3D reprezentaciju onoga što se vidi. One su efektne za detekciju pokreta ruke zbog svojih dobrih osobina na malim udaljenostima.
  • Stereo kamere. Koriste se 2 kamere čije su veze poznate, 3D predstavljanje može se približno odrediti pomoću izlaza kamera. Da bi se dobila veza kamera koriste se pozicione reference kao što su lexian-stripe ili infrared emitori. U kombinaciji sa direktnim merenjem pokreta (6D-Vision) pokreti se mogu direktno detektovati.
  • Pokreti zasnovani na kontrolerima. Ovi kontroleri se ponašaju kao produžetak tela tako da kada se izvode pokreti, neki njihovi pomeraji se mogu lako zabeležiti pomoću softvera. Jedan od primera su pokreti miša, gde se pokreti miša vezuju za simbol koji crta ljudska ruka, na primer wii kontroler. Oni mogu pratiti i promene vezane za ubrzanje u vremenu da bi realnije prikazali pokrete.
  • Jedna kamera. Standardna 2D kamera se može koristiti za prepoznavanje pokreta gde resursi/okolina nisu pogodni za druge oblike prepoznavanja pokreta zasnovanih na pokretima pomoću slika. Ranije se mislilo da jedna kamera ne može biti efektivna kao stereo ili dubinska kamera, ali neke kompanije i dalje ispituju tu teoriju. Tehnologija prepoznavanja pokreta zasnovana na softveru koja koristi standardnu 2D kameru može detektovati snažne pokrete ruke, znakove ruke, kao i da prati ruke ili vrhove prstiju na visokim nivoima tačnosti.

Algoritmi[уреди]

Prikaz pokreta može se uraditi na više načina, u zavisnosti od tipa ulaznih podataka. Većina tehnika oslanja se na ključnim pokazivačima prikazanim u 3D koordinatnom sistemu. Zasnovano na njihovom relativnom kretanju, pokreti se mogu detektovai sa velikom preciznošću, u zavisnosti od kvaliteta ulaza i algoritamskog prilaza.
Da bismo prikazali pokrete tela, oni se prvo moraju klasifikovati prema osnovnim osobinama i treba odrediti pokrete koje izražavaju. Na primer, u znakovnom jeziku svaki pokret predstavlja reč ili frazu. Taksonomiju koja izgleda odgovarajuća za interakciju čovek-računar predložio je Kvik u "Toward a Vision-Based Hand Gesture Interface". [11] On predstavlja nekoliko interaktivnih sistema pokreta sa ciljem da uhvati ceo univerzum pokreta: 1. Manipulativnih; 2. Semaforičkih;3. Konverzacionih.

Neke literature razlikuju dva različita koncepta kod prepoznavanja pokreta: zasnovan na 3D modelu i zasnovan na izgledu.[12] Prvi metod koristi 3D informacije elemenata delova tela da bi prikupio nekoliko bitnih parametara kao što su pozicija dlana ili zajedničke uglove. Drugi metod koristi slike ili video za direktan prikaz.

Dodatni članak[уреди]

Vidi još[уреди]

Reference[уреди]

  1. ^ Pavlovic, V., Sharma, R. & Huang, T. (1997), "Visual interpretation of hand gestures for human-computer interaction: A review".
  2. ^ R. Cipolla i A. Pentland, Computer Vision for Human-Machine Interaction.
  3. ^ Dietrich Kammer, Mandy Keck, Georg Freitag, Markus Wacker, Taxonomy and Overview of Multi-touch Frameworks: Architecture, Scope and Features Архивирано на сајту Wayback Machine (јануар 25, 2011) (на језику: енглески)
  4. ^ Lars Bretzner and Tony Lindeberg "Use Your Hand as a 3-D Mouse ...", Proc. 5th European Conference on Computer Vision (H. Burkhardt and B. Neumann, eds.), vol. 1406 of Lecture Notes in Computer Science, (Freiburg, Germany), pp. 141--157, Springer Verlag, Berlin, June 1998.
  5. ^ Matthew Turk and Mathias Kölsch, "Perceptual Interfaces", University of California, Santa Barbara UCSB Technical Report 2003-33
  6. ^ Afshin Sepehri, Yaser Yacoob, Larry S. Davis "Employing the Hand as an Interface Device" Архивирано на сајту Wayback Machine (мај 24, 2010) (на језику: енглески), Journal of Multimedia, vol 1, number 2, pages 18-29
  7. ^ Do Jun-Hyeong, Jung Jin-Woo, Sung hoon Jung, Jang Hyoyoung, Bien Zeungnam, Advanced soft remote control system using hand gesture Архивирано на сајту Wayback Machine (јун 6, 2014) (на језику: енглески), Mexican International Conference on Artificial Intelligence, 2006
  8. ^ K. Ouchi, N. Esaka, Y. Tamura, M. Hirahara, M. Doi, Magic Wand: an intuitive gesture remote control for home appliances, International Conference on Active Media Technology, 2005 (AMT 2005), 2005
  9. ^ Lars Bretzner, Ivan Laptev, Tony Lindeberg, Sören Lenman, Yngve Sundblad "A Prototype System for Computer Vision Based Human Computer Interaction", Technical report CVAP251, ISRN KTH NA/P--01/09--SE. Department of Numerical Analysis and Computer Science, KTH (Royal Institute of Technology), SE-100 44 Stockholm, Sweden, April 23–25, 2001.
  10. ^ Thomas G. Zimmerman, Jaron Lanier, Chuck Blanchard, Steve Bryson i Young Harvill. http://portal.acm.org. "A HAND GESTURE INTERFACE DEVICE." http://portal.acm.org.
  11. ^ Quek, F., "Toward a vision-based hand gesture interface" Proceedings of the Virtual Reality System Technology Conference, pp. 17-29, August 23–26, 1994, Singapore
  12. ^ Vladimir I. Pavlovic, Rajeev Sharma, Thomas S. Huang, Visual Interpretation of Hand Gestures for Human-Computer Interaction; A Review, IEEE Transactions on Pattern Analysis and Machine Intelligence, 1997

Spoljašnje veze[уреди]