Razumevanje prirodnog jezika

С Википедије, слободне енциклопедије

Razumevanje prirodnog jezika ili interpretacija prirodnog jezika[1] je podskup obrade prirodnog jezika u veštačkoj inteligenciji koja se bavi mašinskim razumevanjem čitanja. Razumevanje prirodnog jezika smatra se problemom koji je težak za veštačku inteligenciju.[2]

Postoji značajan komercijalni interes u ovoj oblasti zbog njene primene na automatizovano rezonovanje,[3] mašinsko prevođenje,[4] odgovaranje na pitanja,[5] prikupljanje vesti, kategorizaciju teksta, glasovnu aktivaciju, arhiviranje i analizu sadržaja velikih razmera.

Istorija[уреди | уреди извор]

Program STUDENT, koji je 1964. napisao Daniel Bobrov za svoju doktorsku disertaciju na MIT-u, jedan je od najranijih poznatih pokušaja kompjuterskog razumevanja prirodnog jezika.[6][7][8][9][10] Osam godina nakon što je Džon Makarti skovao termin veštačka inteligencija, Bobrova disertacija (nazvana Unos prirodnog jezika za računarski sistem za rešavanje problema) pokazala je kako računar može da razume jednostavan unos prirodnog jezika za rešavanje problema sa rečima iz algebre.

Godinu dana kasnije, 1965, Džozef Vajzenbaum sa MIT-a napisao je ELIZA, interaktivni program koji je vodio dijalog na engleskom o bilo kojoj temi, a najpopularnija je bila psihoterapija. ELIZA je radila jednostavnim raščlanjivanjem i zamenom ključnih reči u spremne fraze, a Vajzenbaum je zaobišao problem davanja programu baze podataka o stvarnom svetu ili bogatog leksikona. Ipak, ELIZA je stekla iznenađujuću popularnost kao projekat igračkа i može se posmatrati kao veoma rani prethodnik trenutnih komercijalnih sistema poput onih koje koristi Ask.com.[11]

Godine 1969, Rodžer Šank sa Univerziteta Stanford uveo je teoriju konceptualne zavisnosti za razumevanje prirodnog jezika.[12] Ovaj model, delimično pod uticajem rada Sidneja Lama, uveliko su koristili Šankovi studenti na Jejl univerzitetu, kao što su Robert Vilenski, Vendi Lenert i Dženet Kolodner.

Godine 1970, Vilijam A. Vuds je predstavio proširenu tranicionu mrežu (ATN) koja predstavlja unos prirodnog jezika.[13] Umesto pravila strukture fraze, ATN su koristili ekvivalentan skup automata konačnog stanja koji su rekurzivno pozivani. ATN-ovi i njihov opštiji format koji se nazivaju „generalizovani ATN-ovi” nastavili su da se koriste tokom nekoliko godina.

Godine 1971, Teri Vinograd je završio pisanje SHRDLU za svoju doktorsku tezu na MIT-u. SHRDLU je mogao da razume jednostavne engleske rečenice u ograničenom svetu dečijih blokova da bi upravljao robotskom rukom pri pomeranju predmeta. Uspešna demonstracija SHRDLU-a dala je značajan zamah za nastavak istraživanja.[14][15] Vinograd je nastavio da vrši veliki uticaj u ovoj oblasti objavljivanjem svoje knjige Jezik kao kognitivni proces.[16] Na Stanfordu, Vinograd će kasnije savetovati Larija Pejdža, koji je suosnivač Gugla.

Tokom 1970-ih i 1980-ih, grupa za obradu prirodnog jezika u SRI Internašonalu nastavila je istraživanje i razvoj u ovoj oblasti. Preduzeti su brojni komercijalni napori zasnovani na istraživanju, na primer 1982. Gari Hendriks je osnovao Simantek korporaciju prvobitno kao kompaniju za razvoj interfejsa prirodnog jezika za upite baze podataka na ličnim računarima. Međutim, sa pojavom grafičkih korisničkih interfejsa vođenih mišem, Simantek je promenio pravac. Brojni drugi komercijalni napori su pokrenuti otprilike u isto vreme, na primer Lari R. Haris iz Korporacije za veštačku inteligenciju i Rodžer Šank i njegovi studenti u Kognitivnim sistemima.[17][18] Godine 1983, Majkl Dajer je razvio sistem BORIS na Jejlu koji je imao sličnosti sa radom Rodžera Šenka i V. G. Lenerta.[19]

Početkom dvadeste prvog veka su uvedeni sistemi koji koriste mašinsko učenje za klasifikaciju teksta, kao što je IBM Votson. Međutim, stručnjaci raspravljaju o tome koliko „razumevanja“ takvi sistemi pokazuju: na primer, prema Džonu Sirlu, Votson nije ni razumeo pitanja.[20]

Džon Bol, kognitivni naučnik i izumitelj Patomske teorije, podržava ovu procenu. Obrada prirodnog jezika je napravila prodor u aplikacije koje podržavaju ljudsku produktivnost u uslugama i e-trgovini, ali je to u velikoj meri omogućeno sužavanjem obima aplikacije. Postoje hiljade načina da se zatraži nešto na ljudskom jeziku, što još uvek prkosi konvencionalnoj obradi prirodnog jezika. Prema Vajbu Vegemansu, „smisleni razgovor sa mašinama je moguć samo kada svaku reč povežemo sa ispravnim značenjem na osnovu značenja drugih reči u rečenici – baš kao što trogodišnjak čini bez nagađanja.”[21]

Reference[уреди | уреди извор]

  1. ^ Semaan, P. (2012). Natural Language Generation: An Overview. Journal of Computer Science & Research (JCSCR)-ISSN, 50-57
  2. ^ Roman V. Yampolskiy. Turing Test as a Defining Feature of AI-Completeness . In Artificial Intelligence, Evolutionary Computation and Metaheuristics (AIECM) --In the footsteps of Alan Turing. Xin-She Yang (Ed.). pp. 3-17. (Chapter 1). Springer, London. 2013. http://cecs.louisville.edu/ry/TuringTestasaDefiningFeature04270003.pdf
  3. ^ Van Harmelen, Frank, Vladimir Lifschitz, and Bruce Porter, eds. Handbook of knowledge representation. Vol. 1. Elsevier, 2008.
  4. ^ Macherey, Klaus, Franz Josef Och, and Hermann Ney. "Natural language understanding using statistical machine translation." Seventh European Conference on Speech Communication and Technology. 2001.
  5. ^ Hirschman, Lynette, and Robert Gaizauskas. "Natural language question answering: the view from here." natural language engineering 7.4 (2001): 275-300.
  6. ^ American Association for Artificial Intelligence Brief History of AI [1] Архивирано на сајту Wayback Machine (10. март 2010)
  7. ^ Daniel Bobrow's PhD Thesis Natural Language Input for a Computer Problem Solving System.
  8. ^ Machines who think by Pamela McCorduck 2004 ISBN 1-56881-205-1 page 286
  9. ^ Russell, Stuart J.; Norvig, Peter (2003), Artificial Intelligence: A Modern Approach Prentice Hall, ISBN 0-13-790395-2, http://aima.cs.berkeley.edu/, p. 19
  10. ^ Computer Science Logo Style: Beyond programming by Brian Harvey 1997 ISBN 0-262-58150-7 page 278
  11. ^ Weizenbaum, Joseph (1976). Computer power and human reason: from judgment to calculation W. H. Freeman and Company. ISBN 0-7167-0463-3 pages 188-189
  12. ^ Roger Schank, 1969, A conceptual dependency parser for natural language Proceedings of the 1969 conference on Computational linguistics, Sång-Säby, Sweden, pages 1-3
  13. ^ Woods, William A (1970). "Transition Network Grammars for Natural Language Analysis". Communications of the ACM 13 (10): 591–606 [2]
  14. ^ Artificial intelligence: critical concepts, Volume 1 by Ronald Chrisley, Sander Begeer 2000 ISBN 0-415-19332-X page 89
  15. ^ Terry Winograd's SHRDLU page at Stanford SHRDLU Архивирано на сајту Wayback Machine (17. август 2020)
  16. ^ Winograd, Terry (1983), Language as a Cognitive Process, Addison–Wesley, Reading, MA.
  17. ^ Larry R. Harris, Research at the Artificial Intelligence corp. ACM SIGART Bulletin, issue 79, January 1982 [3]
  18. ^ Inside case-based reasoning by Christopher K. Riesbeck, Roger C. Schank 1989 ISBN 0-89859-767-6 page xiii
  19. ^ In Depth Understanding: A Model of Integrated Process for Narrative Comprehension.. Michael G. Dyer. MIT Press. ISBN 0-262-04073-5
  20. ^ Searle, John (23. 2. 2011). „Watson Doesn't Know It Won on 'Jeopardy!'. Wall Street Journal. 
  21. ^ Brandon, John (2016-07-12). „What Natural Language Understanding tech means for chatbots”. VentureBeat (на језику: енглески). Приступљено 2024-02-29.