Рачунарска лингвистика

Из Википедије, слободне енциклопедије
Иди на навигацију Иди на претрагу

Рачунарска лингвистика је грана науке која се бави логичком и статистичком страном језика у информатици. Тиме су се у почетку бавили научници који су се специјализовали на компјутерским програмима који би им помогли у проучавању природних језика.

Скора студија[тражи се извор] је показала да је језик много компликованији него што се до сада мислило, па су рачунарску лингвистику проучавали људи који или раде у области рачунарске технике или проучавају само природни језик.

Рачунарску лингвистику проучавају, између осталих, рачунарски програмери, лингвисти, психолози и математичари. Ова грана науке је почела да се проучава у САД почетком 50-их година, са фокусом на врло ограничено машинско превођење за војне сврхе, углавном руских техничких и инжењерских текстова. Први програм за машинско превођење су заједничким напорима развили и јавно демострирали ИБМ и Универзитет Џорџтаун, 1954. године. Био је то машински програм за превођење са руског на енглески језик. Ипак, лингвистички проблеми са којима су се сусрели истраживачи су врло брзо утицали на ентузијазам и оптимистичка предвиђања у развоју ове области. [1]

Настанак[уреди]

Рачунарска лингвистика се родила као грана науке која би проучавала софтвер и алгоритме, да би могла преводити језичке податке.

Када се шездесетих година појавила вештачка интелигенција, грана рачунарске лингвистике је постала подграна вештачке интелигенције која се бави људским схватањима и природним језицима.

Да бисмо превели један језик на други, морали бисмо знати граматику оба језика, укључујући и морфологију (наука о облицима речи) и синтаксу (наука која се бави анализом реченице). Да бисмо разумели синтаксу, морали бисмо знати само значење речи и чак саму разлику између онога што би говорник причао и значења саме реченице.

Овде видимо, да оно што је почело као напор да се преводи између два језика (или више), прерасло је у читаву грану науке која се посветила разумевању како да представимо и проучимо једноставан природни језик користећи рачунаре.

Подела[уреди]

Рачунарска лингвистика може бити подељена у више грана, зависно од тога како се посматра језик, да ли се ради о говорном или писаном језику и исто тако, зависно од тога коју операцију вршимо над језиком, да ли га анализирамо (парсирање), или креирамо (генерисање).

Креирање говора се бави тиме како се говорни језик разуме користећи рачунар и како уз помоћ рачунара да извршимо препознавање и синтезу говора.

Парсирање и креирање су подгране рачунарске лингвистике, које се баве респективно анализирањем језика и креирањем назад.

Неке од студија којима се бави рачунарска лингвистика[уреди]

  1. Речи проучаване помоћу рачунара
  2. Креирање речи за језике
  3. Дефиниција одређених речи
  4. Превођење речи уз коришћење рачунара
  5. Проучавање разлике између формалних језика (нпр. латински) и говорних (нпр. енглески)

Види још:[уреди]

Референце[уреди]

  1. ^ Јохн Хутцхинс: Ретроспецт анд проспецт ин цомпутер-басед транслатион. Процеедингс оф МТ Суммит VII, 1999, пп. 30–44 (прва страница десни ступац)