Пређи на садржај

Уграђивање речи

С Википедије, слободне енциклопедије

У обради природног језика (НЛП), уграђивање речи је репрезентација речи. Уграђивање се користи у анализи текста. Типично, репрезентација је вектор реалне вредности који кодира значење речи на такав начин да се очекује да су речи које су ближе у векторском простору сличне по значењу.[1] Уграђивање речи се може добити коришћењем језичког моделовања и техника учења карактеристика, где се речи или фразе из речника мапирају у векторе реалних бројева.

Методе за генерисање овог мапирања укључују неуронске мреже,[2] смањење димензионалности на матрици појављивања речи,[3][4][5] моделе вероватноће,[6] објашњиву методу базе знања,[7] и експлицитно представљање у смислу контекста у коме се речи појављују.[8]

Показало се да уграђивање речи и фраза, када се користи као основна улазна репрезентација, побољшава перформансе у НЛП задацима као што су синтаксичко рашчлањивање[9] и анализа осећања.[10]

Референце[уреди | уреди извор]

  1. ^ Јурафскy, Даниел; Х. Јамес, Мартин (2000). Спеецх анд лангуаге процессинг : ан интродуцтион то натурал лангуаге процессинг, цомпутатионал лингуистицс, анд спеецх рецогнитион. Уппер Саддле Ривер, Н.Ј.: Прентице Халл. ИСБН 978-0-13-095069-7. 
  2. ^ Миколов, Томас; Сутскевер, Илyа; Цхен, Каи; Цоррадо, Грег; Деан, Јеффреy (2013). „Дистрибутед Репресентатионс оф Wордс анд Пхрасес анд тхеир Цомпоситионалитy”. арXив:1310.4546Слободан приступ [цс.CL]. 
  3. ^ Лебрет, Рéми; Цоллоберт, Ронан (2013). „Wорд Емдеддингс тхроугх Хеллингер ПЦА”. Цонференце оф тхе Еуропеан Цхаптер оф тхе Ассоциатион фор Цомпутатионал Лингуистицс (ЕАЦЛ). 2014. арXив:1312.5542Слободан приступ. 
  4. ^ Левy, Омер; Голдберг, Yоав (2014). Неурал Wорд Ембеддинг ас Имплицит Матриx Фацторизатион (ПДФ). НИПС. 
  5. ^ Ли, Yитан; Xу, Линли (2015). Wорд Ембеддинг Ревиситед: А Неw Репресентатион Леарнинг анд Еxплицит Матриx Фацторизатион Перспецтиве (ПДФ). Инт'л Ј. Цонф. он Артифициал Интеллигенце (ИЈЦАИ). 
  6. ^ Глоберсон, Амир (2007). „Еуцлидеан Ембеддинг оф Цо-оццурренце Дата” (ПДФ). Јоурнал оф Мацхине Леарнинг Ресеарцх. 
  7. ^ Qуресхи, M. Атиф; Греене, Дерек (2018-06-04). „ЕВЕ: еxплаинабле вецтор басед ембеддинг тецхниqуе усинг Wикипедиа”. Јоурнал оф Интеллигент Информатион Сyстемс (на језику: енглески). 53: 137—165. ИССН 0925-9902. С2ЦИД 10656055. арXив:1702.06891Слободан приступ. дои:10.1007/с10844-018-0511-x. 
  8. ^ Левy, Омер; Голдберг, Yоав (2014). Лингуистиц Регуларитиес ин Спарсе анд Еxплицит Wорд Репресентатионс (ПДФ). ЦоНЛЛ. стр. 171—180. 
  9. ^ Соцхер, Рицхард; Бауер, Јохн; Маннинг, Цхристопхер; Нг, Андреw (2013). Парсинг wитх цомпоситионал вецтор граммарс (ПДФ). Проц. АЦЛ Цонф. Архивирано из оригинала (ПДФ) 2016-08-11. г. Приступљено 2014-08-14. 
  10. ^ Соцхер, Рицхард; Перелyгин, Алеx; Wу, Јеан; Цхуанг, Јасон; Маннинг, Цхрис; Нг, Андреw; Поттс, Цхрис (2013). Рецурсиве Дееп Моделс фор Семантиц Цомпоситионалитy Овер а Сентимент Треебанк (ПДФ). ЕМНЛП.