Фонетски алгоритам

С Википедије, слободне енциклопедије

Фонетски алгоритам је алгоритам за индексирање речи по њиховом изговору. Већина фонетских алгоритама су развијени за употребу са Енглеским Језиком; због тога, примена правила на речи из других језика не мора дати смислене резултате.

То су неопходно комплексни алгоритми са много правила и изузетака, зато што је спеловање и изговор речи у енглеском искомпликован историјским променама у изговору и речима позајмљеним из многих Језика.

Међу најпознатијим фонетским алгоритмима су:

  • Саундекс, који је развијен да би кодирао презимена при попису становништва. Саундекс кодови су четворо-карактерне ниске сачињене од једног слова за којим следе 3 броја.
  • Дејч-Мокотов Саундекс, који је пречишћен Саундекс, дизајниран да боље уклапа презимена Словенског и Германског порекла. Дејч-Мокотов Саундекс кодови су ниске сачињене од 6 цифара.
  • Колнер Фонетик: Сличан Саундексу, али погоднији за Немачке речи.
  • Метафон анд Дупли Метафон, који је погодан за енглеске речи, а не само за презимена. Метафони алгоритми су основа за многе популарне провере правописа.
  • Систем Државе Њујорк за Идентификацију и Интелигенцију (НYСИИС), који мапире сличне гласове на исто слово. Резултат је ниска тхат коју читалац може да изговори без декодирања.
  • Приступ Рејтинга Поклапања развијен од стране Западних Авиолинија у 1977. - овај алгоритам има кодирање и технику поређења домета.
  • Кејверфон, створен да помогне у спајању података између политичких избора касног 19-ог века и раног 20-ог века, оптимизован за акценте присутне у деловима Новог Зеланда.

Употреба[уреди | уреди извор]

  • Провере правописа често користе фонетске алгоритме. Метафони алгоритам, на пример, може да узме погрешно написану реч и кодира је. Код се онда тражи у директоријуму за речи са истим или сличним Метафоном. Речи које имају исти или сличан метафон постају могућа алтернативна спеловања те речи.
  • Машине за претрагу често користе фонетске алгоритме да нађу резултате који не одговарају тачно изразу који је коришћен за претрагу. Претрага имена може бити тешка зато што често постоје различити облици истог имена. На пример, енглеско име Клер (Цлаире) се изговара исто као и Цларе и Цлаир. Претрага за једним обликом не би дала резултате везане за остала два облика. Користећи Саундекс, сва три облика дају исти код, Ц460. Претрага помоћу Саундекс кода ће вратити резултате везане за сва три облика.

Види још[уреди | уреди извор]

Спољашње везе[уреди | уреди извор]