Kvantitativna lingvistika

S Vikipedije, slobodne enciklopedije

Kvantitativna lingvistika (KL) je poddisciplina opšte lingvistike ili, još konkretnije, računarske lingvistike. Kvantitativna lingvistika istražuje jezike koristeći pre svega statističke metode u cilju formulisanja jezičkih zakona, odnosno, opšte teorije jezika u smislu skupa međusobno povezanih jezičkih zakona.[1] Kvantitativna lingvistika je empirijski zasnovana na rezultatima jezičke statistike, oblasti koja se može tumačiti kao statistika jezika ili kao statistika bilo kog jezičkog objekta.

Istorija[uredi | uredi izvor]

Prvi pokušaji da se jeziku pristupi iz ugla kvantitativne lingvistike su za antičku Grčku i staru Indiju. Jedan od istorijskih izvora sadrži primenu kombinatorike na lingvistička pitanja,[2] a jedan drugi je zasnovan na elementarnoj statistici.[3]

Neki lingvistički zakoni[uredi | uredi izvor]

Postoji veliki broj predloženih lingvističkih zakona, među kojima su[4]:

  • Zakon o divercifikaciji: Ako se jezičke kategorije kao što su vrste reči ili flektivni završeci javljaju u različitim oblicima može se pokazati da frekvencije njihovih pojavljivanja u tekstovima podležu određenim zakonitostima.
  • Raspodela dužina (ili opštije, složenosti). Istraživanja teksta ili rečnika frekvencija jezičkih jedinica bilo koje vrste kada je u pitanju njihova dužina po pravilu daje veliki broj distribucija, zavisno od vrste jedinice koja se istražuje. Do sada su istraživane sledeće jedinice:
    • Zakon raspodele dužina morfema;
    • Zakon raspodele dužina ritmičkih jedinica;
    • Zakon raspodele dužina rečenica;
    • Zakon raspodele dužina slogova;
    • Zakon raspodele dužina reči;

Ostale jezičke jedinice koje se takođe pridržavaju ovog zakona su na primer, slova (karakteri) različite složenosti, dužine takozvanih hrebova, nazvanih po Ludeku Hrebičeku[5] i govornih akata. Isto važi i za distribuciju zvukova (fonova) različitog trajanja.

Reference[uredi | uredi izvor]

  1. ^ Köhler, Altmann & Piotrovskiĭ 2005, str. 1–16
  2. ^ N.L. Biggs: The Roots of Combinatorics. In: Historia Mathematica 6, (1979). str. 109-136.
  3. ^ Adam Pawłowski: Prolegomena to the History of Corpus and Quantitative Linguistics. Greek Antiquity. In: Glottotheory 1, (2008). str. 48-54.
  4. ^ cf. references: Köhler, Altmann, Piotrowski (eds.) (2005)
  5. ^ „Hreb length - Laws in Quantitative Linguistics[[Kategorija:Botovski naslovi]]”. Arhivirano iz originala 19. 05. 2011. g. Pristupljeno 04. 05. 2012.  Sukob URL—vikiveza (pomoć)

Literatura[uredi | uredi izvor]

Spoljašnje veze[uredi | uredi izvor]