Википедија:Vikiprojekat WikiELTeC

S Vikipedije, slobodne enciklopedije


WikiELTeC je projekat Vikimedije Srbije i Društva za jezičke resurse i tehnologije JeRTeh zamišljen da se u 2022. godini stari srpski romani iz kolekcije ELTeC predstave Vikipodacima. Projekat obuhvata unos, povezivanje imenovanih entiteta, vizuelizaciju i analiza unetih Vikipodataka.

Cilj projekta[uredi | uredi izvor]

Cilj projekta je da se unesu viki podaci o starim srpskim romanima koji su skanirani, ručno korigovani, opremljeni metapodacima, obeleženi imenovanim entitetima u okviru Cost D-reading akcije CA16204 (2017-2021) „Udaljeno čitanje za evropsku istoriju književnosti“ (D-reading). Jedan od najvažnijih ciljeva ove akcije je priprema višejezičnog korpusa (nazvanog European Literary Text Collection - ELTeC) koji će, kada bude potpuno završen, sadržati po 100 romana prvi put objavljenih u periodu 1840-1920 za svaki jezik iz akcije. Tim predvođen prof. Cvetanom Krstev je publikovao 100 romana u osnovnoj i 20 u proširenoj podkolekciji, što predstavlja osnovni resurs za wikiELTeC projekat. Aktivnosti projekta su usmerene na:

  • Povećanje broja vikipedijanaca
  • Proširenje vrsta aktivnisti vikipedijanaca
  • Unos novih zapisa u Vikipodatke
  • Unos novih zapisa u Vikizvornik
  • Unapređenje postojećih resursa dinamičkim sadržajima (semantičkim i kartografskim)

Motivi za izradu projekta[uredi | uredi izvor]

Romani prvi put publikovani u periodu 1840-1920. godine su slabo poznati javnosti, neki od njih nisu imali obnovljena izdanja i smatramo da je svaka promocija ovog resursa i svaki različiti oblik publikovanja važan i da doprinosi vidljivosti srpskog jezika i književnosti.

Treba napomenuti da su romani pripremljeni u pismu u kom su publikovani i to je uglavnom bila ćirilica, što je dodatno u saglasnosti sa državnim aktivnostima za očuvanje ćiriličnog pisma.

Svest o mogućnostima korišćenja strukturiranih podataka na vebu je mala i smatramo da će ovaj projekat da doprinese ne samo izgradnji vikiresursa već i unapređenju korišćenja pohranjenih vikipodataka.

Realizacija projekta[uredi | uredi izvor]

Unos osnovnih viki podataka o ovim romanima je ovim projektom dopunjen za sve romane.

Proširenje skupa podataka je uključilo i lokacije gde se odvija radnja romana, glavne likove, a potom i povezivanje u samom tekstu romana sa viki podacima.[1]

Vikizvornik je planu, gde bi on bio dopunjen romanima iz ELTeC kolekcije.

Ciljna grupa[uredi | uredi izvor]

Imajući u vidu popularnost Vikimedijinih projekata verujemo da bi se široj populaciji ova dragocena kolekcija, kakva do sada nije postojala za srpski, dodatno približiti i da će se osvetliti do sada nepoznata dela srpske književnosti prvi put objavljena u periodu 1840-1920.

Ciljna grupa dakle mogu biti istoričari, istoričari književnosti, đaci, studenti, i svi ostali koji nisu imali prilike da vide i pročitaju ove retke knjige, sakupljene po našim najvećim bibliotekama i privatnim kolekcijama.

Razvijeni resursi[uredi | uredi izvor]

Razvijeni resursi će omogućiti raznovrsna lingvistička, filološka i informatička istraživanja. Sadržaće materijal koji nije obuhvaćen nijednim postojećim korpusom. Svi tekstovi korpusa ELTeC će postati deo digitalne biblioteke Aurora koju razvija Jerteh i Vikipodaci će biti spregnuti sa prikazom podataka o romanima. Kao rezultat projekta biće dodate stranice koje će koristeći Wikidata Query Service i SPARQL upite prikazivati na različite načine unete Vikipodatke, kao na primer mesta na kojima se dešava radnja romana. [2] Viki strana sa detaljnim prikazom upita je dostupna na Wikidata:WikiProject ELTeC/Queries.

Vizuelizacija vikipodataka o starim srpskim romanima:

slika URL opis
Autori - šta znamo!? Interaktivni grafikoni i prikaz stabla autora i ELTeC izdanja.
Veličina romana merena brojem stranica.

Veličina romana merena brojem reči.

Interaktivni balon grafikon sa romanima u kolekciji ELTeC koji imaju VIAF ID, gde je veličina kruga broj stranica ili broj reči.
Mapa mesta prvog izdanja romana srpELTeC kolekcije
Putujemo u mesto izdanja romana! Mesta prvog izdanja romana SrpELTeC kolekcije.
Koja mesta autori pominju u romanima? Interaktivni balon grafikon sa mestima koja su autori pominjali u kolekciji SrpELTeC. Veličina kruga srazmerna je broju pominjanja mesta u romanu po autorima.
Mesta koja se najviše pominju u romanima? Grafički prikaz broja mesta koja se pominju u kolekciji.
Slavimo lepa vremena! Vizuelizacija vremenske linije romana, sortirana po godini njihovog prvog objavljivanja.
Ko je moja žena? Interaktivni grafik supružnika u romanima.
Svi smo ovde! Interaktivni grafikon svih likova u romanima.
Interaktivni grafikon odnosa majka-dete
Pogledaj ko je majka, a ko je njeno dete! Interaktivni grafikon svih likova u romanu koji su u odnosu majka-dete.
Interaktivni grafikon svih likova u romanu koji su u odnosu otac-dete
Pogledaj ko je otac, a ko je dete! Interaktivni grafikon svih likova u romanu koji su u odnosu otac-dete.

Veb strana na engleskom sa upitima je dostupna na ovoj adresi.

Statistika podkolekcije ELTeC srpskih romana:

grafikon upit opis
https://w.wiki/5mQ6 Grafikon zavisnosti broja likova u odnosu na romane.
https://w.wiki/5mPu Grafikon broja pojavljivanja gradova u celoj kolekciji.
https://w.wiki/5mPY Prikaz mesta koja se pominju u svakom romanu.
https://w.wiki/5mPZ Prikaz likova koji se pominju u svakom romanu.

Sistematizacija svih stavki u Vikipodacima

Da bi se lako pristupilo svakom romanu, kao i izdanju svakog romana (elektronskom, digitalnom ili štampanom) sistematizovan je pregled svih romana na stranici WikiProject_ELTeC/srpELTeC .

Pregled romana srpELTeC kolekcije
Pregled romana srpELTeC kolekcije


Očekivani uticaj

Raspoloživost predloženih resursa će svakako približiti čitaocima Viki resursa ovaj književni period o kom nema mnogo široko dostupnih informacija, ali će kroz romane moći i da se upozna način života u gradu i selu u to vreme, običaji, jela, … Sprezanje tekstualnih podataka sa Vikipodacima će doprineti mašinskoj razumljivosti pomenutih romana i doprineti drugačijem, „udaljenom“ pogledu na srpsku književnost u periodu 1840-1920.

Raspoloživost predloženih resursa će svakako približiti čitaocima Viki resursa ovaj književni period o kom nema mnogo široko dostupnih informacija, ali će kroz romane moći i da se upozna način života u gradu i selu u to vreme, običaji, jela, … Sprezanje tekstualnih podataka sa Vikipodacima će doprineti mašinskoj razumljivosti pomenutih romana i doprineti drugačijem, „udaljenom“ pogledu na srpsku književnost u periodu 1840-1920.

Predloženi tim je uključen u COST akciju CA18209 NexusLinguarum – European network for Web-centred linguistic data science koja traje 2019-2023 te će moći da prenesu aktuelne tehnologije i znanja u viki zajednicu Srbije i dalje, ali i da koriste i promovišu rezultate ovog projekta u drugim stručnim i naučnim aktivnostima.

wikiELTeC radionica i promocija[uredi | uredi izvor]

Lokacija: Univerzitet u Beogradu, Rudarsko - geološki fakultet, Đušina 7

Datum: 17.11.2022. godine u 16 časova

Satnica radionice:

16:00 – Otvaranje i pozdravna reče, Ivana Madžarević, Vikimedija Srbije

16.15 – 16.30 Prof. dr Ranka Stanković: Vikipodaci korpusa SrpELTeC: upoznavanje sa svojstvima romana

16.30 – 17:00  Milica Ikonić Nešić, Biljana Rujević: Praktičan rad na unošenju podataka o romanima.

17.00 – 17:20 Prof. dr Ranka Stanković: Osnove SPARQL upitnog jezika sa primerima pretrage SrpELTeC Vikipodataka

17.20 – 17:40 Milica Ikonić Nešić: Praktičan rad na modifikovanju postojećih i kreiranju novih SPARQL upita o romanima

17:40 – 18.00 Pauza za kafu

Satnica promocije:

18:00 – 18:15 Prof. dr Cvetana Krstev: O korpusu starih srpskih romana SrpELTeC

18:15 – 18:30 Prof. dr Ranka Stanković: Korpus SrpELTeC i Vikipodaci

18:30 – 18:45 Prof. dr Duško Vitas: Slike iz privatnog života u korpusu  SrpELTeC

18:45 – 19:15 Pitanja

19:15 -21:00 Koktel i neposredna diskusija

Vidi još[uredi | uredi izvor]

Urednici[uredi | uredi izvor]

wikiELTeC: Vikipodaci o starim srpskim romanima iz kolekcije ELTeC

Spoljne veze[uredi | uredi izvor]

Reference[uredi | uredi izvor]

  1. ^ http://jerteh.rs/wp-content/uploads/2021/12/Named-Entity-Journey-from-Unitex-to-Wikidata-.pdf
  2. ^ IKONIĆ NEŠIĆ, Milica; STANKOVIĆ, Ranka; RUJEVIĆ, Biljana. Serbian ELTeC Sub-Collection in Wikidata. Infotheca - Journal for Digital Humanities, [S.l.], v. 21, n. 2, p. 60-87, feb. 2022. ISSN 2217-9461. https://infoteka.bg.ac.rs/ojs/index.php/Infoteka/article/view/2021.21.2.4_en