Википедија:Vikiprojekat WikiELTeC
WikiELTeC je projekat Vikimedije Srbije i Društva za jezičke resurse i tehnologije JeRTeh zamišljen da se u 2022. godini stari srpski romani iz kolekcije ELTeC predstave Vikipodacima. Projekat obuhvata unos, povezivanje imenovanih entiteta, vizuelizaciju i analiza unetih Vikipodataka.
Cilj projekta
[uredi | uredi izvor]Cilj projekta je da se unesu viki podaci o starim srpskim romanima koji su skanirani, ručno korigovani, opremljeni metapodacima, obeleženi imenovanim entitetima u okviru Cost D-reading akcije CA16204 (2017-2021) „Udaljeno čitanje za evropsku istoriju književnosti“ (D-reading). Jedan od najvažnijih ciljeva ove akcije je priprema višejezičnog korpusa (nazvanog European Literary Text Collection - ELTeC) koji će, kada bude potpuno završen, sadržati po 100 romana prvi put objavljenih u periodu 1840-1920 za svaki jezik iz akcije. Tim predvođen prof. Cvetanom Krstev je publikovao 100 romana u osnovnoj i 20 u proširenoj podkolekciji, što predstavlja osnovni resurs za wikiELTeC projekat. Aktivnosti projekta su usmerene na:
- Povećanje broja vikipedijanaca
- Proširenje vrsta aktivnisti vikipedijanaca
- Unos novih zapisa u Vikipodatke
- Unos novih zapisa u Vikizvornik
- Unapređenje postojećih resursa dinamičkim sadržajima (semantičkim i kartografskim)
Motivi za izradu projekta
[uredi | uredi izvor]Romani prvi put publikovani u periodu 1840-1920. godine su slabo poznati javnosti, neki od njih nisu imali obnovljena izdanja i smatramo da je svaka promocija ovog resursa i svaki različiti oblik publikovanja važan i da doprinosi vidljivosti srpskog jezika i književnosti.
Treba napomenuti da su romani pripremljeni u pismu u kom su publikovani i to je uglavnom bila ćirilica, što je dodatno u saglasnosti sa državnim aktivnostima za očuvanje ćiriličnog pisma.
Svest o mogućnostima korišćenja strukturiranih podataka na vebu je mala i smatramo da će ovaj projekat da doprinese ne samo izgradnji vikiresursa već i unapređenju korišćenja pohranjenih vikipodataka.
Realizacija projekta
[uredi | uredi izvor]Unos osnovnih viki podataka o ovim romanima je ovim projektom dopunjen za sve romane.
Proširenje skupa podataka je uključilo i lokacije gde se odvija radnja romana, glavne likove, a potom i povezivanje u samom tekstu romana sa viki podacima.[1]
Vikizvornik je planu, gde bi on bio dopunjen romanima iz ELTeC kolekcije.
Ciljna grupa
[uredi | uredi izvor]Imajući u vidu popularnost Vikimedijinih projekata verujemo da bi se široj populaciji ova dragocena kolekcija, kakva do sada nije postojala za srpski, dodatno približiti i da će se osvetliti do sada nepoznata dela srpske književnosti prvi put objavljena u periodu 1840-1920.
Ciljna grupa dakle mogu biti istoričari, istoričari književnosti, đaci, studenti, i svi ostali koji nisu imali prilike da vide i pročitaju ove retke knjige, sakupljene po našim najvećim bibliotekama i privatnim kolekcijama.
Razvijeni resursi
[uredi | uredi izvor]Razvijeni resursi će omogućiti raznovrsna lingvistička, filološka i informatička istraživanja. Sadržaće materijal koji nije obuhvaćen nijednim postojećim korpusom. Svi tekstovi korpusa ELTeC će postati deo digitalne biblioteke Aurora koju razvija Jerteh i Vikipodaci će biti spregnuti sa prikazom podataka o romanima. Kao rezultat projekta biće dodate stranice koje će koristeći Wikidata Query Service i SPARQL upite prikazivati na različite načine unete Vikipodatke, kao na primer mesta na kojima se dešava radnja romana. [2] Viki strana sa detaljnim prikazom upita je dostupna na Wikidata:WikiProject ELTeC/Queries.
Vizuelizacija vikipodataka o starim srpskim romanima:
slika | URL | opis |
---|---|---|
Autori - šta znamo!? | Interaktivni grafikoni i prikaz stabla autora i ELTeC izdanja. | |
Veličina romana merena brojem stranica. | Interaktivni balon grafikon sa romanima u kolekciji ELTeC koji imaju VIAF ID, gde je veličina kruga broj stranica ili broj reči. | |
Putujemo u mesto izdanja romana! | Mesta prvog izdanja romana SrpELTeC kolekcije. | |
Koja mesta autori pominju u romanima? | Interaktivni balon grafikon sa mestima koja su autori pominjali u kolekciji SrpELTeC. Veličina kruga srazmerna je broju pominjanja mesta u romanu po autorima. | |
Mesta koja se najviše pominju u romanima? | Grafički prikaz broja mesta koja se pominju u kolekciji. | |
Slavimo lepa vremena! | Vizuelizacija vremenske linije romana, sortirana po godini njihovog prvog objavljivanja. | |
Ko je moja žena? | Interaktivni grafik supružnika u romanima. | |
Svi smo ovde! | Interaktivni grafikon svih likova u romanima. | |
Pogledaj ko je majka, a ko je njeno dete! | Interaktivni grafikon svih likova u romanu koji su u odnosu majka-dete. | |
Pogledaj ko je otac, a ko je dete! | Interaktivni grafikon svih likova u romanu koji su u odnosu otac-dete. |
Veb strana na engleskom sa upitima je dostupna na ovoj adresi.
Statistika podkolekcije ELTeC srpskih romana:
grafikon | upit | opis |
---|---|---|
https://w.wiki/5mQ6 | Grafikon zavisnosti broja likova u odnosu na romane. | |
https://w.wiki/5mPu | Grafikon broja pojavljivanja gradova u celoj kolekciji. | |
https://w.wiki/5mPY | Prikaz mesta koja se pominju u svakom romanu. | |
https://w.wiki/5mPZ | Prikaz likova koji se pominju u svakom romanu. |
Sistematizacija svih stavki u Vikipodacima
Da bi se lako pristupilo svakom romanu, kao i izdanju svakog romana (elektronskom, digitalnom ili štampanom) sistematizovan je pregled svih romana na stranici WikiProject_ELTeC/srpELTeC .
Očekivani uticaj
Raspoloživost predloženih resursa će svakako približiti čitaocima Viki resursa ovaj književni period o kom nema mnogo široko dostupnih informacija, ali će kroz romane moći i da se upozna način života u gradu i selu u to vreme, običaji, jela, … Sprezanje tekstualnih podataka sa Vikipodacima će doprineti mašinskoj razumljivosti pomenutih romana i doprineti drugačijem, „udaljenom“ pogledu na srpsku književnost u periodu 1840-1920.
Raspoloživost predloženih resursa će svakako približiti čitaocima Viki resursa ovaj književni period o kom nema mnogo široko dostupnih informacija, ali će kroz romane moći i da se upozna način života u gradu i selu u to vreme, običaji, jela, … Sprezanje tekstualnih podataka sa Vikipodacima će doprineti mašinskoj razumljivosti pomenutih romana i doprineti drugačijem, „udaljenom“ pogledu na srpsku književnost u periodu 1840-1920.
Predloženi tim je uključen u COST akciju CA18209 NexusLinguarum – European network for Web-centred linguistic data science koja traje 2019-2023 te će moći da prenesu aktuelne tehnologije i znanja u viki zajednicu Srbije i dalje, ali i da koriste i promovišu rezultate ovog projekta u drugim stručnim i naučnim aktivnostima.
wikiELTeC radionica i promocija
[uredi | uredi izvor]Lokacija: Univerzitet u Beogradu, Rudarsko - geološki fakultet, Đušina 7
Datum: 17.11.2022. godine u 16 časova
Satnica radionice:
16:00 – Otvaranje i pozdravna reče, Ivana Madžarević, Vikimedija Srbije
16.15 – 16.30 Prof. dr Ranka Stanković: Vikipodaci korpusa SrpELTeC: upoznavanje sa svojstvima romana
16.30 – 17:00 Milica Ikonić Nešić, Biljana Rujević: Praktičan rad na unošenju podataka o romanima.
17.00 – 17:20 Prof. dr Ranka Stanković: Osnove SPARQL upitnog jezika sa primerima pretrage SrpELTeC Vikipodataka
17.20 – 17:40 Milica Ikonić Nešić: Praktičan rad na modifikovanju postojećih i kreiranju novih SPARQL upita o romanima
17:40 – 18.00 Pauza za kafu
Satnica promocije:
18:00 – 18:15 Prof. dr Cvetana Krstev: O korpusu starih srpskih romana SrpELTeC
18:15 – 18:30 Prof. dr Ranka Stanković: Korpus SrpELTeC i Vikipodaci
18:30 – 18:45 Prof. dr Duško Vitas: Slike iz privatnog života u korpusu SrpELTeC
18:45 – 19:15 Pitanja
19:15 -21:00 Koktel i neposredna diskusija
Polaznici radionice imali su priliku da upoznaju SrpELTeC kroz okvir Vikipodataka i upitnog jezika SPARQL, da nauče način unošenja podataka o romanu u Vikipodatke, postave upite nad bazom znanja i generišu zanimljive dinamičke vizuelizacije podataka i romana. Drugi deo programa bio je odvojen za promociju, prilikom koje su ukratko bili predstavljeni glavni rezultati projekta SrpELTeC iz kog su proistekli motivi i ideje za projekat wikiELTeC, nakon čega je usledila demonstracija karakterističnih pretraga i vizuelizacija.
Ostale aktivnosti i radionice
[uredi | uredi izvor]Ranka Stanković, zamenik predsednika Društva za jezičke resurse i tehnologije JeRTeh je održala u nedelju, 29.05.2022. radionicu pod naslovom "wikiELTeC - Vikipodaci o starim srpskim romanima iz kolekcije ELTeC" u okviru događaja Vikilajv 2022, o kom više informacija se može videti na
https://sr.wikipedia.org/wiki/Vikipedija:Vikilajv_2022 .
Prezentacija je dostupna na viki strani projekta i na https://commons.wikimedia.org/wiki/File:Vikilajv_srpELTeC_@_Wikidata_-_Ranka_Stankovi%C4%87.pdf
Rad “Distant Reading in Digital Humanities: Case Study on the Serbian Part of the ELTeC Collection” sa referenciranjem na ovaj projekat je izložen u na prestižnoj konferenciji “13th Conference on Language Resources and Evaluation (LREC 2022)” koja je održana u Marselju 20-25 juna 2022 u organizaciji European Language Resources Association (ELRA). Rad je odštampan u zborniku radova na stranama 3337–3345 koji je publikovan i onlajn pod licencom CC-BY-NC-4.0 dostupan na adresi
http://www.lrec-conf.org/proceedings/lrec2022/pdf/2022.lrec-1.356.pdf .
Održana je radionica na kojoj je dogovoren način povezivanja vikipodataka pomana i podataka na Ostavi i uneti su prvi zapisi. Rezultati projekta su tom prilikom predstavljeni i dr Olji Perišić koja je predavač na Univerzitetu u Torinu na Departmanu za strane jezike i kulture. Osim aktivnosti na samoj radionici, dogovoreno da ona prevede naslove romana na italijanski jezik.
Rezultati projekta
[uredi | uredi izvor]Povezivanje starih srpskih romana iz perioda od 1840-1920 godine povećalo je interesovanje studenata za zaboravljenu književnost, zarobljenu u papirnim retkim verzijama. Ovakav projekat je doprineo vizuelizaciji romana i bio je inspiracija instraživačkoj grupi za unošenje još 600 romana u Vikipodatke pisanih na 6 različitih jezika (engleski, mađarski, slovenački, portugalski, nemački. francuski).
Jedan od najinteresantnijih segmenata projekta bio je ručni unos likova romana i povezivanje romana sa mestima radnje. Broj romana u kojima se pojavljuje neka lokacija: najfrekventnija Srbija, potom Beograd. Na slici nisu prikazani svi gradovi samo oni koji se pojavljuju u više romana i samo poneki koji se pojavljuju u samo jednom romanu.
Uneto je 120 romana osnovne srpELTeC i srpELTeC-ext kolekcije (link). Pregled svih romana i izdanja koja se nalaze u Vikipodacima WikiProject_ELTeC/srpELTeC . Za 70 romana uneto je 965 likova, kao i više od 5 osnovnih svojstava za svaki lik, pri čemu se težilo i dopunjavanju rodbinskih odnosa, ljubavnih odnosa, načina smrti, zanimanja, nadimaka, https://w.wiki/5mPZ. Takođe, uneto je 136 različitih mesta radnje https://w.wiki/5nhK, računajući pojavljivanje po romanima ukupnos 249 https://w.wiki/5mPY.
Projekat je nagrađen kao najuspešniji u 2022. godini.
Projekat je bio motivacija za projekat realizovan u 2023. godini Vikipedija:Vikiprojekat WikiELTeC 2023.
Vidi još
[uredi | uredi izvor]Urednici
[uredi | uredi izvor]Spoljne veze
[uredi | uredi izvor]- ELTeC kolekcija tekstova
- Srpski romani u okviru ELTeC kolekcije
- Korigovanje teksta u okviru radne akcije digitalna biblioteka 100 srpskih romana
- Obeležavanje teksta u okviru radne akcije digitalna biblioteka 100 srpskih romana
- Templejt vikipodataka ELTeC kolekcije
- Primeri upita nad vikipodacima ELTeC kolekcije
- Vizuelizacija vikipodataka o starim srpskim romanima
- SrpELTeC na Ostavi
Reference
[uredi | uredi izvor]- ^ http://jerteh.rs/wp-content/uploads/2021/12/Named-Entity-Journey-from-Unitex-to-Wikidata-.pdf
- ^ IKONIĆ NEŠIĆ, Milica; STANKOVIĆ, Ranka; RUJEVIĆ, Biljana. Serbian ELTeC Sub-Collection in Wikidata. Infotheca - Journal for Digital Humanities, [S.l.], v. 21, n. 2, p. 60-87, feb. 2022. ISSN 2217-9461. https://infoteka.bg.ac.rs/ojs/index.php/Infoteka/article/view/2021.21.2.4_en