Википедија:Википројекат WikiELTeC

С Википедије, слободне енциклопедије


WikiELTeC је пројекат Викимедије Србије и Друштва за језичке ресурсе и технологије ЈеРТех замишљен да се у 2022. години стари српски романи из колекције ELTeC представе Википодацима. Пројекат обухвата унос, повезивање именованих ентитета, визуелизацију и анализа унетих Википодатака.

Циљ пројекта[уреди | уреди извор]

Циљ пројекта је да се унесу вики подаци о старим српским романима који су сканирани, ручно кориговани, опремљени метаподацима, обележени именованим ентитетима у оквиру Cost D-reading акције CA16204 (2017-2021) „Удаљено читање за европску историју књижевности“ (D-reading). Један од најважнијих циљева ове акције је припрема вишејезичног корпуса (названог European Literary Text Collection - ELTeC) који ће, када буде потпуно завршен, садржати по 100 романа први пут објављених у периоду 1840-1920 за сваки језик из акције. Тим предвођен проф. Цветаном Крстев је публиковао 100 романа у основној и 20 у проширеној подколекцији, што представља основни ресурс за wikiELTeC пројекат. Активности пројекта су усмерене на:

  • Повећање броја википедијанаца
  • Проширење врста активнисти википедијанаца
  • Унос нових записа у Википодатке
  • Унос нових записа у Викизворник
  • Унапређење постојећих ресурса динамичким садржајима (семантичким и картографским)

Мотиви за израду пројекта[уреди | уреди извор]

Романи први пут публиковани у периоду 1840-1920. године су слабо познати јавности, неки од њих нису имали обновљена издања и сматрамо да је свака промоција овог ресурса и сваки различити облик публиковања важан и да доприноси видљивости српског језика и књижевности.

Треба напоменути да су романи припремљени у писму у ком су публиковани и то је углавном била ћирилица, што је додатно у сагласности са државним активностима за очување ћириличног писма.

Свест о могућностима коришћења структурираних података на вебу је мала и сматрамо да ће овај пројекат да допринесе не само изградњи викиресурса већ и унапређењу коришћења похрањених википодатака.

Реализација пројекта[уреди | уреди извор]

Унос основних вики података о овим романима је овим пројектом допуњен за све романе.

Проширење скупа података је укључило и локације где се одвија радња романа, главне ликове, а потом и повезивање у самом тексту романа са вики подацима.[1]

Викизворник је плану, где би он био допуњен романима из ELTeC колекције.

Циљна група[уреди | уреди извор]

Имајући у виду популарност Викимедијиних пројеката верујемо да би се широј популацији ова драгоцена колекција, каква до сада није постојала за српски, додатно приближити и да ће се осветлити до сада непозната дела српске књижевности први пут објављена у периоду 1840-1920.

Циљна група дакле могу бити историчари, историчари књижевности, ђаци, студенти, и сви остали који нису имали прилике да виде и прочитају ове ретке књиге, сакупљене по нашим највећим библиотекама и приватним колекцијама.

Развијени ресурси[уреди | уреди извор]

Развијени ресурси ће омогућити разноврсна лингвистичка, филолошка и информатичка истраживања. Садржаће материјал који није обухваћен ниједним постојећим корпусом. Сви текстови корпуса ELTeC ће постати део дигиталне библиотеке Аурора коју развија Јертех и Википодаци ће бити спрегнути са приказом података о романима. Као резултат пројекта биће додате странице које ће користећи Wikidata Query Service и SPARQL упите приказивати на различите начине унете Википодатке, као на пример места на којима се дешава радња романа. [2] Вики страна са детаљним приказом упита је доступна на Wikidata:WikiProject ELTeC/Queries.

Визуелизација википодатака о старим српским романима:

слика УРЛ опис
Граф аутора.png
Aутори - шта знамо!?https://w.wiki/5mPBhttps://w.wiki/5mPJ Интерактивни графикони и приказ стабла аутора и ELTeC издања.
Приказ романа кроз bubble chart.png
Нешто више о романима...https://w.wiki/5mPKhttps://w.wiki/5mPM Интерактивни балон графикон са романима у колекцији ELTeC који имају VIAF ID, где је величина круга број страница или број речи.
Mapa mesta prvog izdanja romana srpELTeC kolekcije
Где путујемо?https://w.wiki/5mPE Meста првог издања романа SrpELTeC колекције.
Места која помињу аутори.png
Која места се помињу у романима?https://w.wiki/5mPQ Интерактивни балон графикон са местима која су аутори помињали у колекцији SrpELTeC. Величина круга сразмерна је броју помињања места у роману по ауторима.
Интерактивни балон графикон са местима која помињу аутори.png
http://jerteh.rs/resursi/WIKIDATA-SPARL/query/PlacesMentionedByAuthors.htmlДа ли ми кажеш да си у мом граду?https://w.wiki/5mQ9 Графички приказ броја места која се помињу у колекцији.
Временска визуелизација романа.png
Славимо лепа времена! Визуелизација временске линије романа, сортирана по години њиховог првог објављивања.
Граф односа у породици.png
Ко је моја жена?https://w.wiki/5mPU Интерактивни график супружника у романима.
Ликови у романима.png
Сви смо овде!https://w.wiki/5mPW Интерактивни графикон свих ликова у романима.
Interaktivni grafikon odnosa majka-dete
https://w.wiki/5mPd Интерактивни графикон свих ликова у роману који су у односу мајка-дете
Интерактивни графикон свих ликова у роману који су у односу отац-дете
https://w.wiki/5mPi Интерактивни графикон свих ликова у роману који су у односу отац-дете

Веб страна на енглеском са упитима је доступна на овој адреси.

Статистика подколекције ELTeC српских романа:

графикон упит опис
Графикон ликова по роману.png
https://w.wiki/5mQ6 Графикон зависности броја ликова у односу на романе.
Графикон места по романима.png
https://w.wiki/5mPu Графикон броја појављивања градова у целој колекцији.
Roman mesto.png
https://w.wiki/5mPY Приказ места која се помињу у сваком роману.
Prikaz likova po romanima.png
https://w.wiki/5mPZ Приказ ликова који се помињу у сваком роману.

Систематизација свих ставки у Википодацима

Да би се лако приступило сваком роману, као и издању сваког романа (електронском, дигиталном или штампаном) систематизован је преглед свих романа на страници WikiProject_ELTeC/srpELTeC .

Pregled romana srpELTeC kolekcije
Pregled romana srpELTeC kolekcije


Очекивани утицај

Расположивост предложених ресурса ће свакако приближити читаоцима Вики ресурса овај књижевни период о ком нема много широко доступних информација, али ће кроз романе моћи и да се упозна начин живота у граду и селу у то време, обичаји, јела, … Спрезање текстуалних података са Википодацима ће допринети машинској разумљивости поменутих романа и допринети другачијем, „удаљеном“ погледу на српску књижевност у периоду 1840-1920.

Расположивост предложених ресурса ће свакако приближити читаоцима Вики ресурса овај књижевни период о ком нема много широко доступних информација, али ће кроз романе моћи и да се упозна начин живота у граду и селу у то време, обичаји, јела, … Спрезање текстуалних података са Википодацима ће допринети машинској разумљивости поменутих романа и допринети другачијем, „удаљеном“ погледу на српску књижевност у периоду 1840-1920.

Предложени тим је укључен у COST акцију CA18209 NexusLinguarum – European network for Web-centred linguistic data science која траје 2019-2023 те ће моћи да пренесу актуелне технологије и знања у вики заједницу Србије и даље, али и да користе и промовишу резултате овог пројекта у другим стручним и научним активностима.


Види још[уреди | уреди извор]

wikiELTeC: Википодаци о старим српским романима из колекције ELTeC

Спољне везе[уреди | уреди извор]

Референце[уреди | уреди извор]

  1. ^ http://jerteh.rs/wp-content/uploads/2021/12/Named-Entity-Journey-from-Unitex-to-Wikidata-.pdf
  2. ^ IKONIĆ NEŠIĆ, Milica; STANKOVIĆ, Ranka; RUJEVIĆ, Biljana. Serbian ELTeC Sub-Collection in Wikidata. Infotheca - Journal for Digital Humanities, [S.l.], v. 21, n. 2, p. 60-87, feb. 2022. ISSN 2217-9461. https://infoteka.bg.ac.rs/ojs/index.php/Infoteka/article/view/2021.21.2.4_en