Pređi na sadržaj

Razgovor:Abram (Bihor)/Arhiva 1

Sadržaj stranice nije podržan na drugim jezicima
S Vikipedije, slobodne enciklopedije
Arhiva 1 Arhiva 2

Stanovništvo

Trenutno u članku imamo dva podatka o broju stanovnika (3,346 i 3,291) i jedan naveden izvor. Popis je iz 2002. godine i link ka mađarskom sajtu na kome je zip ne radi baš uvek. Na ukrajinskoj vikipediji se takođe linkuje na isti mađarski sajt i iste zipove za popis iz iste 2002. samo što je podatak o broju stanovnika 970.

Na ukrajinskoj vikipediji je selo napravio bot 2011. godine. Očigledno je imao više podataka na raspolaganju jer je kreirao članak sa podacima o etničkoj pripadnosti, o zastupljenosti maternjeg jezika, o udaljenosti od najbližih naselja. Suštinski nije imao ni jedan ljudski edit od tada. Poslednja botovska izmena je bila pre 5 godina.

Na rumunskoj vikipediji je gomilu puta ispravljano, ljudske ispravke su u ogromnom broju slučajeva. Ono što me je začudilo je nenavođenje njihovog statističkog zavoda kao izvora, a prethodna cifra stanovnika je bila 3,354. (2002 godina i ne poklapa se ni sa jednom prethodnom cifrom). Rumuni imaju i etničku i konfesionu strukturu i boga pitaj odakle su je izvukli. Od 2011. godine se pojavljuje brojka od 865, mada nemamo link niti referencu.

Usput, da li ovo #property:P1082 znači da se podatku može pristupiti preko vikidata? Tako izgleda jer nekakav bot njima ubacivao te veze. -- JustUser  d[-_-]b  01:18, 6. januar 2018. (CET)[odgovori]

Sinhronizovao sam ukupan broj stanovnika na prvu referencu za ovo naselje i za korespondirajuću opštinu. Zip fajl na mađarskom arhivskom sajtu je ispravan.
Ponovo sam danas pokušao da otvorim nalog na INSSE, odakle bi trebalo da bude moguće da se preuzmu rezultati popisa iz 2011. --Dcirovic (razgovor) 03:03, 6. januar 2018. (CET)[odgovori]

Čekaj, ti si peške ispravio ovaj članak? A šta sa ostalih 14.999 ? Jel ima mogućnosti za nekom automatikom?

Usput, može li se napraviti neki šablon za opštine pa da se mogu organizovano pregledati naselja? -- JustUser  d[-_-]b  22:44, 6. januar 2018. (CET)[odgovori]

Ovaj članak je znatnim delom ručno napravljen, te su nehotično podaci za istoimenu opštinu bili prikazani u člaku o naselju. Ova specifična omaška nije sistematski ponovljena, mada to ne isključuje mogućnost postojanja nekih drugih grešaka, kolko god da sam se trudio da ih ne bude.

Dodavanje šablona za opštine je na mom spisku radnih zadataka. To nije do sada bilo urađeno, jer postoji stotinak naselja za koje je poznato u kojem su okrugu, ali ne i u kojoj opštini. Nameravao sam da to ručno razrešim, pre pravljenja šablona. Napraviću šablone za okruge, u kojima su navedene njihove opštine i za svaku opštinu njena naselja, dok će naselja sa nepotpunim podacima biti na dnu u zasebnoj sekciji. Možda biste vi mogli da pomognete u dopuni podataka o oštinskoj pripadnosti naselja, i da ručno dopunite te šablone. --Dcirovic (razgovor) 23:10, 6. januar 2018. (CET)[odgovori]

@JustUser: Šabloni o opštinama su napravljeni i uneti u članke o rumunskim naseljima i opštinama. --Dcirovic (razgovor) 01:52, 9. januar 2018. (CET)[odgovori]

Izvorni kod i podaci

Ako bi mogao na github da baciš sve što je u vezi ovog projekta, mogli bi zajedno raditi i uključiti još nekog. Usput, nema potrebe da persiraš, svi smo saradnici na istom poslu. -- JustUser  d[-_-]b  12:24, 7. januar 2018. (CET)[odgovori]

@JustUser: Moj dosadašnji rad na masovnim unosima je imao za cilj stavljanje u javni domen završenog sadržaja, kao što su članci, šabloni, itd. Podržavam vašu ideju o razmeni izvornog koda, međutim pošto to nije bio cilj mog dosadašnjeg rada, bio bi neophodan duži vremenski period da se tako nešto ostvari u praksi. Deo izvornog koda koji se sastoji od ektenzija pywikipedia koda, kao i samostalne pajton skripte bi se uz manju doradu mogli preneti u javni domen. Izvorni kod za samu obradu podataka masovnih unosa, počevši od pripreme izvornih fajlova, transformacije i dopune raznih sekcija, do provere integriteta i jedinstvenosti podataka, do sinhronizacije sa postojećim sadržajem, i do formiranja finalnog sadržaja, trenutno se vrši na jednom od sistema koji nisu u javnom domenu (jednoj od platformi koje koristim u svom profesionalnom radu). Priprema podataka bi u principu mogla da se potpunosti uradi na nekoj od javno dostupnih platformi, nakon potpune predade mog sadašnjeg izvornog koda, počevši od komponenti za višekratnu upotrebu, do modula za jednokratnu obradu specifičnih setova podataka. To je veliki posao koji bi možda imao smisla na duže staze.

Praktično ostvariv vid inicijalne saradnje na izvornom kodu i podacima, bi mogla da bude kolaboracija na specifičnim aspektima masovnih unosa. Uspešan ishod takve saradnje bi bio snažan podsticaj za ulaz u sveobuhvatnije oblike zajedničkog rada. Značajna komponenta masovnih unosa podataka o naseljima je transkripcija naziva naselja. Pravila transkripcije su dostupna na srwiki pravopisnom trgu. Do sada sam kodirao četiri jezika, u sledećem redosledu: engleski, italijanski, rumunski i španski. Španski modul je najsavšeniji, jer su u njemu korištena iskustva sa prethodnih modula. Pravila stranskripcije su naizgled trivijalna, međutim treba imati u vidu da ona nisu međusobno nezavisna, već je redosled primene pravila značajan. Isto tako je neophodno voditi računa o očuvanju velikih slova (na početku reči i u skraćenicama), o očuvanju rimskih brojeva, o očuvanju interpukcijskih znakova, o omogućavanju transformacije slova koja formalno nisu deo datog pisma, ali se u praksi javljaju, o obradi specifičnih jezičkih konstrukcija čije zadržavanje bi bilo neprirodno u srpskom jeziku, o nizu specijalnih slučajeva koji pisac pravila nije predvideo, i tako dalje. Dalje testiranje i usavšavanje postojećih modula za trankripciju, kao i obrada niza drugih jezika je samostalan posao koji biste možda vi ili neko drugi mogli da preuzmete na sebe. Kad smo već kod ove teme, želim da napomenem da bi isto tako bilo korisno da se izvorni kod za transkripciju portira u Lua jezik, u tom obliku unese kao serija modula na Vikipediju, i da se omogući neposredna traskripcija po zahtevu korisnika na stranici pravopisnog trga. --Dcirovic (razgovor) 01:52, 9. januar 2018. (CET)[odgovori]