Linked data
U računarstvu, linked data (često kapitalizuju kao Linked Data) opisuje metod objavljivanja strukturiranih podataka, tako da se može međusobno povezati i tako postaju korisniji za korisnike. On polazi od standardnih Web tehnologija kao što su HTTP, RDF i URI, ali umesto da ih koriste da služe samo za Web stranice koje služe čitaocima, ona ih proširuje da se dele informacije na način koji može da se automatski čitaju u računarima. Ovo omogućava da podaci iz različitih izvora budu ti koji su povezani. Linked Data je o korišćenju Web-a za povezivanje relevantnih podataka nije dodato da je anonimno povezan, ili koristeći Web da smanji prepreke za povezivanje podataka trenutno povezane koristeći druge metode. Preciznije, Vikipedija definiše Linked data kao "termin koji se koristi da opiše i preporuči najbolju praksu za izlaganje, deljenje, a povezuje delove podataka, informacija i znanja o semantičkog veba pomoću URI i RDF. Budući da većina organizacija živi na njihovoj unutrašnjoj znanja koja su inteligentno kombinuju sa veoma specifična (i najčešće javno dostupan) znanja (i podataka), oni bi imali koristi od LOD samo ako su pokriveni određenim domenima. Često citirao 'najbolja praksa' za LOD je to deo skupa podataka koji je dostupan na Bio2RDF. Prvi korak bi mogao biti da se napravi jasna razliku između deonica LOD oblaka koji je otvoren i koji nije. Skupovi bez dozvole treba eksplicitno označiti, jer su to oni koji su najproblematičniji za komercijalnu upotrebu, ne one koje nisu otvorene. Drugi napredak mogao biti sačinjen tako da su neki kriterijumi kvaliteta jasno propsani. Drugi napredak mogao biti napravljen tako što su neki kriterijumi kvaliteta jasno vidljiva. Najvažnije je da se oko održavanja i autorstvu: Ko preuzima odgovornost za kvalitet i pouzdanost podataka i ko je tačno održavalac.
Tim Berners-Li, direktor World Wide Web Consortium, napravio je termin u dizajnu uz napomenu da se raspravljaju pitanja oko projekta semantičkog veba.
Principi
[uredi | uredi izvor]Tim Berners-Li je navedeno četiri principa povezanih podataka u svojim Design Issues: Linked Data[1] napomena parafrazirao ovim redom:
- Koristite URI za označavanje stvari.
- Koristite HTTP URIs tako da se ove stvari mogu biti upućeni od strane ljudi i korisničkih agenata.
- Pruža korisne informacije o stvar kada je njegova URI se dereferenced, usklađivanje standarda kao što su RDF, SPARQL.
- Uključi linkove na druge srodne stvari (koristeći svoje URI) nakon objavljivanja podataka na Internetu.
Tim Berners-Lee je održao prezentaciju o povezanim podacima na konferenciji TED 2009[2]. Na konferenciji on je ponovio principe povezanih podataka kao tri "krajnje jednostavna" pravila:
- Sve vrste konceptualnih stvari, oni imaju imena koja počinju slovom sada HTTP.
- Ja sve važne informacije vraćam nazad. Ja ću se vratiti na neke podatke u standardnom formatu koji čini na neki način korisne podatke koje neko možda želeli da zna o toj stvari, o tom događaju.
- Ja ću da se vratim na tu informaciju koja nije dobila samo nečiju visinu i težinu i kada su rođeni, to je dobio odnosa. A kada ima veze, kad god ona izražava odnos onda je druga stvar da se to odnosi na jedno od tih imena koja počinje sa HTTP.
Komponente
[uredi | uredi izvor]- URI
- HTTP
- Resource Description Framework (RDF)
- Serialization formati (RDFa, RDF/XML, N3, Turtle, i ostali)
Linking open-data community project
[uredi | uredi izvor]Primer veze unutar povezivanja otvorenih podataka u skupove podataka. Primer veze unutar povezivanja otvorenih podataka u skupove podataka Cilj W3C semantičkog Web prosvete i projekat povezivanja Javni podaci grupe je da proširi Web sa podacima dobara, objavljivanjem raznih otvorenih skupova i podataka kao i RDF na Internetu i postavljanjem RDF veze između stavki podataka iz različitih izvora podataka širom sveta. U oktobru 2007 godine, skup podataka se sastojao od preko dve milijarde RDF trojki, koji su povezanoj preko dva miliona RDF linkova. Do septembra 2011 godine ovo je poraslo na 31 milijardi RDF trojki, povezanoj oko 504 miliona RDF linkova.[3] Tu je interaktivna vizuelizacija povezanoj podataka postavlja za pregledanje kroz zamračenje.[4]
Projekti Evropske unije
[uredi | uredi izvor]Postoji veliki broj projekata Evropske unije koji uključuju povezane podatke. Ovo uključuje povezane otvorene podatke oko sat (LATC) projekta[5]. Projektne PlantetData[6], i Linked Open Data 2 (LOD2) projekat.[7] Podatak za povezivanje je jedan od osnovnih ciljevia EU Open Data Portal-a, koji čini dostupnim hiljade setova podataka za svako ponovno korišćenje i linkova.
Skupovi podataka
[uredi | uredi izvor]- CKAN - registar otvorenih podataka i sadržaja paketa koje pruža Open Knowledge Foundation.
- DBpedia - skup podataka koji sadrži podatke koji se izdvajaju iz Vikipedije; sadrži oko 3,4 miliona koncepta i koji se mogu opisati sa oko 1 milijardom trojki, uključujući i sažetaka na 11 različitih jezika.
- GeoNames - pruža RDF opise sa više od 7,500,000 geografskih karakteristika koje se nalaze širom sveta.
- UMBEL - lagana referentna struktura koju čini 20.000 predmeta koncepta nastave i njihovih veza izvedenim iz OpenCyc, koji su radili tako da im je cilj bio da obavezuju nastavu na spoljnom podataka; takođe ima veza sa 1,5 miliona imenovanih lica iz DBpedia i YAGO.
- FOAF - skup podataka koji služi za opivanje lica, njihovih svojstava i odnosa.
- Reegle - podaci povezani u jedan otvoreni bazen koji sadrži samo čistu energiju skupova svih podataka, izveštaje politike, projekat izlazne dokumente i terminologiju iz reegle.
- Eagle-i - skup podataka koji služi za objavljivanje preko 60.000 kustos biomedicinskih izvora sa SPARQL krajnjih tačaka.
- Ontobee - SPARQL - zasnovan je na povezivanju ontologija servera podataka i pregledača koji je iskorišćen za preko 100 ontologija koje sadrže više od dva miliona ontologije uslove.
- LOG.DISIT - Linked Open Graph, LOG, predstavlja alat za višestruko SPARQL sedištem povezan je sa ontologijom pretraživanja i skupom ontologija za: Smart sity and mobility, smart could, ESCALP izvođačkim umetnostima, itd... na to se još može dodati veza sa Europeana, dbPedia, Geonames, Vocabulary of Getty, itd...
Vidi još
[uredi | uredi izvor]Reference
[uredi | uredi izvor]- ^ Linked Data—Design Issues
- ^ Tim Berners-Lee on the next Web
- ^ Linking Open Data
- ^ Interaktivna vizuelizacija povezanih skupova podataka
- ^ „Linked open data around the clock (LATC)”. Arhivirano iz originala 19. 09. 2018. g. Pristupljeno 26. 05. 2014.
- ^ „PlanetData”. Arhivirano iz originala 21. 04. 2021. g. Pristupljeno 26. 05. 2014.
- ^ „CORDIS FP7 ICT Projects – LOD2”. Arhivirano iz originala 07. 12. 2013. g. Pristupljeno 26. 05. 2014.
Dodatna literatura
[uredi | uredi izvor]- Ahmet Soylu, Felix Mödritscher, and Patrick De Causmaecker. 2012. “Ubiquitous Web Navigation through Harvesting Embedded Semantic Data: A Mobile Scenario.” Arhivirano na sajtu Wayback Machine (19. septembar 2018) Integrated Computer-Aided Engineering 19 (1): 93–109.
- Linked Data: Evolving the Web into a Global Data Space (2011) by Tom Heath and Christian Bizer, Synthesis Lectures on the Semantic Web: Theory and Technology, Morgan & Claypool
- How to Publish Linked Data on the Web Arhivirano na sajtu Wayback Machine (19. april 2021), by Chris Bizer, Richard Cyganiak and Tom Heath, Linked Data Tutorial at Freie Universität Berlin, Germany, 27 July 2007.
- The Web Turns 20: Linked Data Gives People Power, part 1 of 4, by Mark Fischetti, Scientific American 2010 October 23
- Linked Data Is Merely More Data – Prateek Jain, Pascal Hitzler, Peter Z. Yeh, Kunal Verma, and Amit P. Sheth. In: Dan Brickley, Vinay K. Chaudhri, Harry Halpin, and Deborah McGuinness: Linked Data Meets Artificial Intelligence. Technical Report SS-10-07, AAAI Press, Menlo Park, California, 2010, pp. 82–86.
- Moving beyond sameAs with PLATO: Partonomy detection for Linked Data – Prateek Jain, Pascal Hitzler, Kunal Verma, Peter Z. Yeh, Amit Sheth. In: Proceedings of the 23rd ACM Hypertext and Social Media conference (HT 2012), Milwaukee, WI, USA, June 25–28, 2012.
- Freitas, André, Edward Curry, João Gabriel Oliveira, and Sean O’Riain. 2012. “Querying Heterogeneous Datasets on the Linked Data Web: Challenges, Approaches, and Trends.” IEEE Internet Computing 16 (1): 24–33.
- Linked Data on the Web Arhivirano na sajtu Wayback Machine (13. novembar 2020) – Chris Bizer, Tom Heath, Kingsley Uyi Idehen, Tim Berners-Lee. In Proceedings WWW2008, Beijing, China
- Interlinking Open Data on the Web – Chris Bizer, Tom Heath, Danny Ayers, Yves Raimond. In Proceedings Poster Track, ESWC2007, Innsbruck, Austria
- Ontology Alignment for Linked Open Data – Prateek Jain, Pascal Hitzler, Amit Sheth, Kunal Verma, Peter Z. Yeh. In proceedings of the 9th International Semantic Web Conference, ISWC 2010, Shanghai, China
- Linked open drug data for pharmaceutical research and development - J Cheminform. 2011; 3: 19. Samwald, Jentzsch, Bouton, Kallesøe, Willighagen, Hajagos, Marshall, Prud'hommeaux, Hassenzadeh, Pichler, and Stephens (May 2011)
- Interview with Sören Auer, head of the LOD2 project about the continuation of LOD2 in 2011 Arhivirano na sajtu Wayback Machine (6. april 2018), June 2011
- Linked Open Data: The Essentials Arhivirano na sajtu Wayback Machine (4. jun 2016) - Florian Bauer and Martin Kaltenböck (January 2012)
- The Flap of a Butterfly Wing - semanticweb.com Richard Wallis (February 2012)
Spoljašnje veze
[uredi | uredi izvor]- Semantic Arhivirano na sajtu Wayback Machine (4. јун 2016)
- Semantic blog
- w3