Пређи на садржај

Spisak skupova podataka za istraživanje mašinskog učenja

С Википедије, слободне енциклопедије

Ovi setovi podataka se koriste u istraživanju mašinskog učenja (ML) i citirani su u recenziranim akademskim časopisima. Skupovi podataka su sastavni deo oblasti mašinskog učenja. Veliki napredak u ovoj oblasti može biti rezultat napretka u algoritmima učenja (kao što je duboko učenje), računarskom hardveru i, manje intuitivno, dostupnosti visokokvalitetnih skupova podataka za obuku.[1] Visokokvalitetne označene skupove podataka za obuku nadziranih i polu-nadziranih algoritama mašinskog učenja obično je teško i skupo proizvesti zbog velike količine vremena potrebnog za označavanje podataka. Iako ne moraju ubek biti označeni, visokokvalitetne skupove podataka za učenje bez nadzora takođe može biti tegobno i skupo proizvesti.[2][3][4][5]

Mnoge organizacije, uključujući vlade, objavljuju i dele svoje skupove podataka. Skupovi podataka su klasifikovani, na osnovu licenci, kao otvoreni i neotvoreni podaci.[6][7][8]

Skupovi podataka različitih vladinih tela predstavljeni su u Spisku otvorenih vladinih sajtova sa podacima. Skupovi podataka se prenose na portale otvorenih podataka. Oni su dostupni za pretraživanje, deponovanje i pristup preko interfejsa kao što je Open API.[9][10] Skupovi podataka su dostupni kao različiti sortirani tipovi i podtipovi.

  1. ^ Wissner-Gross, A. „Datasets Over Algorithms”. Edge.com. Приступљено 8. 1. 2016. 
  2. ^ Weiss, G. M.; Provost, F. (1. 9. 2003). „Learning When Training Data are Costly: The Effect of Class Distribution on Tree Induction”. Journal of Artificial Intelligence Research. AI Access Foundation. 19: 315—354. ISSN 1076-9757. S2CID 2344521. doi:10.1613/jair.1199. 
  3. ^ Turney, Peter (2000). „Types of cost in inductive concept learning”. arXiv:cs/0212034Слободан приступ. 
  4. ^ Abney, Steven (17. 9. 2007). Semisupervised Learning for Computational Linguistics. CRC Press. ISBN 978-1-4200-1080-0. 
  5. ^ Žliobaitė, Indrė; Bifet, Albert; Pfahringer, Bernhard; Holmes, Geoff (2011). „Active Learning with Evolving Streaming Data”. Machine Learning and Knowledge Discovery in Databases. Lecture Notes in Computer Science. 6913. Berlin, Heidelberg: Springer Berlin Heidelberg. стр. 597—612. ISBN 978-3-642-23807-9. ISSN 0302-9743. doi:10.1007/978-3-642-23808-6_39. 
  6. ^ „What is open?”. okfn.org (на језику: енглески). Приступљено 2022-03-22. 
  7. ^ „Open Definition 2.1 - Open Definition - Defining Open in Open Data, Open Content and Open Knowledge”. opendefinition.org. Приступљено 2022-03-22. 
  8. ^ Auer, S. R.; Bizer, C.; Kobilarov, G.; Lehmann, J.; Cyganiak, R.; Ives, Z. (2007). „DBpedia: A Nucleus for a Web of Open Data”. The Semantic Web. Lecture Notes in Computer Science. 4825. стр. 722—735. ISBN 978-3-540-76297-3. S2CID 7278297. doi:10.1007/978-3-540-76298-0_52. 
  9. ^ Proffitt, Brian (19. 9. 2013). „What APIs Are And Why They're Important”. Readwrite. Приступљено 28. 10. 2015. 
  10. ^ „What is open API? - Definition from WhatIs.com”. SearchCloudApplications. Архивирано из оригинала 30. 04. 2017. г. Приступљено 2015-10-26.