ImageNet

S Vikipedije, slobodne enciklopedije

Projekat ImageNet je velika vizuelna baza podataka dizajnirana za upotrebu u istraživanju softvera za prepoznavanje vizuelnih objekata .

Više od 14 miliona [1] [2] slika je ručno obeleženo od strane projekta kako bi se naznačilo koji su objekti prikazani, a na najmanje milion slika su takođe osigurani ograničavajući okviri. [3]

ImageNet sadrži više od 20.000 kategorija, [4] sa tipičnom kategorijom, poput „balona“ ili „jagode“, koja se sastoji od nekoliko stotina slika. [5]

Baza podataka o beleškama URL -ova slika sa drugih povezanih programa, je besplatno dostupna direktno sa ImageNet-a, iako stvarne slike nisu u njihovom vlasnišvu. [6]

Od 2010. godine, ImageNet projekat, na godišnjem nivou, održava takmičenje u softveru, en. ImageNet Large Scale Visual Recognition Challenge (ILSVRC), gde se softverski programi takmiče da pravilno klasifikuju i detektuju predmete i scene. Izazov koristi „skraćenu“ listu od hiljadu klasa koje se ne preklapaju. [7]

Značaj za duboko učenje[uredi | uredi izvor]

Dana 30. septembra 2012. godine, konvoluciona neuronska mreža (CNN) pod nazivom AlexNet [8] postigla je grešku prvih 5 od 15,3% u ImageNet 2012 izazovu, što je više od 10,8 procenata manje nego kod drugoplasiranog. To je omogućeno zahvaljujući upotrebi grafičkih procesorskih jedinica (GPU) tokom treninga, [8] suštinskog sastojka revolucije dubokog učenja . Prema The Economist -u, „odjednom su ljudi počeli da obraćaju pažnju, ne samo unutar zajednice veštačke inteligencije, već i širom tehnološke industrije u celini“. [9] [10] [11]

U 2015. godini, AlekNet je nadmašen od strane Mikrosoftovog veoma dubok CNN-a sa preko 100 slojeva, koji je pobedio na takmičenju ImageNet 2015. [12]

Istorija baze podataka[uredi | uredi izvor]

Istraživač veštačke inteligencije Fei-Fei Li počeo je da radi na ideji za ImageNet 2006. godine. U vreme kada se većina istraživanja veštačke inteligencije fokusirala na modele i algoritme, Li je želeo da proširi i unapredi dostupne podatke za obuku AI algoritama. [13] 2007. godine Li se sastao sa profesorom sa Prinstona Kristijanom Felbaumom, jednim od tvoraca WordNet-a, da bi razgovarali o projektu. Kao rezultat ovog sastanka, Li je nastavio da gradi ImageNet počevši od WordNet baze podataka i koristeći mnoge njegove karakteristike. [14]

Kao docent na Prinstonu, Li je okupio tim istraživača da rade na projektu ImageNet-a. Koristili su Mehaničkog Turka sa Amazona da pomognu u klasifikaciji slika. [15]

Oni su svoju bazu podataka po prvi put predstavili kao poster na Konferenciji o kompjuterskoj viziji i prepoznavanju uzoraka (CVPR) održanoj 2009. godine na Floridi. [16] [17] [18]

Skup podataka[uredi | uredi izvor]

ImageNet crovdsources svoj proces beleženja. Anotacije na nivou slike ukazuju na prisustvo ili odsustvo klase objekta na slici, kao što je „na ovoj slici ima tigrova“ ili „na ovoj slici nema tigrova“. Anotacije na nivou objekta pružaju granični okvir oko (vidljivog dela) navedenog objekta. ImageNet koristi varijantu široke WordNet šeme za kategorizaciju objekata, dopunjenu sa 120 kategorija rasa pasa za prikazivanje fine zrnaste klasifikacije. [7] Jedna od mana korišćenja WordNet-a je to što su kategorije „uzvišenije“ nego što bi bilo optimalno za ImageNet: „Većina ljudi je više zainteresovana za Lejdi Gagu ili iPod Mini nego za ovu retku vrstu diplodoka .“[pojasniti] Godine 2012. ImageNet je bio najveći svetski akademski korisnik Mehaničkog Turka- a. Prosečan radnik je identifikovao 50 slika u minuti. [4]

Istorija izazova ImageNet-a[uredi | uredi izvor]

Istorija stope grešaka na ImageNet-u (pokazuje najbolji rezultat po timu i do 10 unosa godišnje)

ILSVRC ima za cilj da „prati korake“ PASCAL VOC izazova manjeg obima, koji je osnovan 2005. godine i sadržao je samo oko 20.000 slika i dvadeset klasa objekata. [7] Da bi „demokratizovao“ ImageNet, Fei-Fei Li je predložio PASCAL VOC timu saradnju, počevši od 2010. godine, gde bi istraživački timovi procenili svoje algoritme na određenom nizu podataka i takmičili se u postizanju veće preciznosti na nekoliko zadataka vizuelnog prepoznavanja. [16]

Rezultujuće takmičenje koje se održava jednom godišnje sada je poznato kao ImageNet veliki izazov za vizualno prepoznavanje (ILSVRC). ILSVRC koristi „podrezanu“ listu od samo 1000 kategorija slika ili „klasa“, uključujući 90 od 120 rasa pasa klasifikovanih po celoj ImageNet šemi. [7] Tokom 2010-ih su doživeli dramatičan napredak u obradi slika. Otprilike 2011. godina, dobra stopa grešaka u top-5 klasifikacije ILSVRC bila je 25%. U 2012. godini, duboka konvoluciona neuronska mreža pod nazivom AlexNet postigla je 16%; u narednih nekoliko godina, stopa grešaka je pala u prvih 5 na nekoliko procenata. [19] Dok je 2012. prolazila „kombinovao delove koji su svi ranije postojali”, dramatično kvantitativno poboljšanje označilo je početak buma veštačke inteligencije širom industrije. [20] Do 2015. godine, istraživači iz Majkrosofta su izvestili da su njihovi CNN-ovi nadmašili ljudske sposobnosti na uskim zadacima ILSVRC-a. [21] [22] Međutim, kako je jedna od organizatora izazova, Olga Rusakovski, istakla 2015. godine, programi samo treba da identifikuju slike kao da pripadaju jednoj od hiljadu kategorija; ljudi mogu da prepoznaju veći broj kategorija, a takođe (za razliku od programa) mogu da procenjuju kontekst slike. [23]

Do 2014. godine više od pedeset institucija je učestvovalo u ILSVRC-u. [7] U 2017., 29 od 38 takmičarskih ekipa imalo je više od 95% tačnosti. [24] Godine 2017. ImageNet je najavio da će u 2018. pokrenuti novi novi, mnogo teži izazov koji uključuje klasifikaciju 3D objekata korišćenjem prirodnog jezika. Budući da je kreiranje 3D podataka skuplje od zabeleživanja prethodne već postojeće 2D slike, očekuje se da će skup podataka biti manji. Primene napretka u ovom području bi se kretale od robotske navigacije do proširene stvarnosti . [25]

Pristrasnost u ImageNetu-u[uredi | uredi izvor]

Studija istorije višestrukih slojeva ( taksonomija, klase objekata i označavanje) ImageNet-a i WordNet-a iz 2019. godine je opisana kao je pristrasnost duboko ugrađena u većinu klasifikacionih pristupa za svaku vrstu slike. [26] [27] [28] [29] ImageNet radi na rešavanju različitih izvora pristrasnosti. [30]

Vidi još[uredi | uredi izvor]

Reference[uredi | uredi izvor]

  1. ^ „New computer vision challenge wants to teach robots to see in 3D”. New Scientist. 7. 4. 2017. Pristupljeno 3. 2. 2018. 
  2. ^ Markoff, John (19. 11. 2012). „For Web Images, Creating New Technology to Seek and Find”. The New York Times. Pristupljeno 3. 2. 2018. 
  3. ^ „ImageNet Summary and Statistics”. ImageNet. Arhivirano iz originala 05. 07. 2019. g. Pristupljeno 22. 6. 2016. 
  4. ^ a b Markoff, John (19. 11. 2012). „For Web Images, Creating New Technology to Seek and Find”. The New York Times. Pristupljeno 3. 2. 2018. 
  5. ^ „From not working to neural networking”. The Economist. 25. 6. 2016. Pristupljeno 3. 2. 2018. 
  6. ^ „ImageNet Overview”. ImageNet. Arhivirano iz originala 23. 06. 2019. g. Pristupljeno 22. 6. 2016. 
  7. ^ a b v g d Olga Russakovsky*, Jia Deng*, Hao Su, Jonathan Krause, Sanjeev Satheesh, Sean Ma, Zhiheng Huang, Andrej Karpathy, Aditya Khosla, Michael Bernstein, Alexander C. Berg and Li Fei-Fei. (* = equal contribution) ImageNet Large Scale Visual Recognition Challenge. IJCV, 2015.
  8. ^ a b Krizhevsky, Alex; Sutskever, Ilya; Hinton, Geoffrey E. (jun 2017). „ImageNet classification with deep convolutional neural networks” (PDF). Communications of the ACM. 60 (6): 84—90. ISSN 0001-0782. doi:10.1145/3065386Slobodan pristup. Pristupljeno 24. 5. 2017. 
  9. ^ „From not working to neural networking”. The Economist. 25. 6. 2016. Pristupljeno 3. 2. 2018. 
  10. ^ „Machines 'beat humans' for a growing number of tasks”. Financial Times. 30. 11. 2017. Pristupljeno 3. 2. 2018. 
  11. ^ Gershgorn, Dave (18. 6. 2018). „The inside story of how AI got good enough to dominate Silicon Valley”. Quartz. Pristupljeno 10. 12. 2018. 
  12. ^ He, Kaiming; Zhang, Xiangyu; Ren, Shaoqing; Sun, Jian (2016). „Deep Residual Learning for Image Recognition.”. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR): 770—778. ISBN 978-1-4673-8851-1. arXiv:1512.03385Slobodan pristup. doi:10.1109/CVPR.2016.90. 
  13. ^ Hempel, Jesse (13. 11. 2018). „Fei-Fei Li's Quest to Make AI Better for Humanity”. Wired. Pristupljeno 5. 5. 2019. „When Li, who had moved back to Princeton to take a job as an assistant professor in 2007, talked up her idea for ImageNet, she had a hard time getting faculty members to help out. Finally, a professor who specialized in computer architecture agreed to join her as a collaborator. 
  14. ^ Gershgorn, Dave (26. 7. 2017). „The data that transformed AI research—and possibly the world”. Quartz. Atlantic Media Co. Pristupljeno 26. 7. 2017. „Having read about WordNet's approach, Li met with professor Christiane Fellbaum, a researcher influential in the continued work on WordNet, during a 2006 visit to Princeton. 
  15. ^ Gershgorn, Dave (26. 7. 2017). „The data that transformed AI research—and possibly the world”. Quartz. Atlantic Media Co. Pristupljeno 26. 7. 2017. „Having read about WordNet's approach, Li met with professor Christiane Fellbaum, a researcher influential in the continued work on WordNet, during a 2006 visit to Princeton. 
  16. ^ a b Gershgorn, Dave (26. 7. 2017). „The data that transformed AI research—and possibly the world”. Quartz. Atlantic Media Co. Pristupljeno 26. 7. 2017. „Having read about WordNet's approach, Li met with professor Christiane Fellbaum, a researcher influential in the continued work on WordNet, during a 2006 visit to Princeton. 
  17. ^ Deng, Jia; Dong, Wei; Socher, Richard; Li, Li-Jia; Li, Kai; Fei-Fei, Li (2009), „ImageNet: A Large-Scale Hierarchical Image Database” (PDF), 2009 conference on Computer Vision and Pattern Recognition, Arhivirano iz originala (PDF) 15. 01. 2021. g., Pristupljeno 07. 09. 2022 
  18. ^ Li, Fei-Fei, How we're teaching computers to understand pictures, Pristupljeno 16. 12. 2018 
  19. ^ Robbins, Martin (6. 5. 2016). „Does an AI need to make love to Rembrandt's girlfriend to make art?”. The Guardian. Pristupljeno 22. 6. 2016. 
  20. ^ „From not working to neural networking”. The Economist. 25. 6. 2016. Pristupljeno 3. 2. 2018. 
  21. ^ He, Kaiming; Zhang, Xiangyu; Ren, Shaoqing; Sun, Jian (2016). „Deep Residual Learning for Image Recognition.”. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR): 770—778. ISBN 978-1-4673-8851-1. arXiv:1512.03385Slobodan pristup. doi:10.1109/CVPR.2016.90. 
  22. ^ Markoff, John (10. 12. 2015). „A Learning Advance in Artificial Intelligence Rivals Human Abilities”. The New York Times. Pristupljeno 22. 6. 2016. 
  23. ^ Aron, Jacob (21. 9. 2015). „Forget the Turing test – there are better ways of judging AI”. New Scientist. Pristupljeno 22. 6. 2016. 
  24. ^ Gershgorn, Dave (10. 9. 2017). „The Quartz guide to artificial intelligence: What is it, why is it important, and should we be afraid?”. Quartz. Pristupljeno 3. 2. 2018. 
  25. ^ „New computer vision challenge wants to teach robots to see in 3D”. New Scientist. 7. 4. 2017. Pristupljeno 3. 2. 2018. 
  26. ^ „The Viral App That Labels You Isn't Quite What You Think”. Wired. ISSN 1059-1028. Pristupljeno 22. 9. 2019. 
  27. ^ Wong, Julia Carrie (18. 9. 2019). „The viral selfie app ImageNet Roulette seemed fun – until it called me a racist slur”. The Guardian. ISSN 0261-3077. Pristupljeno 22. 9. 2019. 
  28. ^ Crawford, Kate; Paglen, Trevor (19. 9. 2019). „Excavating AI: The Politics of Training Sets for Machine Learning”. -. Pristupljeno 22. 9. 2019. 
  29. ^ Lyons, Michael (4. 9. 2020). „Excavating "Excavating AI": The Elephant in the Gallery”. arXiv:2009.01215Slobodan pristup. doi:10.5281/zenodo.4037538. 
  30. ^ „Towards Fairer Datasets: Filtering and Balancing the Distribution of the People Subtree in the ImageNet Hierarchy”. image-net.org. 17. 9. 2019. Pristupljeno 22. 9. 2019. 

Spoljašnje veze[uredi | uredi izvor]