ReCAPTCHA

S Vikipedije, slobodne enciklopedije
reCaptcha logo

Recaptcha je sistem za ljudsku verifikaciju u vlasništvu Gugla.

Prvobitna iteracija usluge bila je platforma dizajnirana za digitalizaciju knjiga, posebno onih koji su bili previše nečitljive da bi ih skenirali računari. Uput za verifikaciju koristi parove reči sa skeniranih stranica, s tim što se jedna poznata reč koristi kao kontrola za verifikaciju, a druga koja se koristi za prepisivanje čitanja nesigurnih reči.[1] Ovaj sistem su prvobitno razvili Luis von An, Dejvid Abraham, Manuel Blum, Majkl Kraford, Ben Maurer, Kolin MekMilen i Edison Tan u glavnom kampusu Univeziteta u Pitburgu. [2] Gugl ga je kupio u septembru 2009. godine.[3] Sistem je pomogao digitalizaciji arhiva Njujork Tajmsa, a kasnije ih je Gugl Buks koristio u slične svrhe.

Sistem je prijavljen da prikazuje preko 100 miliona captcha svaki dan.

Operacije[uredi | uredi izvor]

Moderna captcha iz projekta reCaptcha

Skenirani tekst podvrgnut je analiziranju pomoću dva različita OCR-a. Svaka reč koja se različito dešifruje u dva OCR programa ili nije u engleskom rečniku označena je kao "sumnjiva" i pretvorena u captcha. Sumnjiva reč se prikazuje izvan konteksta, ponekad zajedno sa već poznatom kontrolnom rečju. Ako čovek pravilno unese kontrolnu reč, tada je odgovor na upitnu reč prihvaćen kao verovatno tačan. Ako je dovoljno korisnika ispravno otkucalo kontrolnu reč, a pogrešno otkucalo drugu reč koju OCR nije uspeo da prepozna, digitalna verzija dokumenata mogla bi sadržavati pogrešnu reč. Identifikacija koju provodi svaki OCR program daje vrednost 0,5 bodova, a svaka interpretacija od strane čoveka daje punu tačku. Jednom kada data identifikacija dostigne 2,5 boda, reč se smatra validnom. Te reči kojima ljudi dosledno daju jedan identitet kasnije se recikliraju kao kontrolne reči. Ako se prva tri nagađanja podudaraju jedna sa drugom, ali se ne podudaraju ni sa jednim od OCR-a, smatraće se tačnim odgovorom i reč postaje kontrolna reč. Kada šest korisnika odbaci reč pre nego što se izabere bilo koji ispravan pravopis, reč se odbacuje kao nečitljiva.[4]

Reference[uredi | uredi izvor]

  1. ^ Ahn, Luis von. „Massive-scale online collaboration”. ted.com (na jeziku: engleski). Pristupljeno 26. 8. 2020. 
  2. ^ „About Us”. web.archive.org. 11. 6. 2010. Arhivirano iz originala 11. 06. 2010. g. Pristupljeno 26. 8. 2020. 
  3. ^ „Teaching computers to read: Google acquires reCAPTCHA”. Official Google Blog (na jeziku: engleski). Pristupljeno 26. 8. 2020. 
  4. ^ Luis; Maurer, Ben; McMillen, Colin; Abraham, David; Blum, Manuel (2008). "reCAPTCHA: Human-Based Character Recognition via Web Security Measures" (PDF)". Science. 321 (5895): 1465–1468.

Spoljašnje veze[uredi | uredi izvor]