Med reCaptcha hjÀlper du till med digitaliseringen
ReCAPTCHA Àr en snillrik idé för att hjÀlpa till i den OCR-baserade digitaliseringen. NÀr tryckt material ska OCR-lÀsas för att digitaliseras blir avlÀsningen inte alltid hundraprocentig och mÄste alltsÄ rÀttas av en livs levande mÀnniska.
CAPTCHA i sin tur Ă€r en teknik för att kunna skilja spammare frĂ„n verkliga mĂ€nniskor. Man fĂ„r upp en “suddig” variant av ett ord som sedan ska skrivas in i och verifieras, vilket bara en mĂ€nniska kan avgöra, inte ett program. (Ăn sĂ„ lĂ€nge ska jag vĂ€l tillĂ€gga).
Det reCAPTCHA gör Àr att de presenterar tvÄ ord. Ett ord Àr ett vanligt captcha-ord (för att sortera bort spammare), det andra ett ord som OCR-programmet anser att den inte förstÄtt. Genom att skriva in rÀtt andra ord har anvÀndaren hjÀlpt till att tolka det ord OCR-programmet inte klarade av. Detta andra ord som skrivs in verifieras dock med hur andra tolkat samma ord för att nÄ större sÀkerhet.
Om du installerar reCAPTCHA t ex pÄ din blogg eller wiki sÄ bidrar du till snabbare digitalisering. Vad Àr det som digitaliseras? reCAPTCHA samarbetar med ideella Internet Archive. En god sak med andra ord.
Men hĂ€romdagen framfördes klagomĂ„l mot reCAPTCHA pĂ„ Matt Haughey’s personal blog:
“Last night I tried out the contact form and was surprised that in the first ten images presented to me (keep hitting the little refresh button, the top of the three buttons on the control), at least half were totally undecipherable”.
Eric Goldberg pÄ Stumbleupon föreslÄr denna lösning i kommentarspÄret:
“We have had a similar issue on StumbleUpon, so we added a prominent link that says ‘Canât read this?’ which calls Recaptcha.reload() to fetch a new image”.
Och förtydligar:
“Also note that users need only answer one of the two words correctly”.
Skaffa reCAPTCHA nu! Eller sÄ kan du gÄ in pÄ deras sida och bidra med OCR-rÀttning direkt.
