13 de agosto de 2012 às 12h27
Das ideias super boas da humanidade: o reCAPTCHA
Captcha, pra quem não sabe, é o nome convencionado daquelas letras super esquisitas que você precisa digitar pela internet antes de clicar em um botão de ‘enviar’ e servem para provar para o sistema que você uma pessoa e não um robô. São tempos estranhos esse em que vivemos, quando se torna necessário digitar letrinhas pra provar que não somos robôs e, pior ainda, quando a gente não consegue ler a merda das letras e, portanto, pro sistema em questão somos indistinguíveis de um robô.
Quando eu falo “robô” aqui, acho que é necessário explicar para alguns usuários que estamos falando de softwares conhecidos como “bots”, e não de robôs de lata e circuitos tipo o Homem Bicentenário (infelizmente, já que esse é um grande personagem de Robin Williams). Só para ficar claro.
O sistema de Captcha mais famoso chama reCAPTCHA e – ADIVINHA! – é do Google. É gratuito e é só botar o código no seu software e o computador ligado à internet será capaz de verificar se está diante de um homem ou uma máquina. O que sempre me intrigou é que frequentemente esses Captchas do Google vêm com imagens realmente ilegíveis. Por “ilegíveis”, entenda algo na linha “eu não preciso usar óculos e mesmo assim não faço ideia do que está escrito aqui’. Além da clara falta de praticidade de um sistema assim, o mais perturbador é pensar que se aquelas letrinhas estão ali, em um campo de verificação, o sistema precisa saber de verdade o que está escrito, claro, pra checar se você acertou. E se alguém foi capaz de ler uma palavra toda cagada e você não, bom, você começa a se questionar sobre a possibilidade de você ser, de fato, um robô.
Felizmente, eu descobri esse temor como sendo infundado depois de entrar no site do reCAPTCHA e ler como a parada funciona. E quer saber? Como quase tudo do Google, com exceção talvez do Google+ e do Google Nexus, há de ser parabenizado pela sua engenhosidade.
O reCAPTCHA atende a dois propósitos: além de servir como um eficiente repelente para robôs malandros que estejam tentando usar o computador dos humanos da casa na ausência dos últimos HEH, ele serve como uma ferramenta gratuita de crowdsourcing (se não souber o que é isso, você está com sorte hoje: escrevi em 2011 uma reportagem para o Link que explica crowdsourcing tintim por tintim) que ajuda na digitalização de manuscritos antigos. Isso explica outra coisa que me intrigava no ReCaptcha: eu era frequentemente confrontada com palavras que conhecia, em português ou outras línguas. Outros Captchas costumam exibir caracteres randômicos.
O método empregado pelo reCAPTCHA é simples, simples: ele exibe duas palavras escaneadas de livros e jornais antigos. O servidor conhece o significado de apenas uma delas – que é de fácil leitura e, portanto, o computador foi capaz de ler corretamente. Se você acertar essa, ele vai assumir que aquilo que você identificou na outra palavra da dupla está correto, e então usa seu conhecimento de ser humano para digitalizar literatura que já é patrimônio da humanidade. E o melhor: não é necessário pagar ninguém. É assim que o Google coloca a disposição dos usuários aquele monte de coisas no Google Books, ou edições antigas do New York Times. E também explica algumas palavras incompreensíveis – nem o software sabe a resposta pra elas. Ele vai simplesmente tomar o que você disse como verdadeiro!
Com o esforço de milhões de usuários que usam o reCAPTCHA diariamente em um monte de atividades corriqueiras na rede, são 200 milhões de palavras decifradas por dia – se cada usuário levar 10 segundos por palavra, o Google então se beneficia de 150 mil horas diárias de trabalho gratuito. Nada mal pra um monte de gente que precisa provar que não é um robô.




















23 anos, jornalista, curiosa dos mistérios do mundo, odeia inveja e falsidade. 





