Introducción
Lo primero que nos viene a la cabeza cuando oímos hablar de RPA y bots es: ¿cómo se las arregla para resolver los captchas?
Y esta pregunta la repiten a menudo los MSP que trabajan en la automatización.
Probablemente no haya una tecnología más polarizante que haya sido creada para hacer la vida menos estresante y las empresas más eficientes y que, sin embargo, tenga tanta gente dispuesta a boicotear sus beneficios.
Introducción
¿Qué es un captcha?
¿Por qué las empresas usan captchas?
Diferentes tipos de captchas
¿Cómo lidiar con los captchas?
Conclusión
¿Qué es un captcha?
Un captcha es una herramienta que ayuda a distinguir a un usuario humano de un bot de software en línea. La herramienta es un sistema de desafío-respuesta que pide a los usuarios finales que realicen alguna tarea que un bot de software no puede hacer. Si el usuario puede realizar la tarea correctamente, proporciona la autentificación al servicio de que el usuario es un ser humano y no un bot de spam y permite al usuario continuar.
Desgraciadamente, no hay forma de que los captchas identifiquen o distingan a los bots buenos de los maliciosos. Por ello, los buenos bots tendrán que lidiar con ellos durante mucho más tiempo.
Por si no lo sabe, la palabra captcha es un acrónimo de Completely Automated Public Turing test to tell Computers and Humans Apart’. Si desea comprender más sobre qué es una "prueba de Turing", aquí está la wiki para ese término.
¿Por qué las empresas usan captchas?
A menudo se recomienda el uso de captchas para proteger los sitios de actividades maliciosas realizadas por bots. Aquí hay seis ejemplos de razones para tener en cuenta:
- Proteger la integridad de las encuestas en línea impidiendo que los piratas informáticos utilicen robots para enviar respuestas falsas repetidas.
- Para detener los ataques de fuerza bruta en cuentas en línea en las que los piratas informáticos intentan iniciar sesión repetidamente con cientos de contraseñas diferentes.
- Para evitar que los piratas informáticos se registren en múltiples cuentas de correo electrónico que luego usarán con fines nefastos.
- Para acabar con los ciberdelincuentes que envían spam a blogs o páginas de contenido de noticias con comentarios dudosos y enlaces a otros sitios web.
- Para evitar que los revendedores de boletos usen robots para comprar boletos al por mayor para espectáculos y conciertos.
- Para que las compras en línea sean más seguras.
Diferentes tipos de captchas
El tipo más común de captcha es el captcha de texto, que requiere que el usuario vea letras distorsionadas o un texto distorsionado, que suele contener una cadena de caracteres alfanuméricos en una imagen, e introduzca los caracteres en un formulario adjunto.
Los captchas de texto están siendo sustituidos por captchas más sofisticados como reCaptchas y hCaptchas.
Los reCaptchas son gratuitos y los proporciona Google. Hay tres tipos de ellos:
- reCAPTCHA v2 con Checkbox de verificación
La versión clásica de reCAPTCHA, en la que el usuario debe seleccionar una casilla de verificación llamada "No soy un robot" para confirmar que es humano. En algunos casos, reCAPTCHA v2 con Checkbox también pedirá a los usuarios que respondan preguntas basadas en imágenes.
- reCAPTCHA v2 Invisible
Cuando se utiliza reCAPTCHA v2 Invisible, el usuario no verá un campo adicional en su formulario. En cambio, habrá una pequeña insignia en la esquina inferior derecha de la pantalla que enlaza con los términos de servicio y la política de privacidad de Google. reCAPTCHA v2 Invisible a veces les pide a los usuarios que respondan preguntas basadas en imágenes para asegurarse de que no sean spambots.
- reCAPTCHA v3
Al igual que reCAPTCHA v2 Invisible, reCAPTCHA v3 solo muestra una pequeña insignia en la esquina inferior derecha de la pantalla que vincula a los términos de servicio y la política de privacidad de Google.
Sin embargo, reCAPTCHA v3 nunca mostrará preguntas basadas en imágenes como la que se muestra arriba. En cambio, se ejecuta completamente en segundo plano.
Para evitar solicitar la interacción del usuario, Google monitoreará el comportamiento del usuario en su sitio para buscar lo que considera actividad sospechosa. Luego, reCAPTCHA asignará una puntuación al usuario. Se establece una puntuación mínima para que los usuarios envíen sus formularios.
Si el puntaje reCAPTCHA de un usuario no cumple con los requisitos, no podrá continuar con los siguientes pasos.
hCaptcha también es una alternativa gratuita de reCaptcha y es muy similar a reCaptcha V2, que ofrece un estilo de casilla de verificación CAPTCHA en el que los usuarios deben marcar una casilla con la etiqueta "Soy humano" para demostrar que son legítimos.
Según la actividad del usuario y su configuración de dificultad, hCaptcha a veces también puede pedirles a los usuarios que respondan preguntas basadas en imágenes para confirmar que no son spambots.
¿Cómo lidiar con los captchas?
Entonces, ahora que entendemos qué son los captchas y su importante papel para evitar que los piratas informáticos ataquen con bots, veamos cómo podemos resolverlos para permitir que los bots "buenos" hagan su trabajo.
Hay varias opciones y estrategias para resolver captchas. Discutiremos un par de ellos que creo que cubrirán la mayoría de los casos de captcha vistos en América Latina.
Para los captchas basados en texto, podemos usar un enfoque de OCR (reconocimiento óptico de caracteres) cuando son lo suficientemente simples. Esto no es perfecto, pero este método podría resolver el captcha en un par de intentos. Puede usar motores de OCR regulares como Google Cloud o Microsoft Cloud OCR o también puede usar el código Python con bibliotecas especialmente diseñadas que usan OCR y Machine Learning para reconocer el texto en la imagen.
Para los captchas que son más complejos, como reCaptcha y hCaptcha, la mejor manera es utilizar un servicio de resolución de captchas de terceros que sea capaz de resolver varios tipos de captchas.
En algunos casos, resolver captchas usando IA y Machine Learning es tan complejo y costoso que este tipo de servicio a menudo usa humanos para resolverlos. ¡Si, lo tienes bien! ¡¡¡Humanos trabajando para bots!!! Suena loco, pero es real.
Si tiene la suerte de ser socio de ElectroNeek y usar su plataforma, ElectroNeek proporciona una función Anti-Captcha que resolverá automáticamente reCaptcha v2 cuando aparezca en la web.
Para otros tipos de captchas, ElectroNeek proporciona todas las herramientas para implementar las diferentes opciones discutidas anteriormente, como la capacidad de usar múltiples motores de OCR, la capacidad de ejecutar código en Javascript o Python, así como la capacidad de consumir cualquier servicio a través de la integración API.
Conclusión
Los captchas están destinados a proteger los sitios web de la actividad maliciosa realizada por programas o bots. Existen diferentes tipos de captchas y están en constante evolución y volviéndose más sofisticados.
Podemos usar diferentes estrategias para resolver los captchas con la plataforma ElectroNeek usando la función Anti-Captcha nativa para reCaptcha V2, enfoque OCR, mediante ejecución de código o finalmente usando un servicio de terceros a través de API.