Cuando se habla tanto de una tecnología como el aprendizaje automático, abundan los malentendidos y los conceptos erróneos. Aquí les damos una visión de lo que puede y no puede ofrecer.
El aprendizaje automático está resultando tan útil que es tentador suponer que puede resolver todos los problemas y se aplica a todas las situaciones. Al igual que cualquier otra herramienta, el aprendizaje automático es útil en áreas específicas, especialmente para problemas que siempre ha tenido, pero sabía que nunca podría contratar a suficientes personas para abordar, o para problemas con un objetivo claro pero sin un método obvio para lograrlo.
Aun así, es probable que todas las organizaciones aprovechen el aprendizaje automático de una manera u otra, ya que el 42% de los ejecutivos le dijeron recientemente a Accenture que esperan que AI esté detrás de todas sus nuevas innovaciones para 2021. Pero obtendrá mejores resultados si mira más allá la exageración y evitar estos mitos comunes al comprender lo que el aprendizaje automático puede y no puede ofrecer.
El aprendizaje automático y la inteligencia artificial se usan frecuentemente como sinónimos, pero si bien el aprendizaje automático es la técnica más exitosamente lograda en los laboratorios de investigación en el mundo real, AI es un campo amplio que abarca áreas como visión artificial, robótica y procesamiento del lenguaje natural. , así como enfoques tales como la satisfacción de restricciones que no involucran el aprendizaje automático.
Necesita datos para el aprendizaje automático, pero no todos los datos son útiles para el aprendizaje automático. Para entrenar su sistema, necesita datos representativos que cubran los patrones y resultados que su sistema de aprendizaje automático deberá manejar. Necesita datos que no tengan patrones irrelevantes incluidos. Todos los datos que utiliza para la capacitación deben estar bien etiquetados y etiquetados con las características que coinciden con las preguntas que le hará al sistema de aprendizaje automático, lo cual requiere mucho trabajo.
No suponga que los datos que ya tiene son limpios, claros, representativos o fáciles de etiquetar.
Los principales avances realizados recientemente en reconocimiento de imágenes, comprensión de lectura de máquina, traducción de idiomas y otras áreas han sucedido gracias a mejores herramientas, hardware informático como GPU que pueden procesar grandes cantidades de datos en paralelo y grandes conjuntos de datos etiquetados, incluyendo ImageNet y el Stanford Question Answering Dataset. Pero gracias a un truco llamado aprendizaje por transferencia, no siempre se necesita un gran conjunto de datos para obtener buenos resultados en un área específica; en su lugar, puede enseñarle a un sistema de aprendizaje automático cómo aprender utilizando un gran conjunto de datos y luego hacer que transfiera esa capacidad para aprender a su propio conjunto de datos de entrenamiento mucho más pequeño.
Hay muchas herramientas y marcos de código abierto para el aprendizaje automático e innumerables cursos que le muestran cómo usarlos. Pero el aprendizaje automático sigue siendo una técnica especializada; necesita saber cómo preparar datos y particionarlos para entrenamiento y pruebas, necesita saber cómo elegir el mejor algoritmo y qué heurística usar con él, y cómo convertirlo en un sistema confiable en producción. También necesita monitorizar el sistema para asegurarse de que los resultados sigan siendo relevantes a lo largo del tiempo.
Los modelos de “caja negra” son eficientes pero no dejan en claro qué patrón han aprendido. Los algoritmos más transparentes e inteligibles, como los Modelos Aditivos Generalizados, aclaran lo que el modelo ha aprendido para que pueda decidir si es útil implementarlos.
Prácticamente todos los sistemas de aprendizaje automático en uso en la actualidad usan aprendizaje supervisado; en la mayoría de los casos, están entrenados en conjuntos de datos claramente etiquetados que los humanos han estado involucrados en la preparación. La conservación de estos conjuntos de datos requiere tiempo y esfuerzo, por lo que hay mucho interés en las formas de aprendizaje no supervisadas, especialmente el aprendizaje reforzado (RL), donde un agente aprende por ensayo y error interactuando con su entorno y recibiendo recompensas por el comportamiento correcto.
Debido a que el aprendizaje automático aprende de los datos, replicará cualquier sesgo en el conjunto de datos. Un sistema de aprendizaje automático también puede agregar un sesgo a otro. Entrenar un sistema de aprendizaje automático con marcos populares para representar palabras como vectores que muestran las relaciones entre ellos y aprenderá estereotipos.
Es importante conocer los problemas de sesgo en el aprendizaje automático. Si no puede eliminar el sesgo en su conjunto de datos de entrenamiento, use técnicas como regularizar las asociaciones de género entre pares de palabras para reducir el sesgo o agregar elementos no relacionados a las recomendaciones para evitar el ‘filtro burbuja’.
El aprendizaje automático potencia las herramientas antivirus, observa el comportamiento de los nuevos ataques para encontrarlos tan pronto como se lanzan. Pero igualmente, los piratas informáticos están utilizando el aprendizaje automático para probar las defensas de las herramientas antivirus, así como para crear ataques de phishing a escala, mediante el análisis de grandes cantidades de datos públicos o analizando cuán exitosos fueron los intentos previos de phishing.
Es común preocuparse de que la inteligencia artificial le quite empleos y ciertamente cambiará los trabajos que hacemos y cómo los hacemos; los sistemas de aprendizaje automático mejoran la eficiencia y el cumplimiento y reducen los costos. A la larga, creará nuevos roles en el negocio y hará que algunas posiciones actuales se vuelvan obsoletas. Pero muchas de las tareas que automatiza el aprendizaje automático simplemente no eran posibles antes, debido a la complejidad o escala; no podría contratar suficientes personas para mirar cada fotografía publicada en las redes sociales para ver si presenta su marca, por ejemplo.
Lo que el aprendizaje automático ya ha comenzado es crear nuevas oportunidades comerciales, al igual que con las generaciones anteriores de automatización, el aprendizaje automático puede liberar empleados para utilizar su experiencia y creatividad.
Vía: CIO