Bien quizás. El aprendizaje automático es poderoso y se puede usar como una herramienta predictiva en casos seleccionados. Pero existen muchos malentendidos y lecciones que aprender antes de comenzar por este aparentemente mágico camino de aprendizaje automático.

Al igual que con cualquier herramienta o técnica nueva, las expectativas del valor y la precisión se vuelven locas, a menos que se expliquen. Hemos implementado ML varias veces, utilizando varias herramientas diferentes, a menudo con resultados prometedores, pero siempre complicados por malentendidos y nociones preconcebidas que desafían los intentos de fomentar el consenso.

Las herramientas y técnicas de aprendizaje automático (ML) tienen muchos usos posibles, incluida la detección de patrones que probablemente se repetirán. Este es un concepto poderoso, basado en métodos estadísticos que refuerzan su relevancia, y existen numerosos usos comerciales prácticos. Los lanzamientos recientes de herramientas basadas en la nube hacen que el aprendizaje automático sea aún más accesible.

Exploremos algunos conceptos erróneos que hemos observado en el último año.

ML es magia que pocos entienden.

En la superficie, muchos imaginarán que ML es una utilidad mágica, que utiliza alguna forma moderna de polvo de duendes para procesar grandes volúmenes de datos utilizando métodos que solo Ph.D. los científicos podrían entender. Al final, pueden predecir eventos futuros. No es verdad. Para ser justos, nosotros (la comunidad de TI) no hemos hecho todo lo posible para disipar el mito, quizás aferrándonos a la noción romántica de que finalmente encontraremos una manera de complacer en exceso a nuestros líderes empresariales. En cambio, si decidimos invertir en ML, necesitamos explicar los conceptos, la entrada, las limitaciones y el valor esperado. Como ocurre con muchos elementos de TI, nuestro éxito se medirá, en parte, por las expectativas que establezcamos.

ML es preciso, la primera vez, siempre.

Este es otro sabor de expectativas desalineadas. Los programas de aprendizaje automático suelen ser iterativos: crecen con el tiempo a través de una investigación constante y una mejora incremental. Hemos sido parte de varios proyectos de prueba de concepto donde la definición de éxito era la precisión de las predicciones precisas. A medida que todos exploramos el aprendizaje automático, debemos reforzar que el valor a largo plazo vendrá de un compromiso organizacional con el aprendizaje continuo, al igual que los programas de análisis exitosos. La recuperación será enorme una vez que todos los ejecutivos alineen su pensamiento: el aprendizaje automático comienza con la investigación y crece a través de la iteración.

ML es un algoritmo

Muchos imaginan que ML es una utilidad de procesamiento de transacciones, una versión algorítmica de una enorme hoja de cálculo, en la que se ingresan datos y se brindan respuestas directas. Esto lleva a la conclusión incorrecta de que los eventos individuales se pueden “bombear” a un sistema de AA y se proporcionan recomendaciones específicas para mejorar. De hecho, el AA suele ser más preciso y valioso en un entorno empresarial, cuando los datos se analizan de forma agregada en lugar de específica. Por ejemplo, es difícil predecir si una llamada en particular a su centro de llamadas resultará en cancelación. Pero predecir qué campaña de marketing será efectiva para un grupo demográfico seleccionado puede ser muy poderoso. Al lanzar su programa de aprendizaje automático, busque definir los casos de uso en su organización que sean más prácticos y sea claro sobre aquellos que no son adecuados.

Organice todo antes de comenzar.

Este es un principio clásico del desarrollo en cascada: se necesita un análisis profundo y una documentación cuidadosa antes de invertir en tecnología. En este caso, mala idea. Como se mencionó anteriormente, ML se realiza mejor de forma iterativa. Pero, por otro lado, la calidad (y estructura) de los datos es muy importante. Seguramente, “basura en basura fuera” se aplica aquí, particularmente con una caja negra tan mágica como ML. Es cierto, pero puede empezar en paralelo. Tomemos un ejemplo: imagine que está tratando de correlacionar la ubicación del producto con el aumento de las ventas. Parece un buen caso de uso, con muchos datos disponibles. Pero, en este caso, sería mejor tener un año completo de datos, para múltiples productos, para múltiples ubicaciones, para permitir la estacionalidad. Y los datos de ventas y las ubicaciones de las tiendas deben ser precisos. Podría trabajar durante seis meses para organizar y depurar todas las aportaciones, o podría empezar a mejorar la calidad y la amplitud en paralelo. Tome un subconjunto de datos, limpie manualmente si es necesario, e intente correlacionar los factores. Demuestre el potencial. Se obtendrán pequeños conocimientos y podrá dirigir la siguiente iteración. Prácticamente a todas las empresas les encantaría tener datos de alta precisión en su almacén de datos, pero pocas lo hacen. Piense en un “producto mínimamente viable”. Un POC simple (correctamente explicado) puede ayudar mucho a generar confianza y despertar la imaginación sobre posibles aplicaciones.