Hoy en día, ninguna empresa competitiva puede prescindir ya del análisis de datos. Estamos en el mundo del Big Data, de la acumulación de ingentes cantidades de datos, donde cada minuto esta cantidad sigue en aumento. En este mundo, las máquinas son las únicas capaces de procesar todos estos datos a la velocidad suficiente como para que los resultados sean de utilidad.  ¿Qué pasaría si las máquinas pudiesen analizar y aprender de los datos que procesan?

Podrían detectar patrones que nos dijesen qué día de la semana es mejor sacar una oferta, qué tipo de usuarios son más propensos a comprar según qué producto, predecir cuál será la evolución de las ventas de una empresa en los próximos tres meses y un sinfín de posibilidades más.

El machine learning o aprendizaje automático consiste en hacer realidad estas ideas. Este aprendizaje dota a las máquinas de los algoritmos necesarios para que sean capaces de aprender a partir del análisis de grandes cantidades de datos. En los últimos años, está habiendo grandes innovaciones en este campo, gracias al fuerte avance de las tecnologías cloud, promoviendo un entorno de fácil acceso a sistemas de computación y almacenamiento distribuidos y escalables. Y para conocer estos avances lo mejor es participar en los eventos que su comunidad organiza.

Este miércoles tuvo lugar el VI Machine Learning Spain Meetup en el Centro de Innovación de BBVA organizado por el grupo Machine Learning Spain.

La primera charla Introducción al Deep Learning vino de la mano del investigador Enrique Pelayo Campillo, evaluador del CDTI y profesor de la Universidad Carlos III de Madrid. Mostró lo mucho que se estaba moviendo su campo de investigación con el proyecto ImageNet, consistente en un conjunto de 14 millones de imágenes etiquetadas por personas. Este banco de imágenes público es un recurso muy útil y ha servido como base para proponer algoritmos que detecten objetos en imágenes. En el año 2012 los mejores algoritmos llegaban a tener un 26% de error en la clasificación de imágenes. En ese año, el investigador Alex Krizhevsky, lo bajó a 16% y fue fichado por Google. En 2014 los algoritmos propuestos ya iban por tan sólo un 6% de error.

También recorrió la evolución de las redes neuronales como instrumento de un aprendizaje automático cada vez más avanzado, desde el perceptron simple y multicapa, autoencoders, K-mean, hasta las redes neuronales convolucionales que han desembocado en el conocido como deep learning. Las aplicaciones de estas técnicas van desde el reconocimiento de voz, de imágenes, de caligrafía hasta el del lenguaje natural.

Después, en Kaggle: nuestra experiencia, se presentó la experiencia de un grupo de cuatro recién llegados pero apasionados del machine learning. Nos hablaron de plataformas donde las empresas proponen problemas reales a científicos de datos para su resolución en forma de competición. Ellos, sin apenas experiencia, se presentaron a la competición AXA driver telematics sobre la plataforma de científicos de datos Kaggle. La competición partía de los datos de posición de centenares de viajes de cada uno de los miles de usuarios que usan la aplicación móvil de la compañía. El  objetivo era detectar qué viajes no había hecho realmente el usuario y, por tanto, habría prestado el coche a otro conductor. Los algoritmos propuestos por este grupo dieron muy buenos resultados en la detección de estos patrones y quedaron en la clasificación final en un muy honroso percentil 15. Nos pareció destacable que su única formación previa sobre la temática fue el curso Data Science Specialization de Coursera.

Después de asistir al evento y ver lo dinámico que se está mostrando el campo del machine learning se hacen patentes las grandes posibilidades que tienen las aplicaciones del futuro. Desde Hi-Impact nos reiteramos, como empresa tecnológica, en la importancia de mantenerse cercano a las comunidades de investigadores y desarrolladores y seguir con atención los avances en los distintos campos. Todo esto te asegura la capacidad de adoptar siempre la tecnología más oportuna en cada uno de los proyectos que emprendas. Y, lo que es más importante, siempre innovando.

Diego Moreno – Software R&D Manager