Page 14

BOLETIN DE OBSERVACION TECNOLOGICA 51

Deep learning Autor: David García Dolla, Área de Planificación y Control, SDGPLATIN. Palabras clave: redes neuronales artificiales, big data, reconocimiento de imágenes, análisis de voz, GPU. Metas tecnológicas relacionadas: MT 2.5.1; MT 6.1.2; MT 6.1.3. Durante los últimos años se ha producido un enorme crecimiento de la capacidad para adquirir ingentes cantidades de datos procedentes de todo tipo de sensores distribuidos y de fuentes abiertas. Adicionalmente se han dado importantes pasos en la capacidad para gestionar todos esos datos y ponerlos a disposición de los usuarios en todo momento y lugar, proporcionándoles, entre otras, capacidades de búsqueda. No obstante, continúa existiendo un cuello de botella en el análisis e interpretación automática de esos datos, en especial, cuando se trata de imágenes o vídeos, lo cual supone un problema importante, dado la enorme dimensión de los datos disponibles. En general, la capacidad de los ordenadores para analizar e interpretar la información sensorial dista mucho de las de los humanos, en particular, si es necesario realizar tareas de reconocimiento, generalización o abstracción. La complejidad del análisis varía mucho según factores tales como el dominio de la aplicación, la finalidad del análisis, las En Profundidad condiciones y elementos presentes en la escena, el punto de vista, etc., lo que hace que las soluciones existentes sean válidas solamente para abordar problemas muy concretos. La solución de este tipo de problemas se aborda frecuentemente desde una de las disciplinas vinculadas a la inteligencia artificial. Se trata de las técnicas de aprendizaje automático, que persiguen el desarrollo de la capacidad de los ordenadores para aprender de los datos disponibles, siendo capaces de proponer soluciones ante nuevos datos, normalmente en problemas relacionados con su clasificación en categorías o con la predicción de valores numéricos asociados a alguna variable (problemas de regresión numérica). Si bien desde hace décadas se han venido produciendo notables avances con el desarrollo y utilización de nuevos algoritmos, muy pocos han captado el interés que desde hace unos pocos años están teniendo las denominadas técnicas de aprendizaje profundo (deep learning, en inglés). Las tecnologías de aprendizaje profundo son una mejora de las redes neuronales artificiales, que alcanzaron una gran popularidad en los años ochenta y noventa. El fundamento de las redes neuronales es el de recrear unas estructuras de procesamiento de datos similares a las del cerebro animal de forma que, ante un estímulo de entrada, un sistema de elementos muy sencillos (neuronas) interconectados entre sí, colaboran para producir un estímulo de salida. En principio, ninguna de las neuronas tiene asignada una tarea concreta. Más bien, las conexiones que las neuronas van creando y reforzando durante el proceso de aprendizaje permiten representar modelos matemáticos a través de la arquitectura de la red y los múltiples parámetros asociados a las conexiones. El resultado que se busca en la red es el de ser capaz de ir aprendiendo en base a la experiencia, construyendo representaciones de problemas altamente no lineales con capacidad para responder de forma correcta ante estímulos de entrada nunca antes recibidos. A lo largo de los años se han desarrollado múltiples topologías de redes neuronales. La arquitectura de las redes neuronales consiste en la organización y disposición de las neuronas formando capas más o menos alejadas de la entrada y salida de la red. Los parámetros fundamentales de la red son fundamentalmente el número de capas, el número de neuronas por capa, el grado de conectividad y el tipo de conexiones entre neuronas. No obstante, factores tales como la necesidad de disponer de una importante capacidad de procesamiento para entrenar las redes, la necesidad de ir ajustando la red para asegurar la convergencia en el aprendizaje y evitar problemas de excesivo ajuste de la red a los datos de entrena- Fig. 1. Ejemplo de una CNN. (Fuente: NVIDIA). 14 Boletín de Observación Tecnológica en Defensa n.º 51. Tercer trimestre 2016


BOLETIN DE OBSERVACION TECNOLOGICA 51
To see the actual publication please follow the link above