Home > Marketing Digital > ¿Qué es el aprendizaje automático y cómo funciona?

¿Qué es el aprendizaje automático y cómo funciona?

aprendizaje automático

El aprendizaje automático se considera el área más prometedora y compleja de la IA. ¿Quién inventó el aprendizaje automático, qué significa y cómo se diseñan los algoritmos de aprendizaje? Respondemos las preguntas más populares.

¿Qué es el aprendizaje automático?

Aún no existe una definición única para el aprendizaje automático. Pero la mayoría de los investigadores lo formulan así:

El aprendizaje automático es la ciencia que hace que la IA aprenda y actúe como un ser humano, y que mejore continuamente su aprendizaje y sus habilidades en función de los datos del mundo real que proporcionamos.
Así es como los representantes de las principales empresas de TI y centros de investigación definen el aprendizaje automático:

Nvidia: «Es la práctica de utilizar algoritmos para analizar datos, estudiarlos y luego determinar o predecir algo».

Universidad de Stanford: “Es la ciencia de hacer que las computadoras funcionen sin programación explícita”.

McKinsey & Co: «El aprendizaje automático se basa en algoritmos que pueden aprender de los datos sin depender de una programación basada en reglas».

Universidad de Washington: «Los algoritmos de aprendizaje automático pueden descubrir cómo realizar ellos mismos tareas importantes generalizando a partir de los ejemplos que tienen».

Universidad Carnegie Mellon: «El campo del aprendizaje automático está tratando de responder a la pregunta: ‘¿Cómo podemos crear sistemas informáticos que mejoren automáticamente con la experiencia y cuáles son las leyes fundamentales que gobiernan todos los procesos de aprendizaje?’

Historia del aprendizaje automático

Dmitry Vetrov, profesor investigador y director del Centro de Aprendizaje Profundo y Métodos Bayesianos de la Facultad de Informática de HSE, señala que inicialmente los ordenadores se utilizaban para problemas cuyo algoritmo de solución era conocido por el hombre. Y sólo en los últimos años se ha comprendido que se puede encontrar una manera de resolver problemas para los que no existe un algoritmo de solución o el hombre no lo conoce. Así surgió la inteligencia artificial en sentido amplio y las tecnologías de aprendizaje automático en particular.

El primer prototipo de computadora con IA apareció en 1946 como parte de ENIAC , un proyecto ultrasecreto del ejército estadounidense. Podría utilizarse para informática electrónica y muchas otras tareas.

En 1950 apareció el test de Alan Turing para evaluar la inteligencia de una computadora. Con su ayuda, el científico propuso determinar si una computadora es capaz de pensar como una persona

En 1958, el neurofisiólogo estadounidense Frank Rosenblatt inventó el Perceptrón  , la primera red neuronal artificial, así como el primer neuroordenador, el Mark 1

En 1959, el investigador estadounidense de inteligencia artificial Marvin Minsky creó SNARC  , la primera computadora basada en redes neuronales

Ese mismo año, su colega Arthur Samuel inventó el primer programa de damas de autoaprendizaje. Primero acuñó el término «aprendizaje automático», describiéndolo como el proceso mediante el cual una máquina exhibe un comportamiento para el que no fue programada originalmente;

En 1967 se creó el primer algoritmo métrico para clasificación de datos, que permitió a la IA utilizar patrones para el reconocimiento y el aprendizaje;

En 1997, Deep Blue venció por primera vez al campeón mundial de ajedrez Garry Kasparov.

En 2006, el investigador de redes neuronales Geoffrey Hinton acuñó el término “aprendizaje profundo”

En 2011 se fundó Google Brain  , una división de Google que se ocupa de proyectos en el campo de la IA.

En 2012, dentro de otra división, Google X Lab, desarrollaron un algoritmo de red neuronal para reconocer gatos en fotografías y vídeos. Al mismo tiempo, Google lanzó el servicio en la nube Google Prediction API para aprendizaje automático, que analiza datos no estructurados;

En 2014, Facebook (desde el 21 de marzo de 2022 la red social está prohibida en Rusia por decisión judicial) desarrolló la red neuronal DeepFace para reconocer rostros en fotografías y vídeos. Su algoritmo funciona con un 97% de precisión;

En 2015, Amazon lanzó Amazon Machine Learning, una plataforma de aprendizaje automático, y unos meses después Microsoft lanzó una similar: Distributed Learning Machine Toolkit.

Cómo se relacionan el aprendizaje automático y profundo, la IA y las redes neuronales

  • El aprendizaje automático  es una rama de la inteligencia artificial (IA).
  • Las redes neuronales  son un tipo de aprendizaje automático.
  • El aprendizaje profundo  es un tipo de arquitectura de red neuronal.

El aprendizaje profundo también implica la investigación y el desarrollo de algoritmos para el aprendizaje automático. En particular, aprender a representar correctamente datos en varios niveles de abstracción. Durante los últimos diez años, los sistemas de aprendizaje profundo han logrado un éxito particular en áreas como la detección y el reconocimiento de objetos, la conversión de texto a voz y la recuperación de información.

¿Qué problemas resuelve el aprendizaje automático?

Con la ayuda del aprendizaje automático, la IA puede analizar datos, recordar información, hacer predicciones, reproducir modelos ya preparados y seleccionar la opción más adecuada entre las propuestas.

Estos sistemas son especialmente útiles cuando es necesario realizar grandes cantidades de cálculos: por ejemplo, puntuación bancaria (cálculo de la calificación crediticia), análisis en el campo de la investigación estadística y de marketing, planificación empresarial, investigación demográfica, inversiones, búsqueda de noticias falsas. y sitios fraudulentos.

Leroy Merlin utiliza Big Data y Machine Learning para encontrar mercancías restantes en los almacenes.

En marketing y comercio electrónico, el aprendizaje automático ayuda a configurar servicios y aplicaciones para hacer recomendaciones personalizadas.

El servicio de transmisión de Spotify utiliza el aprendizaje automático para crear selecciones personalizadas de pistas para cada usuario en función del tipo de música que escucha.

Hoy en día, la investigación clave se centra en el desarrollo de aprendizaje automático eficiente en datos, es decir, sistemas de aprendizaje profundo que puedan aprender de manera más eficiente, con el mismo rendimiento, en menos tiempo y con menos datos. Estos sistemas tienen demanda en la atención sanitaria personalizada, el entrenamiento de robots con refuerzo y el análisis de emociones.

El fabricante chino de aspiradoras inteligentes Ecovacs Robotics ha entrenado a sus aspiradoras para que reconozcan calcetines, cables y otros objetos extraños en el suelo mediante una variedad de fotografías y aprendizaje automático.

Una cámara «inteligente» basada en una microcomputadora Raspberry Pi 3B+, que utiliza el marco TensorFlow Light , ha aprendido a reconocer una sonrisa y tomar una foto exactamente en ese momento, así como a ejecutar comandos de voz.

En el ámbito de las inversiones, algoritmos basados ​​en aprendizaje automático analizan el mercado , monitorean las noticias y seleccionan los activos que son más rentables para comprar en este momento. Al mismo tiempo, con la ayuda del análisis predictivo, el sistema puede predecir cómo cambiará el valor de determinadas acciones durante un período específico y ajusta sus datos después de cada evento importante en la industria.

Según una investigación de BarclayHedge , más del 50% de los fondos de cobertura utilizan IA y aprendizaje automático para tomar decisiones de inversión, y dos tercios utilizan IA para generar ideas comerciales y optimizar carteras.

Por último, el aprendizaje automático está impulsando verdaderos avances en la ciencia.

En 2020, la red neuronal AlphaFold de DeepMind pudo descifrar el mecanismo de plegamiento de proteínas. Los biólogos llevan más de 50 años trabajando en este problema.

Cómo funciona el aprendizaje automático

Existe una gran cantidad de problemas similares en los que se conoce la condición y la respuesta correcta o una de las posibles respuestas. Por ejemplo, la traducción automática, donde la condición es una frase en un idioma y la respuesta correcta es su traducción a otro idioma.

Un modelo de aprendizaje automático, por ejemplo, una red neuronal profunda, funciona según el principio de una «caja negra» que toma una condición del problema como entrada y produce una respuesta arbitraria como salida. Por ejemplo, algún texto en un segundo idioma.

La caja negra tiene parámetros adicionales que afectan cómo se procesa la señal de entrada. El proceso de entrenamiento de una red neuronal consiste en buscar valores de parámetros con los que producirá una respuesta lo más cercana posible a la correcta. Cuando configuramos los parámetros según sea necesario, la red neuronal podrá resolver correctamente (o lo más cerca posible) otros problemas del mismo tipo, incluso si nunca supo las respuestas.

Para resolver problemas, las redes neuronales necesitan:

  • Datos: ejemplos de soluciones y todo lo que pueda ayudar en el proceso de aprendizaje: estadísticas, textos de ejemplo, cálculos, indicadores, acontecimientos históricos. Los datos se han recopilado durante años y se han combinado en enormes matrices: conjuntos de datos que tienen todas las corporaciones de TI. Un ejemplo de colección es un captcha que te pide que selecciones todas las fotos con autos y recuerda las respuestas correctas;
  • Signos: son propiedades o características. Esto es a lo que la máquina debe prestar atención en el proceso de aprendizaje. Por ejemplo, el precio de las acciones, la imagen de un animal, la frecuencia de las palabras o el género de una persona. Cuantas menos señales y más claramente estén designadas y diseñadas, más fácil será aprender. Sin embargo, para problemas complejos, los modelos modernos deben considerar decenas de millones de parámetros que determinan cómo los insumos se convierten en productos;
  • Los algoritmos: son una forma de resolver un problema. Puede haber muchos para una misma tarea, y es importante elegir el más preciso y eficaz.

Problemas de aprendizaje automático

Para entrenar eficazmente redes neuronales y cualquier algoritmo complejo, se necesitan grandes cantidades de datos y recursos técnicos: servidores, locales especiales para ellos, Internet de alta velocidad sin interrupciones y mucha electricidad. Se necesitan años de trabajo y millones de dólares para obtener los datos necesarios. Sólo una gran corporación de TI puede afrontar esos costes. No hay muchos conjuntos de datos abiertos; algunos se pueden comprar, pero son muy caros.

A medida que crece la capacidad de recopilar y procesar conjuntos de datos, también crecen las emisiones nocivas producidas por los centros de datos más grandes.

Los datos no sólo deben ser recogidos, sino también marcados para que la máquina pueda determinar con precisión dónde está cada objeto y cuáles son sus características. Esto se aplica a datos numéricos, textos, imágenes. Nuevamente, para hacer esto manualmente, se necesitan millones de inversiones.

Incluso si hay muchos datos y se actualizan periódicamente, durante el proceso de entrenamiento puede resultar que el algoritmo no funcione. El problema puede estar tanto en los datos como en el enfoque mismo: cuando la máquina resolvió exitosamente un problema con un dato, pero no es capaz de escalar la solución con nuevas condiciones.

A pesar de todos los avances en el aprendizaje profundo de las redes neuronales, la IA aún no puede crear algo completamente nuevo, ir más allá de las condiciones propuestas y superar las capacidades inherentes a ello. En otras palabras, todavía no es capaz de superar a los humanos.

Perspectivas del aprendizaje automático: ¿la IA empezará a pensar por nosotros?

La pregunta de si el aprendizaje automático hará que la IA sea más inteligente que los humanos inicialmente no es del todo correcta. El caso es que en la naturaleza no existe una jerarquía universal en términos de inteligencia. Por defecto, nos consideramos más inteligentes que otras criaturas, pero, por ejemplo, una ardilla es capaz de recordar la ubicación de miles de escondites de suministros, lo que está fuera del alcance incluso de una persona muy inteligente. Y en los pulpos, cada tentáculo es capaz de pensar y actuar de forma independiente.

Lo mismo ocurre con la IA: ya nos supera en todo lo relacionado con cálculos complejos, pero todavía no es capaz de plantearse nuevas tareas y resolverlas seleccionando los datos y las condiciones necesarias. En los últimos años se han realizado esfuerzos para superar esta limitación en el marco de una IA fuerte , pero hasta ahora sin éxito. La esperanza de resolver este problema proviene de las computadoras cuánticas , que van más allá de la computación convencional.

Pero en un futuro próximo podremos ampliar significativamente nuestras capacidades con la ayuda de la IA, transfiriéndole operaciones rutinarias y costosas, comunicando y controlando equipos mediante interfaces neuronales.