La inteligencia artificial ha disfrutado de un aumento meteórico en popularidad, desde la ciencia ficción hasta su uso en el mundo real en tan solo unos pocos años. Pero, ¿cómo funciona la IA detrás de las palabras de moda? En esta nota te explicamos qué diferencia a la IA generativa de otros tipos de IA.
En términos generales, la inteligencia artificial es el uso de modelos o algoritmos para resolver un problema de una manera que refleja cómo los seres inteligentes podrían resolverlo. Estos modelos y algoritmos luego se integran en aplicaciones de software para que los conocimientos que extraen sean fácilmente accesibles para los usuarios finales. Algunas implementaciones de inteligencia artificial, pero no todas, implican aprendizaje automático.
El aprendizaje automático es un subcampo de la inteligencia artificial que se ocupa de la construcción de modelos lógicos o matemáticos que puedan realizar razonamientos deductivos: sacar conclusiones generales a partir de los datos que ha visto el modelo.
De manera similar, algunas pero no todas las IA tienen un tipo especializado de estructura lógica llamada red neuronal, diseñada para parecerse al flujo de información en red entre las neuronas del cerebro. Algunas redes neuronales particularmente sofisticadas pueden realizar un aprendizaje profundo y algunas redes neuronales capaces de un aprendizaje profundo pueden usar lo que han aprendido para generar pasajes de texto, obras de arte e incluso video.
La capacidad relativamente reciente de las redes neuronales de aprendizaje profundo para crear este tipo de trabajos ha dado lugar a la categoría temática que utilizamos para esta clase de software: IA generativa.
Aprendizaje automático:
El aprendizaje automático, las redes neuronales y el aprendizaje profundo se han vuelto populares en los últimos años porque cada uno ofrece ventajas de rendimiento en escenarios específicos, especialmente en comparación con otros tipos anteriores de IA. Si bien otra IA podría realizar la misma tarea, cada tipo de IA tiene sus propias fortalezas y encaja en su propio nicho.
Una de esas fortalezas es la capacidad de aprender, a menudo en respuesta a patrones en los datos. Incluso una IA poderosa puede no estar diseñada con la capacidad de ajustar su propio modelo sobre la marcha. Por ejemplo, uno de los primeros y más famosos ejemplos de IA fue el mainframe IBM Deep Blue que hizo historia al derrotar a Gary Kasparov a finales de los años 1990.
La inteligencia artificial no implica necesariamente aprendizaje; Deep Blue no pudo ajustar su propio juego en función de su desempeño contra Gary Kasparov. En cambio, un equipo de expertos modificó la estrategia de la supercomputadora entre juegos.
La IA de aprendizaje automático a menudo requiere intervención humana en forma de desinfección, etiquetado y estructuración de datos, para guiar el entrenamiento de una IA a lo largo de un camino específico. Los modelos que necesitan este tipo de orientación realizan aprendizaje supervisado.
Sin embargo, algunos modelos están diseñados para realizar un aprendizaje no supervisado: discernir patrones en un conjunto de datos y luego informar lo que encuentran sin necesidad de intervención humana o etiquetado de datos. También existe el aprendizaje semisupervisado, que combina los dos enfoques.
Redes neuronales:
Así como el aprendizaje automático es sólo un método para implementar la IA, una red neuronal artificial (a menudo abreviada como «red neuronal») es un método para implementar el aprendizaje automático. Una red neuronal es una estructura de rendimiento informático diseñada para parecerse a las neuronas que forman el cerebro (normalmente el cerebro humano) y el sistema nervioso.
Las redes neuronales se pueden implementar en software, hardware o una combinación de ambos. ¿Por qué imitar el cerebro? Porque los cerebros pueden realizar una gran cantidad de tareas diversas en paralelo, dentro de una envolvente de energía más pequeña que la de un portátil promedio.
Las redes neuronales constan de un conjunto de entradas, al menos una capa oculta donde se procesa la entrada y luego una capa de salida.
Los nodos de la red suelen denominarse neuronas. A los efectos de este ejemplo, asumiremos que nuestra red neuronal se alimenta hacia adelante, lo que significa que solo envía información en una dirección: hacia la capa de salida. También existen redes neuronales más sofisticadas que pueden enviar información a capas anteriores mediante una técnica llamada retropropagación.
Aprendizaje profundo:
Las redes neuronales con más de una capa oculta pueden ser capaces de realizar un aprendizaje profundo, donde múltiples capas de procesamiento pueden permitir resultados de nivel progresivamente más alto.
El siguiente diagrama muestra un ejemplo de cómo puede verse una red neuronal de aprendizaje profundo. Los datos se mueven a través de esta red neuronal desde la capa de entrada en el extremo izquierdo (el extremo grande) hasta la capa de salida, una única neurona en el extremo derecho. Diferentes configuraciones de capas de entrada, ocultas y de salida darán como resultado diferentes topologías de red.
Las redes neuronales profundas utilizan conjuntos de datos más grandes y dependen de hardware de gama alta para entrenar modelos en un período de tiempo razonable.
Agregar más capas al modelo de IA subyacente permite que la máquina realice tareas más sofisticadas, como entrenarse con conjuntos de datos que no han sido analizados ni estructurados primero por humanos.
Los modelos de aprendizaje profundo pueden crear resultados más sofisticados que los métodos de aprendizaje automático más simples, pero también requieren más tiempo para entrenarse.
IA generativa:
El aprendizaje profundo se puede utilizar de muchas maneras diferentes, pero una aplicación estrella en ascenso del aprendizaje profundo es la llamada IA generativa. Un modelo de IA generativa es un modelo que puede tomar la entrada del usuario como un mensaje y generar nuevos resultados, posiblemente en un formato, estilo o tono completamente diferente al de la entrada inicial.
Actualmente se utilizan varios modelos de IA generativa, incluidos ChatGPT y GPT-4 (ambos desarrollados por OpenAI), Llama 2 (Facebook) y Prometheus (Microsoft).
Muchas de estas IA generativas funcionan con grandes modelos de lenguaje: modelos de aprendizaje profundo muy grandes que utilizan enormes conjuntos de datos, que se destacan por su capacidad para analizar entradas de lenguaje natural y datos de entrenamiento.
El objetivo colectivo de estos nuevos productos y servicios es crear bots y asistentes mucho más capaces que cualquier cosa que existiera anteriormente.
La IA generativa no se ha convertido en un tema candente en la tecnología únicamente porque las empresas tecnológicas estén buscando la próxima gran novedad. A pesar de la reciente popularidad de la IA, los principios conceptuales básicos de las redes neuronales y el aprendizaje profundo se resolvieron hace mucho tiempo.
Durante la última década, los costos de almacenamiento de datos, la eficiencia informática y el rendimiento bruto han mejorado hasta el punto de que el aprendizaje profundo y la IA generativa se volvieron prácticos para implementar a escala comercial.
Desde las GPU Radeon™ RX 7000 de alta gama hasta los motores de aceleración de IA integrados en CPU selectas de escritorio Ryzen™ Mobile 7040, Ryzen Mobile 8040 y Ryzen 8000, AMD es líder en este mercado incipiente.
La integración del procesamiento de inteligencia artificial en el chip, el soporte a través de instrucciones especializadas en la CPU y la construcción de procesadores gráficos que sobresalgan en estas cargas de trabajo son todos componentes de una iniciativa más amplia de Ryzen AI, con el objetivo de respaldar uno de los debuts tecnológicos más interesantes de la historia. últimos 40 años.
Si bien los objetivos específicos de cualquier fabricante de hardware o servicio de IA generativa varían, yo diría que gran parte del interés de la industria informática en el tema está impulsado por un entusiasmo genuino.
A lo largo de los siglos XX y XXI, los autores de ciencia ficción han imaginado computadoras y androides que podrían comprender y responder a las personas de manera mucho más hábil que las computadoras de sus propias épocas.
Es posible que el aprendizaje profundo y la IA generativa no cierren por sí solos la brecha entre la ciencia ficción y los hechos científicos, pero ofrecen una enorme mejora con respecto a los enfoques de IA anteriores. Ambos pueden resultar vitales en el esfuerzo actual por construir inteligencias artificiales que resuelvan problemas menos como las computadoras programadas convencionalmente y un poco más como nosotros.