Cómo 2024 será el ‘salto adelante’ de la IA

en todavía eventos en san francisco En noviembre, se le preguntó a Sam Altman, director ejecutivo de la empresa de inteligencia artificial OpenAI, qué sorpresas traería este campo en 2024.

Los chatbots en línea como ChatGPT de OpenAI darán “un salto adelante que nadie esperaba”, respondió Altman de inmediato.

Sentado a su lado, James Manyika, un ejecutivo de Google, estuvo de acuerdo y dijo: “Uno más”.

Este año, la industria de la IA se definirá por una característica principal: una mejora notablemente rápida de la tecnología a medida que los avances se complementan entre sí, lo que permite a la IA generar nuevos tipos de medios, imitar el razonamiento humano de nuevas maneras y ver las cosas. mundo físico a través de una nueva generación de robots.

En los próximos meses, generadores de imágenes impulsados ​​por IA como DALL-E y Midjourney entregarán instantáneamente videos e imágenes fijas. Y poco a poco se irán fusionando con chatbots como ChatGPT.

Eso significa que los chatbots se expandirán mucho más allá del texto digital al manejar fotografías, videos, diagramas, tablas y otros medios. Exhibirán un comportamiento que se parece más al razonamiento humano y abordarán tareas cada vez más complejas en campos como las matemáticas y las ciencias. A medida que la tecnología avance hacia los robots, también ayudará a resolver problemas más allá del mundo digital.

Muchos de estos desarrollos ya han comenzado a surgir dentro de los principales laboratorios de investigación y en productos tecnológicos. Pero en 2024, el poder de estos productos aumentará significativamente y serán utilizados por mucha más gente.

«El rápido progreso de la IA continuará», afirmó David Luan, director ejecutivo de Adept, una nueva empresa de IA. «Es inevitable.»

OpenAI, Google y otras empresas tecnológicas están haciendo avanzar la IA mucho más rápidamente que otras tecnologías debido a la forma en que se construyen los sistemas subyacentes.

La mayoría de las aplicaciones de software las crean ingenieros, una línea de código informático a la vez, lo que suele ser un proceso lento y tedioso. Las empresas están mejorando la IA más rápidamente porque la tecnología se basa en redes neuronales, sistemas matemáticos que pueden aprender habilidades analizando datos digitales. Al identificar patrones en datos como artículos de Wikipedia, libros y textos digitales obtenidos de Internet, una red neuronal puede aprender a generar texto por sí misma.

Este año, las empresas de tecnología planean proporcionar a los sistemas de inteligencia artificial más datos (incluidas imágenes, sonidos y más texto) de los que la gente puede entender. A medida que estos sistemas aprendan las relaciones entre estos diversos tipos de datos, aprenderán a resolver problemas cada vez más complejos, preparándolos para la vida en el mundo físico.

(El New York Times demandó a OpenAI y Microsoft el mes pasado por infracción de derechos de autor de contenido de noticias relacionado con sistemas de inteligencia artificial).

Nada de esto significa que la IA podrá igualar al cerebro humano en el corto plazo. Si bien las empresas de IA pretenden crear lo que llaman “inteligencia general artificial” (una máquina que puede hacer cualquier cosa que el cerebro humano pueda hacer), esto sigue siendo una tarea desalentadora. A pesar de sus rápidos avances, la IA aún se encuentra en sus primeras etapas.

Aquí hay una guía de cómo cambiará la IA este año, comenzando con los avances a corto plazo, que conducirán a mayores avances en sus capacidades.

Hasta ahora, las aplicaciones impulsadas por IA generaban principalmente texto e imágenes fijas en respuesta a indicaciones. DALL-E, por ejemplo, puede crear imágenes fotorrealistas en cuestión de segundos a partir de solicitudes como «un rinoceronte que se lanza desde el puente Golden Gate».

Pero este año, es probable que empresas como OpenAI, Google, Meta y Runway, con sede en Nueva York, implementen generadores de imágenes que permitan a las personas generar videos también. Estas empresas ya han creado prototipos de herramientas que pueden crear videos instantáneamente a partir de mensajes de texto breves.

Es probable que las empresas de tecnología incorporen los poderes de los generadores de imágenes y videos a los chatbots, haciéndolos más poderosos.

Los chatbots y los generadores de imágenes, originalmente desarrollados como herramientas independientes, se están fusionando gradualmente. Cuando OpenAI presentó una nueva versión de ChatGPT el año pasado, el chatbot podía generar imágenes además de texto.

Las empresas de IA están construyendo sistemas «multimodales», lo que significa que la IA puede manejar múltiples tipos de medios. Estos sistemas aprenden habilidades analizando fotografías, textos y potencialmente otros tipos de medios, incluidos diagramas, cuadros, sonidos y videos, para luego poder producir sus propios textos, imágenes y sonidos.

Eso no es todo. Debido a que los sistemas también aprenden las relaciones entre diferentes tipos de medios, podrán comprender un tipo de medio y responder con otro. En otras palabras, alguien puede introducir una imagen en el chatbot y este responderá con texto.

«La tecnología se volverá más inteligente y más útil», afirmó Ahmad Al-Dahle, que dirige el grupo de IA generativa en Meta. «Hará más cosas».

Los chatbots multimodales harán las cosas mal, del mismo modo que los chatbots de sólo texto cometen errores. Las empresas de tecnología están trabajando para reducir los errores mientras se esfuerzan por crear chatbots que puedan razonar como un humano.

Cuando Altman habla de que la IA está dando un salto adelante, se refiere a los chatbots que son mejores en «razonamiento» para que puedan asumir tareas más complejas, como resolver problemas matemáticos complicados y generar programas informáticos detallados.

El objetivo es construir sistemas que puedan resolver un problema de forma cuidadosa y lógica a través de una serie de pasos discretos, cada uno de los cuales se basa en el siguiente. Así razonan los humanos, al menos en algunos casos.

Los principales científicos no están de acuerdo sobre si los chatbots realmente pueden razonar así. Algunos argumentan que estos sistemas simplemente parecen razonar mientras repiten comportamientos que han visto en los datos de Internet. Pero OpenAI y otros están construyendo sistemas que pueden responder de manera más confiable preguntas complejas que involucran materias como matemáticas, programación de computadoras, física y otras ciencias.

«A medida que los sistemas se vuelvan más confiables, se volverán más populares», dijo Nick Frosst, un ex investigador de Google que ayuda a dirigir Cohere, una nueva empresa de inteligencia artificial.

Si los chatbots son mejores para razonar, pueden convertirse en “agentes de IA”.

A medida que las empresas enseñan a los sistemas de inteligencia artificial cómo resolver problemas complejos paso a paso, también pueden mejorar la capacidad de los chatbots para utilizar aplicaciones de software y sitios web en su nombre.

Básicamente, los investigadores están transformando los chatbots en un nuevo tipo de sistema autónomo llamado agente de inteligencia artificial. Eso significa que los chatbots pueden usar aplicaciones de software, sitios web y otras herramientas en línea, incluidas hojas de cálculo, calendarios en línea y sitios de viajes. La gente podría entonces transferir el tedioso trabajo de oficina a los chatbots. Pero estos agentes también podrían eliminar puestos de trabajo por completo.

Los chatbots ya operan como agentes en pequeñas formas. Pueden programar reuniones, editar archivos, analizar datos y crear gráficos de barras. Pero estas herramientas no siempre funcionan tan bien como deberían. Los agentes se descomponen por completo cuando se aplican a tareas más complejas.

Este año, las empresas de inteligencia artificial están preparadas para presentar agentes que sean más confiables. «Debería poder delegar cualquier trabajo informático tedioso y cotidiano a un agente», dijo Luan.

Esto podría incluir realizar un seguimiento de los gastos en una aplicación como QuickBooks o registrar los días de vacaciones en una aplicación como Workday. A largo plazo, irá más allá del software y los servicios de Internet y se adentrará en el mundo de la robótica.

En el pasado, los robots estaban programados para realizar la misma tarea una y otra vez, como recoger cajas que siempre tenían el mismo tamaño y forma. Pero utilizando el mismo tipo de tecnología que sustenta a los chatbots, los investigadores están dando a los robots el poder de manejar tareas más complejas, incluidas aquellas que nunca antes habían visto.

Así como los chatbots pueden aprender a predecir la siguiente palabra de una oración analizando grandes cantidades de texto digital, un robot puede aprender a predecir lo que sucederá en el mundo físico analizando innumerables videos de objetos que son empujados, levantados y movidos.

“Estas tecnologías pueden absorber enormes cantidades de datos. Y a medida que absorben datos, pueden aprender cómo funciona el mundo, cómo funciona la física, cómo se interactúa con los objetos”, dijo Peter Chen, ex investigador de OpenAI que dirige Covariant, una nueva empresa de robótica.

Este año, la IA potenciará a los robots que operan detrás de escena, como brazos mecánicos que doblan camisas en una lavandería o clasifican montones de cosas dentro de un almacén. Titanes tecnológicos como Elon Musk también están trabajando para moverse Robots humanoides en los hogares de las personas..