Google actualiza Bard Chatbot con IA ‘Gemini’ mientras persigue ChatGPT
Durante más de un año, Google se ha apresurado a desarrollar una tecnología que pudiera igualar a ChatGPT, el revelador chatbot ofrecido por OpenAI, una nueva empresa de inteligencia artificial de San Francisco.
El miércoles, el gigante tecnológico dio un paso más en la carrera en curso al lanzar una nueva versión de su propio chatbot, Google Bard. Disponible para angloparlantes en más de 170 territorios y países, incluido Estados Unidos, a partir de ahora, el bot actualizado está respaldado por una nueva tecnología de inteligencia artificial llamada Gemini, que la compañía ha estado desarrollando desde principios de año.
«Este es el comienzo de la era Géminis», dijo en una entrevista Sundar Pichai, director ejecutivo de Google. «Es la realización de la visión que teníamos cuando creamos Google DeepMind», el laboratorio de inteligencia artificial de la empresa. Dijo que Google implementaría tres versiones diferentes de la tecnología en una amplia gama de productos y servicios en los próximos meses.
Pichai y Demis Hassabis, que supervisa Google DeepMind, dijeron que Gemini era más poderoso que las tecnologías anteriores de chatbot de Google y que podía generar respuestas más precisas y acercarse más a imitar el razonamiento humano en algunas situaciones.
«Estamos muy contentos con el desempeño de Gemini», dijo el Dr. Hassabis.
Cuando OpenAI cautivó al mundo con el chatbot de IA ChatGPT a fines del año pasado, Google fue tomado por sorpresa. El gigante tecnológico había pasado años desarrollando tecnología similar, pero al igual que otros gigantes tecnológicos, sobre todo Meta, se mostraba reacio a lanzar una tecnología que pudiera generar información sesgada, falsa o tóxica.
En marzo, Google lanzó su propio chatbot, Bard, con críticas mediocres. Un mes después, la compañía anunció que había combinado sus dos laboratorios de inteligencia artificial (Google Brain y DeepMind), reuniendo a más de 2.000 investigadores e ingenieros. Y en mayo, en su conferencia insignia Google I/O, anunció que el nuevo laboratorio Google DeepMind había comenzado a desarrollar Gemini.
Después de fundar Brain Lab en 2011, Google adquirió DeepMind en 2014, pagando 650 millones de dólares por la startup de IA de Londres. DeepMind operó en gran medida independientemente del Brain Lab y del resto de Google durante una década e incluso intentó separarse de la compañía en 2017. Pero mientras Google luchaba por alcanzar a OpenAI, Pichai combinó los dos laboratorios bajo la dirección del Dr. Hassabis. un neurocientífico que cofundó DeepMind.
Google publicó resultados de pruebas comparativas que afirmaban que la versión más poderosa de Gemini superó a la última tecnología de OpenAI, GPT-4, en varias áreas clave. Es mejor generando código informático que las tecnologías anteriores de Google, afirmó Pichai, y puede resumir con mayor precisión artículos de noticias y otros documentos de texto.
Gemini también fue diseñado para analizar imágenes y sonidos, pero esas habilidades no se incorporarán al chatbot Bard hasta una fecha posterior.
Google ha creado tres versiones de Gemini con tres conjuntos diferentes de habilidades. El más grande, Ultra, está diseñado para abordar tareas complejas y debutará el próximo año. Pro, la oferta de nivel medio, se implementará en numerosos servicios de Google a partir del miércoles con el chatbot Bard. Nano, la versión más pequeña, potenciará algunas funciones del teléfono inteligente Pixel 8 Pro, como resumir grabaciones de audio y ofrecer respuestas de texto sugeridas en WhatsApp a partir del miércoles.
Gemini es lo que los científicos llaman un modelo de lenguaje grande, o LLM, un sistema matemático complejo que puede aprender habilidades analizando grandes cantidades de datos, incluidos libros digitales, artículos de Wikipedia y tableros de anuncios en línea. Al identificar patrones en todo ese texto, un LLM aprende a generar texto por sí solo. Eso significa que puede escribir trabajos finales, generar códigos informáticos e incluso mantener una conversación.
Con Gemini, Google también ha entrenado la tecnología en imágenes y sonidos digitales. Es lo que los investigadores llaman un sistema «multimodal», lo que significa que puede analizar y responder tanto a imágenes como a sonidos. Si le planteas un problema de matemáticas que incluya líneas, formas y otras imágenes, por ejemplo, puede responder de forma muy parecida a como lo haría un estudiante de secundaria.
Esa parte de la tecnología, sin embargo, no estará disponible para los consumidores hasta el próximo año. Google también reconoció que, al igual que sistemas similares, Gemini es propenso a cometer errores. Puede equivocarse en los hechos o incluso “alucinar”: inventar cosas.
Google Cloud, que ofrece inteligencia artificial y servicios informáticos a otras empresas, ha estado ansioso por ofrecer Gemini a sus clientes mientras compite por acuerdos con OpenAI y Microsoft. Después de que OpenAI expulsara brevemente a Sam Altman, su director ejecutivo, el mes pasado, dejando a la empresa en el limbo, Google Cloud creó un plan de migración en un intento de llegar a los clientes de su rival.
Los clientes podrían pagar a Google el mismo precio que su tarifa actual de OpenAI y obtener créditos o descuentos en la nube.
Google dijo que los clientes de la nube tendrían acceso a Gemini Pro (la oferta de nivel medio) el 13 de diciembre. Pichai dijo que algunos externos estaban ahora probando Gemini Ultra (la versión más poderosa de la tecnología).
Aunque Google ha pasado el último año compitiendo para recuperar el liderazgo en IA de manos de OpenAI, Pichai dijo que había suficiente espacio en el mercado para todos los proveedores de IA.
«Está muy lejos de ser un juego de suma cero», dijo Pichai. “Tenemos una sensación de entusiasmo por lo que estamos lanzando. «También nos damos cuenta de que estamos en los primeros días porque podemos ver el progreso que estamos logrando».