Google lanza Gems e Imagen 3, IA personalizada y nuevo generador de imágenes

Ambas funcionalidades fueron anunciadas en la última edición de Google I/O.

Imágenes generadas con Imagen 3

Google ha comenzado a desplegar en varios países e idiomas dos de las novedades presentadas en la última edición Google I/O: la personalización de su inteligencia artificial (IA) generativa Gemini a través de Gems y el nuevo modelo de generación de imágenes Imagen 3. 

Según ha explicado en el blog de la multinacional Dave Citron, senior director, product management Gemini Experiences de Google, en ciertos países y determinados idiomas, los suscriptores de Gemini Advanced, Business y Enterprise podrán comenzar a crear y chatear con sus propios Gems. 

Estos son, versiones personalizadas de Gemini que permiten al usuario convertirse en un experto en cualquier tema. “Es como si pudieras crear un equipo de expertos que te pueden ayudar a dar forma a un proyecto complejo, aportar ideas para un evento que estás preparando o escribir el pie de foto perfecto para una publicación en tus redes sociales”, asegura Citron. 

Para crearlos, basta con escribir una serie de instrucciones y asignarle un nombre, y gracias a la capacidad de recordar instrucciones detalladas de cada Gem, los usuarios podrán ahorrar tiempo en tareas repetitivas o complejas, indica. 

Para facilitar el proceso, desde Google han lanzado varios Gems adaptados a distintas temáticas, ya listos para ser usados. A saber: un tutor personal para desbrozar información compleja; uno de exploración de ideas; otro de orientación profesional que propone al usuario planes detallados para mejorar competencias del usuario y que avance en su carrera laboral; revisión de escritura y un asistente de programación que permite escribir código de programación. 

La función se ha desplegado en más de 150 países, pero todavía no está disponible en español. 

Imagen 3

Sí llegará en español Imagen 3, el nuevo modelo de generación de imágenes de Google que estará disponible en las aplicaciones de Gemini, incluida la versión gratuita. 

Según recuerdan desde la firma de Mountain View, Imagen 3 es capaz de generar imágenes a partir de instrucciones breves y en distintos estilos, como paisajes fotorrealistas, imágenes con textura de pintura al óleo o animaciones con plastilina. Incluye sistemas de protección y respeta los principios de diseño de productos de la compañía. 

“Imagen 3 ha obtenido resultados superiores a los otros modelos de generación de imágenes en una gran variedad de pruebas comparativas. Y utiliza SynthID, nuestra herramienta de inserción de marcas de agua en las imágenes generadas”, detalla Citron. 

De igual modo, desplegarán en los próximos días la generación de imágenes de personas, con una versión preliminar solo en inglés y para los usuarios de Gemini Advanced, Business y Enterprise. Esta función vendrá además con medidas: “No está permitido generar imágenes fotorrealistas de individuos identificables ni de menores, tampoco es posible obtener escenas excesivamente sangrientas, violentas o sexuales”, indican. 

Esta funcionalidad se irá implantando de manera gradual para alcanzar a más usuarios e idiomas.