May. 15, 2024 at 7:30 am

Durante Google I/O se anuncian mejoras para Gemini

Google realizó una nueva edición de su evento anual Google I/O en el que anunció nuevos productos y servicios impulsados por Inteligencia Artificial (IA). Desde la expansión del modelo de lenguaje Gemini a nuevas fronteras y nuevas experiencias de búsqueda o la integración de Gemini en Workspace para facilitar la creación de respuestas inteligentes, resúmenes; y mucho más.

Google está plenamente en la era Gemini. Durante la conferencia, Sundar Pichai, CEO de Google y Alphabet, afirmó que el objetivo de Google es que todas las personas se beneficien de los avances de Gemini. Además, hizo hincapié en los esfuerzos de la compañía: “llevamos más de una década priorizando la Inteligencia Artificial e invirtiendo en todas las capas del proceso: investigación, producto e infraestructura. Creemos que es una herramienta que tiene muchos desafíos por delante. Por eso, todos nuestros anuncios representan lo que bautizamos como un “I/O” para una nueva generación”. En este blogpost en Esto es Google o en The Keyword -en inglés- se encuentra el discurso completo del CEO.

👇 A continuación, lo más importante de esta edición:

Actualizaciones del modelo de lenguaje Gemini

Google anunció la nueva versión Gemini 1.5 Pro que brinda mayor utilidad en su ventana de contexto, en sus capacidades de razonamiento multimodal y en su rendimiento a nivel general. Además, gracias a las pruebas previas con clientes y desarrolladores, se creó Gemini 1.5 Flash: un modelo más ligero que 1.5 Pro, diseñado para ser rápido y eficaz a gran escala.

Ambos modelos se encuentran en versión preliminar con una ventana de contexto de un millón de tokens en Google AI Studio y Vertex AI. A su vez, a partir de hoy estará disponible una ventana de contexto de 2 millones de tokens tanto para desarrolladores que utilicen la API como para los clientes de Google Cloud, a través de la lista de espera. Además, estamos integrando Gemini 1.5 Pro en los productos de Google, incluyendo Gemini Advanced y en las aplicaciones de Workspace.

También se lanzaron la próxima generación de modelos abiertos Gemma 2, y compartieron los avances en el futuro de los asistentes de Inteligencia Artificial con Proyecto Astra. Esta última iniciativa propuso asistentes basados en el modelo Gemini y otros modelos específicos de tarea, diseñados para procesar la información más rápidamente mediante la codificación continua de fotogramas de imágenes, la combinación de video y voz en una línea temporal de acontecimientos y el almacenamiento en caché de esta información para una reproducción más eficaz. Al aprovechar los modelos de voz de Google se optimiza el sonido, dotando a los asistentes de una gama más amplia de entonaciones. Así pueden entender mejor el contexto en el que se utilizan y responder rápidamente en una conversación.

Avances para reimaginar la búsqueda en línea con IA generativa

Hoy se dio a conocer la integración de un nuevo modelo de Gemini en el Buscador que sigue abriendo nuevas puertas a la hora de buscar en Google. Permitirá no solo realizar consultas, sino también simplificarlas, facilitar la investigación y planificación, y la generación de ideas, entre otros.

¿Lo más destacado? Para aquellas personas que necesiten encontrar respuestas rápidas en Internet por falta de tiempo, ahora el Buscador podrá hacer un “Resumen Creado con IA” para preguntas simples y complejas. Al mismo tiempo, ayudará a crear planes de alimentación o viajes: por ejemplo, consultando “crear plan (…)” se brindará información de recetas o lugares turísticos en un clic. Esta información se podrá exportar a Gmail o Documentos si fuese necesario. Asimismo, el Buscador incorporará la posibilidad de buscar con videos y acceder a páginas personalizadas de las fuentes más relevantes para cada inquietud.

Realizar más tareas diarias con Gemini

Por primera vez, las personas suscriptas a Gemini Advanced podrán acceder a Gemini 1.5 Pro: el modelo de lenguaje más actualizado que permite -entre otras cosas- acceder a una ventana de contexto ampliada, la más extensa de cualquier chatbot para consumidores disponible en el mundo. Comprenderá múltiples documentos grandes, de hasta 1.500 páginas en total, o podrá resumir 100 correos electrónicos en segundos. Pronto podrá manejar una hora de contenido de vídeo o bases de código con más de 30.000 líneas.

A su vez, se implementará una nueva experiencia de conversación móvil llamada “Gemini Live” que utiliza la tecnología de voz de última generación para que hablar con Gemini sea aún más intuitivo. Por otro lado, se creó Gems: una experiencia que permite a los suscriptores de Gemini Advanced personalizar Gemini según sus gustos, ya sea como entrenador personal, estilista o guía de escritura creativa. Y Gemini continúa incorporando más aplicaciones de Google a través de “Extensiones”.

Gemini para Workspace: “Ayúdame a escribir” ahora en español en Gmail y Documentos de Google

En las próximas semanas, todas las organizaciones que usan Google Workspace y los usuarios que tienen Google One AI Premium tendrán acceso a la funcionalidad “Ayúdame a escribir” directamente integrada a Gmail y Documentos de Google en español. Esta herramienta será útil para:

Escribir un nuevo borrador utilizando un comando libre. Por ejemplo, se podrá pedir a Gmail que escriba una invitación de cumpleaños o una presentación para un posible contacto comercial.
Mejorar un borrador. Por ejemplo, se podrá pedir que reformule un borrador o hacerlo más formal, conciso o detallado.

Además, a partir de ahora, el modelo Gemini 1.5 Pro se incorporará a las distintas herramientas de Workspace (Gmail, Presentaciones, Documentos y más) a través de un panel lateral en el que las personas podrán realizar preguntas o consultas sobre el contenido o información disponible en ese producto y recibir respuestas, resúmenes, sugerencias y más. Por ejemplo, pedir en Documentos un resumen con foco en ciertas características de un informe disponible en dicho archivo.

IA al servicio de la sociedad y más formas para proteger el uso indebido

Durante el evento, Google reveló nuevas formas en las que está mejorando sus modelos de lenguaje, como Gemini, y protegiendo a las personas de su uso indebido. Esto incluye nuevas prácticas de investigación, como la incorporación de marcas de agua para textos y videos generados con IA, y el trabajo colaborativo con otras organizaciones.

Por otro lado, presentó “LearnLM” un nuevo modelo de lenguaje basado en Gemini que impulsa una experiencia de aprendizaje adaptada a las necesidades de cada individuo. Se integrará a Gemini, el Buscador, YouTube y Google Classroom. De igual forma, lanzó “Illuminate”, una nueva herramienta experimental creada para hacer más accesible y comprensible el conocimiento. Por ejemplo, puede generar una conversación formada por dos voces generadas por IA, que ofrecen una visión general y un breve debate sobre las ideas clave de un trabajo de investigación determinado.