Bogotá, Colombia -Edición: 641

 Fecha: Miércoles 15-05-2024

 

 

Página 12

   

TECNOLOGÍA-CIENCIA

 

 

 

Google I/O 2024: Un vistazo al futuro de la IA generativa

 

 

 

indicación de texto y extraer detalles de las interacciones pasadas con el usuario, lo que permite crear imágenes más realistas y precisas.

 

Mejoras en Google Search

 

Google Search también se benefició de mejoras impulsadas por IA. La función AI Overview, que entrega descripciones generales generadas por IA sobre temas particulares, está ahora disponible para todos los usuarios de Estados Unidos. Esta herramienta proporciona resúmenes con enlaces a sitios relacionados para que los usuarios puedan profundizar en el tema.

Además, el buscador de Google introducirá una función que permitirá a los usuarios ajustar el nivel de complejidad de los resultados generados por IA. Los usuarios podrán elegir entre un lenguaje más sencillo o uno más sofisticado, según su conocimiento sobre el tema. Este recurso estará disponible en Search Labs para consultas en inglés en Estados Unidos.

El motor de búsqueda online también ganará soporte para consultas en video. Los usuarios podrán capturar contenido audiovisual, introducirlo en la barra de búsquedas de Google y añadir una breve descripción de la información que esperan recibir. Como resultado, obtendrán una descripción general creada por IA relacionada con el tema. Esta función estará disponible próximamente en inglés para usuarios de Search Labs en Estados Unidos.

 

Trillium: La nueva TPU de Google

 

Finalmente, Google presentó Trillium, su TPU (Tensor Processing Unit) de sexta generación. Este diseño promete una mayor potencia en el procesamiento de datos con una demanda energética baja en comparación con sus predecesores. El componente facilita los procesos de entrenamiento y ejecución de los modelos de IA de última generación a gran escala.

 

 

Las TPU Trillium ofrecen un rendimiento computacional 4.7 veces mayor que los TPU v5e y son 67% más eficientes en términos de consumo energético. El procesador puede escalar hasta 256 TPU en un solo módulo de baja latencia y alto ancho de banda.

Este nuevo producto de Google abre la posibilidad de entrenar modelos de IA de gran tamaño a mayor velocidad, operarlos con menor latencia y a bajo costo, y abordar problemas complejos de manera más efectiva.

El Google I/O 2024 ha demostrado una vez más que la inteligencia artificial sigue siendo un área clave de innovación para Google. Con avances en modelos de IA generativa, asistentes virtuales y herramientas de búsqueda, la empresa continúa empujando los límites de lo posible. Sin embargo, estos desarrollos también traen consigo importantes consideraciones éticas y de privacidad que deberán ser abordadas a medida que estas tecnologías se integran en la vida cotidiana. La combinación de innovación y responsabilidad será crucial para el futuro de la IA y su impacto en la sociedad.

 

En el evento anual Google I/O 2024, la inteligencia artificial (IA) fue indudablemente la gran protagonista. La empresa de Mountain View reveló avances significativos en su tecnología de IA generativa, incluyendo la presentación de una nueva versión de Gemini, la segunda generación de Gemma, nuevas funcionalidades de búsqueda basadas en IA y el innovador Project Astra, un asistente virtual multimodal que pretende competir directamente con el GPT-4 de OpenAI.

 

Gemini 1.5 Flash: Un modelo más ligero y eficiente

 

Google presentó Gemini 1.5 Flash, una evolución de su plataforma de IA generativa. Este modelo es más ligero, rápido y eficiente, diseñado para manejar tareas a gran escala y alta frecuencia. La compañía asegura que es el producto más rentable de su portafolio, gracias a su ventana de contexto extendida.

 

 

Esta nueva propuesta, más ligera que Gemini 1.5 Pro, es capaz de procesar grandes volúmenes de información y realizar razonamiento multimodal. Sus aplicaciones van desde la creación de resúmenes y mejora de experiencias en aplicaciones de chat, hasta la extracción de datos de tablas y documentos, generación de imágenes y edición de vídeos con tareas simples como la incorporación de subtítulos.

Gemini 1.5 Flash fue entrenado utilizando un proceso de destilación basado en las capacidades de Gemini 1.5 Pro. Este proceso transfiere los conocimientos y habilidades esenciales de un modelo más complejo a uno más pequeño y eficiente.

Actualmente, Gemini 1.5 Flash está disponible en una versión preliminar pública en Google AI Studio y Vertex AI, con una capacidad de 1 millón de tokens. Los desarrolladores y clientes de Google Cloud pueden acceder a 2 millones de tokens de procesamiento en esta fase inicial.

 

Mejoras en Gemini 1.5 Pro

 

Google también anunció mejoras significativas para Gemini 1.5 Pro. Este modelo, presentado a principios de año con una ventana de contexto de 1 millón de tokens, ha incrementado su capacidad de procesamiento a 2 millones de tokens. Ahora, puede responder a solicitudes más complejas con un mayor grado de detalle en formato y estilo.

El equipo de Google ha perfeccionado el código para generación, razonamiento lógico y planificación, así como la función de conversación de varios turnos. Estos ajustes resultan en una mejor comprensión del lenguaje natural, entrega de resultados más relevantes basados en el contexto y mayor fluidez en las interacciones con los usuarios.

Además, la capacidad de comprensión de audio e imagen de Gemini 1.5 Pro ha sido optimizada, permitiendo ofrecer experiencias más completas y precisas al combinar texto, audio e imágenes. Este sistema se ha integrado en productos y aplicaciones de Google como YouTube, Maps y Gmail.

 

Gemini Nano, la variante del modelo

 

 

habilitada para operar en dispositivos móviles, también ha ganado soporte multimodal, siendo capaz de procesar contenidos en audio, imagen y texto.

 

Gemma 2: La evolución de los modelos de lenguaje

 

En el Google I/O 2024, se presentó Gemma 2, la segunda generación de la familia de modelos de lenguaje de código abierto de Google. Esta serie ha sido rediseñada para ofrecer un rendimiento y eficiencia optimizados, y estará disponible en nuevos tamaños para ampliar sus casos de uso.

 

La familia Gemma se expande con PaliGemma, el primer modelo de visión y lenguaje de Google, inspirado en PaLI-3. El kit de herramientas de desarrollo de IA generativa de Google se actualizó con LLM Comparator, una herramienta de análisis visual que permite a los usuarios evaluar el rendimiento del modelo según sus respuestas en diversos escenarios.

 

Project Astra: El futuro de los asistentes virtuales

 

Project Astra es una iniciativa ambiciosa de Google para desarrollar asistentes digitales basados en IA que comprendan y respondan al mundo de manera similar a los humanos. "Hemos trabajado para mejorar la forma en que nuestros modelos perciben, razonan y conversan, optimizando el ritmo y la calidad de las interacciones para hacerlas más naturales," dijo Demis Hassabis, CEO de Google DeepMind.

 

El objetivo es diseñar agentes de servicio virtuales de IA que sean proactivos, didácticos y personalizados. Los ingenieros de Google mostraron avances en sus desarrollos, construidos sobre la plataforma de Gemini y otros modelos específicos para diversas tareas. Se espera que estas soluciones se integren en algunos productos de Google a finales de año.

 

Nuevos modelos para la producción audiovisual: Image 3 y Veo

 

Google también presentó dos nuevos modelos de IA destinados a revolucionar la producción audiovisual. Veo es un sistema de generación de video que, mediante indicaciones de texto, puede producir videos de más de un minuto con una resolución de 1080 píxeles. Veo competirá directamente con Sora de OpenAI.

 

"Veo tiene una comprensión avanzada del lenguaje natural y la semántica visual, y puede generar videos que se ajustan estrechamente a la visión creativa del usuario," afirmó Google.

 

Image 3 es ahora el sistema de texto a imagen más robusto de Google. Es capaz de comprender la intención de cada

 

 

Página 12

 

© 2020-2024 - Noticias5 - La idea y concepto de este periódico fue hecho en  Online Periodical Format© (OPF) es un Copyright de ZahurK.

    Queda prohibido el uso de este formato (OPF) sin previa autorización escrita de ZahurK

Suscribirse gratis