|
Bogotá, Colombia -Edición: 641 Fecha: Miércoles 15-05-2024 |
![]()
|
Página 12 |
|
|
TECNOLOGÍA-CIENCIA |
||
|
Google I/O 2024: Un vistazo al futuro de la IA generativa |
|
||||
![]()
|
indicación de texto y extraer detalles de las interacciones pasadas con el usuario, lo que permite crear imágenes más realistas y precisas.
Mejoras en Google Search
Google Search también se benefició de mejoras
impulsadas por IA. La función AI Overview, que entrega descripciones generales
generadas por IA sobre temas particulares, está ahora disponible para todos los
usuarios de Estados Unidos. Esta herramienta proporciona resúmenes con enlaces a
sitios relacionados para que los usuarios puedan profundizar en el tema.
Trillium: La nueva TPU de Google
Finalmente, Google presentó Trillium, su TPU (Tensor Processing Unit) de sexta generación. Este diseño promete una mayor potencia en el procesamiento de datos con una demanda energética baja en comparación con sus predecesores. El componente facilita los procesos de entrenamiento y ejecución de los modelos de IA de última generación a gran escala.
Las TPU Trillium ofrecen un rendimiento
computacional 4.7 veces mayor que los TPU v5e y son 67% más eficientes en
términos de consumo energético. El procesador puede escalar hasta 256 TPU en un
solo módulo de baja latencia y alto ancho de banda.
|
|||||
En el evento anual Google I/O 2024, la inteligencia artificial (IA) fue indudablemente la gran protagonista. La empresa de Mountain View reveló avances significativos en su tecnología de IA generativa, incluyendo la presentación de una nueva versión de Gemini, la segunda generación de Gemma, nuevas funcionalidades de búsqueda basadas en IA y el innovador Project Astra, un asistente virtual multimodal que pretende competir directamente con el GPT-4 de OpenAI.
Gemini 1.5 Flash: Un modelo más ligero y eficiente
Google presentó Gemini 1.5 Flash, una evolución de su plataforma de IA generativa. Este modelo es más ligero, rápido y eficiente, diseñado para manejar tareas a gran escala y alta frecuencia. La compañía asegura que es el producto más rentable de su portafolio, gracias a su ventana de contexto extendida.
Esta nueva propuesta, más ligera que
Gemini 1.5 Pro, es capaz de procesar grandes volúmenes de información y
realizar razonamiento multimodal. Sus aplicaciones van desde la creación
de resúmenes y mejora de experiencias en aplicaciones de chat, hasta la
extracción de datos de tablas y documentos, generación de imágenes y
edición de vídeos con tareas simples como la incorporación de
subtítulos.
Mejoras en Gemini 1.5 Pro
Google también anunció mejoras
significativas para Gemini 1.5 Pro. Este modelo, presentado a principios
de año con una ventana de contexto de 1 millón de tokens, ha
incrementado su capacidad de procesamiento a 2 millones de tokens.
Ahora, puede responder a solicitudes más complejas con un mayor grado de
detalle en formato y estilo.
Gemini Nano, la variante del modelo
|
habilitada para operar en dispositivos móviles, también ha ganado soporte multimodal, siendo capaz de procesar contenidos en audio, imagen y texto.
Gemma 2: La evolución de los modelos de lenguaje
En el Google I/O 2024, se presentó Gemma 2, la segunda generación de la familia de modelos de lenguaje de código abierto de Google. Esta serie ha sido rediseñada para ofrecer un rendimiento y eficiencia optimizados, y estará disponible en nuevos tamaños para ampliar sus casos de uso.
La familia Gemma se expande con PaliGemma, el primer modelo de visión y lenguaje de Google, inspirado en PaLI-3. El kit de herramientas de desarrollo de IA generativa de Google se actualizó con LLM Comparator, una herramienta de análisis visual que permite a los usuarios evaluar el rendimiento del modelo según sus respuestas en diversos escenarios.
Project Astra: El futuro de los asistentes virtuales
Project Astra es una iniciativa ambiciosa de Google para desarrollar asistentes digitales basados en IA que comprendan y respondan al mundo de manera similar a los humanos. "Hemos trabajado para mejorar la forma en que nuestros modelos perciben, razonan y conversan, optimizando el ritmo y la calidad de las interacciones para hacerlas más naturales," dijo Demis Hassabis, CEO de Google DeepMind.
El objetivo es diseñar agentes de servicio virtuales de IA que sean proactivos, didácticos y personalizados. Los ingenieros de Google mostraron avances en sus desarrollos, construidos sobre la plataforma de Gemini y otros modelos específicos para diversas tareas. Se espera que estas soluciones se integren en algunos productos de Google a finales de año.
Nuevos modelos para la producción audiovisual: Image 3 y Veo
Google también presentó dos nuevos modelos de IA destinados a revolucionar la producción audiovisual. Veo es un sistema de generación de video que, mediante indicaciones de texto, puede producir videos de más de un minuto con una resolución de 1080 píxeles. Veo competirá directamente con Sora de OpenAI.
"Veo tiene una comprensión avanzada del lenguaje natural y la semántica visual, y puede generar videos que se ajustan estrechamente a la visión creativa del usuario," afirmó Google.
Image 3 es ahora el sistema de texto a imagen más robusto de Google. Es capaz de comprender la intención de cada
|
|||||
![]()
|
Página 12 |
© 2020-2024 - Noticias5 - La idea y concepto de este periódico fue hecho en Online Periodical Format© (OPF) es un Copyright de ZahurK. Queda prohibido el uso de este formato (OPF) sin previa autorización escrita de ZahurK
|