Móviles
Veo, Imagen 3 y Lyria. Así son los modelos de IA generativa de Google para vídeo, imágenes y música
Publicado
hace 7 mesesen
Por
Sergio Asenjo
Luego de muchos meses de retraso, el conocido como Google I/O (la conferencia anual para desarrolladores de Google) ha regalado aparición hoy mismo con un evento en el que la inteligencia sintético ha sido protagonista indiscutible.
Entre otras muchas novedades, Google nos ha sorprendido con el emanación de nuevos modelos de IA generativa para vídeo e imágenes que tienen por objetivo mejorar el proceso creativo de sus usuarios. ¿En qué consisten exactamente Veo, Imagen 3 y Lyria? Te contamos todos los detalles a continuación.
Crear vídeos a partir de prompts de texto es posible con Veo
Hace unos meses hablábamos acerca de Sora, la espectacular útil de OpenAI capaz de crear todo tipo de vídeos a partir de texto (aunque por ahora no está arreglado públicamente). En el evento de hoy, Google ha presentado Veo, un maniquí capaz de difundir vídeo a partir de prompts en texto con el que la compañía pretende competir con OpenAI.
Tal y como afirman desde Google, Veo es capaz de difundir vídeos en resolución 1080p de más de un minuto de duración en un amplio número de estilos visuales distintos. Tal y como adelantábamos, la útil funciona a partir de las instrucciones en texto del adjudicatario y se encarga de difundir un vídeo que se asemeje lo mayor posible a nuestra idea flamante.
Una de las preocupaciones más habituales al murmurar de vídeos generados por IA es la dificultad de distinguirlos de vídeos reales. En relación a este punto, Google ha confirmado que los vídeos que creemos con Veo tendrán una marca de agua imperceptible al ojo humano que en caso de obligación permitirá identificar que un vídeo ha sido generado con IA.
Este maniquí está arreglado desde hoy mismo para un especie menguado de usuarios de VideoFX. En el futuro, la compañía pretende ofrecer las posibilidades de Veo en YouTube Shorts y otros productos similares.
Imagen 3 nos permite crear imágenes mediante IA a partir de texto
Dejando a un banda la gestación de vídeo mediante IA, Imagen 3 es el nuevo maniquí de gestación de imágenes a partir de prompts de texto desarrollado por la compañía. Durante la presentación, Google ha mostrado varias imágenes generadas con Imagen 3 en las que podemos apreciar el nivel de detalle conseguido.
Sin duda, uno de los puntos que nos ha llamado la atención acerca de este maniquí es lo aceptablemente que se lleva con el texto: al contrario que otras herramientas similares, Imagen 3 parece obtener muy buenos resultados cuando queremos incluir fragmentos de texto o palabras sueltas en las imágenes que generamos.
Si has usado otras herramientas de este estilo habrás podido comprobar que es habitual que la IA se salte trivio o incluso palabras completas cuando le pedimos que incluya un fragmento de texto en una imagen.
Al parecer, uno de los puntos fuertes de Imagen 3 es el renderizado de texto. Tal y como puedes ver en la imagen superior, la IA de Google es capaz de formar palabras mediante los rudimentos que indiquemos en el prompt sin ningún tipo de error.
Lyria pretende revolucionar la creación musical gracias al apoyo de la IA
A finales del año pasado escuchamos murmurar por primera vez acerca de Lyria, el plan de Google para revolucionar la forma de crear música mediante inteligencia sintético. Para lograrlo, la compañía ha llegado a acuerdos con diferentes músicos, compositores y productores musicales, lo que les permite diferenciarse de herramientas similares que han ido surgiendo a lo derrochador de los últimos meses.
Como parte del trabajo de la compañía en este sector, Google cuenta con Music AI Sandbox, una suite de herramientas musicales mediante IA que permite crear música usando diferentes instrumentos desde cero.
Adicionalmente, la compañía ha trabajador para anunciar nuevas colaboraciones con Wyclef Jean, Marc Rebillet y Justin Tranter, que han explicado como usan los modelos de inteligencia sintético de Google para crear canciones y cuentan con ejemplos reales y en sus canales de YouTube. Al igual que con el contenido en vídeo, las canciones creadas con Lyria tendrán una marca de agua invisible gracias a SynthID, la tecnología usada por la compañía.
Imágenes | Google
En Xataka Android | La app de Gemini para Android ya está aquí. Así puedes probar la IA más avanzada de Google en tu móvil