¿Mejor que midjourney? NVIDIA presenta Perfusion AI, su nuevo modelo de inteligencia artificial para crear imágenes increíbles a partir de texto

Mejor-que-midjourney-NVIDIA-presenta-Perfusion-AI-su-nuevo-modelo-de-inteligencia-artificial-para-crear-imagenes-increibles-a-partir-de-texto

Nvidia a decidió entrar al negocio de los modelos de generación de imágenes a partir de texto, y por eso ha presentado a Perfusion AI. Desde que salió Dall-E de OpenIA a finales de 2022 y luego Midjourney, se ha creado todo un mercado muy lucrativo que el mayor fabricante de GPU’s quiere aprovechar.

Este modelo cuenta con un entrenamiento un poco diferente a los actuales modelos de difusión, por lo que sus virtudes y limitaciones son diferentes, pero promete ser una opción fácil de utilizar para los usuarios sin que esto signifique sacrificar la calidad de las imágenes que genera.

Perfusion AI; la nueva inteligencia artificial de Nvidia que quiere destronar a Dall-E y Midjourney

En el ámbito de la inteligencia artificial, un reto apasionante consiste en la generación de ilustraciones a partir de texto. En esencia, se trata de concebir una imagen mediante una descripción en lenguaje natural. Visualiza la posibilidad de redactar la descripción de una imagen que quisieras obtener y, de repente, lograr crearla. Ese es el desafío que NVIDIA pretende superar con su innovador modelo, Perfusion AI.

Perfusion AI es un sistema de inteligencia artificial diseñado para elaborar imágenes a partir de descripciones en lenguaje natural, al igual que DALL-E o Midjourney. Este modelo representa un avance significativo en comparación con las técnicas actuales, ya que permite generar ilustraciones más apegadas al contenido original.

El sistema funciona mediante el aprendizaje del «concepto» de un objeto, animal o persona y, posteriormente, generando dicho concepto en situaciones nuevas. El modelo se fundamenta en Stable Diffusion, una técnica también empleada en la generación de imágenes a partir de texto.

Imagine creating stunning Instagram images without leaving home or snapping photos! @nvidia‘s new AI model, Perfusion, advances text-to-image generation with enhanced control and fidelity!

Learn more in the video: https://t.co/sIlBVvMSI1 #ai #nvidia #stablediffusion pic.twitter.com/OlQglgBKyZ

— Louis Bouchard (@Whats_AI) May 5, 2023

La divulgación del artículo de Nvidia indica que ha sido aceptado en SIGGRAPH 2023, aunque no ofrece detalles específicos acerca de cuándo estará disponible para su implementación.

Google lanza 'Game Dashboard' para el Pixel 6a y nos preguntamos si será tan inútil como otros "modos de juego" del mercado

Perfusion AI se basa en una arquitectura de Stable Diffusion con el fin de generar imágenes a partir de texto. Esto implica que el sistema aprende a crear ilustraciones de manera iterativa, ajustando progresivamente la imagen conforme se procesa la descripción en lenguaje natural.

Lo que distingue a Perfusion AI de otros sistemas similares es su capacidad para brindar un mayor control sobre el proceso de generación de imágenes. En concreto, el modelo puede generar múltiples «conceptos» en una única imagen y mantener la coherencia entre ellos, algo que los modelos previos no podían realizar.

Un modelo prometedor que también tiene sus limitaciones

A pesar del asombroso avance que representa Perfusion AI, el modelo aún enfrenta ciertas limitaciones. Una de ellas radica en la dificultad ocasional para preservar la identidad del objeto generado, debido a que el sistema emplea categorías generales en lugar de descripciones más minuciosas para concebir las imágenes.

Otro desafío es la generación de ilustraciones que abarquen múltiples conceptos, lo cual puede resultar un proceso intrincado que demanda una precisión en la ingeniería de los prompts. En otras palabras, al intentar crear una imagen con varios objetos distintos, será necesario describir cada uno con exactitud en el lenguaje natural.

Perfusion AI marca un paso relevante en la dirección adecuada para la generación de imágenes a partir de texto. Si bien aún hay limitaciones por superar, el modelo brinda un mayor control y fidelidad en la elaboración de imágenes en comparación con sus predecesores.

De cara al futuro, se prevé el desarrollo de modelos aún más sofisticados capaces de generar imágenes más precisas y detalladas a partir de descripciones en lenguaje natural. Esto podría impactar significativamente en diversos sectores, desde la publicidad hasta la producción de contenido digital.

¿Mejor que Midjourney? NVIDIA presenta Perfusion AI, su nuevo modelo de inteligencia artificial para crear imágenes increíbles a partir de texto

Perfusion AI; la nueva inteligencia artificial de Nvidia que quiere destronar a Dall-E y Midjourney

Un modelo prometedor que también tiene sus limitaciones

Temas

Autor: Mario José

Últimas Noticias

Guía Completa de Atajos de Teclado de Mac para Usuarios de Windows

Guía Completa sobre las Distribuciones BSD: Historia, Variantes y Diferencias

Fatiga Visual: Causas, Síntomas y Soluciones para el Cansancio Ocular

IA Agéntica: La Nueva Frontera en la Lucha contra el Fraude Bancario

Cómo solucionar problemas de Internet en tu Nintendo Switch y mejorar tu red doméstica

Análisis Exhaustivo del Fanatec ClubSport Wheel Rim GT3

Rebranding de Freepik a Magnific: del banco de imágenes a plataforma creativa de IA

Batería cuántica funcional: así es el primer prototipo real

Perfusion AI; la nueva inteligencia artificial de Nvidia que quiere destronar a Dall-E y Midjourney

Un modelo prometedor que también tiene sus limitaciones

Temas

Últimas Noticias

¡ÚNETE!