📅 Tal día como hoy 23 de abril... ¿QUÉ PASÓ?
Cursos Gratis Stories
Ganar Dinero Internet
Android Stories
Windows Stories
iOS Stories
MacOS Stories
Linux Stories
Facebook Stories
Amazon Stories
Netflix Stories
Whatsapp Stories
Twitch Stories
Instagram Stories
YouTube Stories
Gmail Stories
TikTok Stories
Arduino Stories
Telegram Stories
Raspberry Pi Stories

¿Mejor que Midjourney? NVIDIA presenta Perfusion AI, su nuevo modelo de inteligencia artificial para crear imágenes increíbles a partir de texto

Basado en Stable Diffusion, este nuevo modelo permite ser una herramienta más controlable y fácil de usar para los usuarios a pesar de que no sepan hacer prompts complejos

Mario José
Autor: Mario José
Fecha: 10 mayo, 2023 a las 11:24

Nvidia a decidió entrar al negocio de los modelos de generación de imágenes a partir de texto, y por eso ha presentado a Perfusion AI. Desde que salió Dall-E de OpenIA a finales de 2022 y luego Midjourney, se ha creado todo un mercado muy lucrativo que el mayor fabricante de GPU’s quiere aprovechar.

Este modelo cuenta con un entrenamiento un poco diferente a los actuales modelos de difusión, por lo que sus virtudes y limitaciones son diferentes, pero promete ser una opción fácil de utilizar para los usuarios sin que esto signifique sacrificar la calidad de las imágenes que genera.

publicidad

Perfusion AI; la nueva inteligencia artificial de Nvidia que quiere destronar a Dall-E y Midjourney

Perfusion-AI-la-nueva-inteligencia-artificial-de-Nvidia-que-quiere-destronar-a-Dall-E-y-Midjourney

En el ámbito de la inteligencia artificial, un reto apasionante consiste en la generación de ilustraciones a partir de texto. En esencia, se trata de concebir una imagen mediante una descripción en lenguaje natural. Visualiza la posibilidad de redactar la descripción de una imagen que quisieras obtener y, de repente, lograr crearla. Ese es el desafío que NVIDIA pretende superar con su innovador modelo, Perfusion AI.

Perfusion AI es un sistema de inteligencia artificial diseñado para elaborar imágenes a partir de descripciones en lenguaje natural, al igual que DALL-E o Midjourney. Este modelo representa un avance significativo en comparación con las técnicas actuales, ya que permite generar ilustraciones más apegadas al contenido original.

El sistema funciona mediante el aprendizaje del “concepto” de un objeto, animal o persona y, posteriormente, generando dicho concepto en situaciones nuevas. El modelo se fundamenta en Stable Diffusion, una técnica también empleada en la generación de imágenes a partir de texto.

La divulgación del artículo de Nvidia indica que ha sido aceptado en SIGGRAPH 2023, aunque no ofrece detalles específicos acerca de cuándo estará disponible para su implementación.

Perfusion AI se basa en una arquitectura de Stable Diffusion con el fin de generar imágenes a partir de texto. Esto implica que el sistema aprende a crear ilustraciones de manera iterativa, ajustando progresivamente la imagen conforme se procesa la descripción en lenguaje natural.

Lo que distingue a Perfusion AI de otros sistemas similares es su capacidad para brindar un mayor control sobre el proceso de generación de imágenes. En concreto, el modelo puede generar múltiples “conceptos” en una única imagen y mantener la coherencia entre ellos, algo que los modelos previos no podían realizar.

Un modelo prometedor que también tiene sus limitaciones

A pesar del asombroso avance que representa Perfusion AI, el modelo aún enfrenta ciertas limitaciones. Una de ellas radica en la dificultad ocasional para preservar la identidad del objeto generado, debido a que el sistema emplea categorías generales en lugar de descripciones más minuciosas para concebir las imágenes.

Otro desafío es la generación de ilustraciones que abarquen múltiples conceptos, lo cual puede resultar un proceso intrincado que demanda una precisión en la ingeniería de los prompts. En otras palabras, al intentar crear una imagen con varios objetos distintos, será necesario describir cada uno con exactitud en el lenguaje natural.

Perfusion AI marca un paso relevante en la dirección adecuada para la generación de imágenes a partir de texto. Si bien aún hay limitaciones por superar, el modelo brinda un mayor control y fidelidad en la elaboración de imágenes en comparación con sus predecesores.

De cara al futuro, se prevé el desarrollo de modelos aún más sofisticados capaces de generar imágenes más precisas y detalladas a partir de descripciones en lenguaje natural. Esto podría impactar significativamente en diversos sectores, desde la publicidad hasta la producción de contenido digital.

🔥ÚNETE🔥 A LA NUEVA COMUNIDAD DE IP@P ¡APÚNTATE AQUÍ!

Si te quedaste con alguna duda, déjalas en los comentarios, te contestaremos lo antes posible, además seguro que será de gran ayuda para más miembros de la comunidad. Gracias! 😉

Temas

Mario José
Autor: Mario José

Licenciado en periodismo, especializado en investigación, busco la verdad de todas las cosas. Ahora centrado 100% sobre temas de tecnología, informática e Internet.

Publicidad

Últimas Noticias

Deja un comentario