Lo Último en IP@P
- Free Planet VPN: Tu clave para una navegación segura, gratuita y privada
- ¿Por qué la gente opta por WPS Office en vez de continuar usando Microsoft Office?
- Los juegos de ruleta llegan a Android e iOS, sigue estas estrategias para mejorar tus resultados
- Estas herramientas de IA de CapCut Online están a la vanguardia de la creación de contenido multimedia
- Según nuestro último estudio, estos son los mejores gestores de archivos para smartphones Android
Nvidia a decidió entrar al negocio de los modelos de generación de imágenes a partir de texto, y por eso ha presentado a Perfusion AI. Desde que salió Dall-E de OpenIA a finales de 2022 y luego Midjourney, se ha creado todo un mercado muy lucrativo que el mayor fabricante de GPU’s quiere aprovechar.
Este modelo cuenta con un entrenamiento un poco diferente a los actuales modelos de difusión, por lo que sus virtudes y limitaciones son diferentes, pero promete ser una opción fácil de utilizar para los usuarios sin que esto signifique sacrificar la calidad de las imágenes que genera.
Perfusion AI; la nueva inteligencia artificial de Nvidia que quiere destronar a Dall-E y Midjourney
En el ámbito de la inteligencia artificial, un reto apasionante consiste en la generación de ilustraciones a partir de texto. En esencia, se trata de concebir una imagen mediante una descripción en lenguaje natural. Visualiza la posibilidad de redactar la descripción de una imagen que quisieras obtener y, de repente, lograr crearla. Ese es el desafío que NVIDIA pretende superar con su innovador modelo, Perfusion AI.
Perfusion AI es un sistema de inteligencia artificial diseñado para elaborar imágenes a partir de descripciones en lenguaje natural, al igual que DALL-E o Midjourney. Este modelo representa un avance significativo en comparación con las técnicas actuales, ya que permite generar ilustraciones más apegadas al contenido original.
El sistema funciona mediante el aprendizaje del “concepto” de un objeto, animal o persona y, posteriormente, generando dicho concepto en situaciones nuevas. El modelo se fundamenta en Stable Diffusion, una técnica también empleada en la generación de imágenes a partir de texto.
Imagine creating stunning Instagram images without leaving home or snapping photos! @nvidia‘s new AI model, Perfusion, advances text-to-image generation with enhanced control and fidelity!
Learn more in the video: https://t.co/sIlBVvMSI1#ai #nvidia #stablediffusion pic.twitter.com/OlQglgBKyZ
— Louis Bouchard (@Whats_AI) May 5, 2023
La divulgación del artículo de Nvidia indica que ha sido aceptado en SIGGRAPH 2023, aunque no ofrece detalles específicos acerca de cuándo estará disponible para su implementación.
Últimas Noticias de Internet
- Free Planet VPN: Tu clave para una navegación segura, gratuita y privada
- Este truco del Code Interpreter de ChatGPT con el NASDAQ está haciendo ganar miles de euros a los traders
- ¡No lo dejes pasar! Amazon está casi regalando el robot aspirador Lefant M210 por un precio increíble
- La próxima vez que pidas comida por Uber Eats recibirás recomendaciones de clientes de su IA
- Estas son las 5 películas más pirateadas de lo que llevamos de agosto
SÍGUENOS EN 👉 YOUTUBE TV
Perfusion AI se basa en una arquitectura de Stable Diffusion con el fin de generar imágenes a partir de texto. Esto implica que el sistema aprende a crear ilustraciones de manera iterativa, ajustando progresivamente la imagen conforme se procesa la descripción en lenguaje natural.
Lo que distingue a Perfusion AI de otros sistemas similares es su capacidad para brindar un mayor control sobre el proceso de generación de imágenes. En concreto, el modelo puede generar múltiples “conceptos” en una única imagen y mantener la coherencia entre ellos, algo que los modelos previos no podían realizar.
Un modelo prometedor que también tiene sus limitaciones
A pesar del asombroso avance que representa Perfusion AI, el modelo aún enfrenta ciertas limitaciones. Una de ellas radica en la dificultad ocasional para preservar la identidad del objeto generado, debido a que el sistema emplea categorías generales en lugar de descripciones más minuciosas para concebir las imágenes.
Otro desafío es la generación de ilustraciones que abarquen múltiples conceptos, lo cual puede resultar un proceso intrincado que demanda una precisión en la ingeniería de los prompts. En otras palabras, al intentar crear una imagen con varios objetos distintos, será necesario describir cada uno con exactitud en el lenguaje natural.
Perfusion AI marca un paso relevante en la dirección adecuada para la generación de imágenes a partir de texto. Si bien aún hay limitaciones por superar, el modelo brinda un mayor control y fidelidad en la elaboración de imágenes en comparación con sus predecesores.
De cara al futuro, se prevé el desarrollo de modelos aún más sofisticados capaces de generar imágenes más precisas y detalladas a partir de descripciones en lenguaje natural. Esto podría impactar significativamente en diversos sectores, desde la publicidad hasta la producción de contenido digital.