Lo Último en IP@P
- Goblin Mine: La Estrategia Económica Detrás del Juego de Minería que está Fascinando a Todos
- Estos son los nuevos Cargadores UGREEN: potencia y portabilidad en dos versiones que no te puedes perder
- UGREEN Nexode Pro: El Cargador Ultradelgado que revoluciona la carga de dispositivos móviles
- La computación en la nube está transformando los juegos Online y estas son sus grandes ventajas
- Actualizaciones del Programa de Afiliados de TEMU: ¡Hasta MX$500,000 al mes!
Nvidia a decidió entrar al negocio de los modelos de generación de imágenes a partir de texto, y por eso ha presentado a Perfusion AI. Desde que salió Dall-E de OpenIA a finales de 2022 y luego Midjourney, se ha creado todo un mercado muy lucrativo que el mayor fabricante de GPU's quiere aprovechar.
Este modelo cuenta con un entrenamiento un poco diferente a los actuales modelos de difusión, por lo que sus virtudes y limitaciones son diferentes, pero promete ser una opción fácil de utilizar para los usuarios sin que esto signifique sacrificar la calidad de las imágenes que genera.
Perfusion AI; la nueva inteligencia artificial de Nvidia que quiere destronar a Dall-E y Midjourney
En el ámbito de la inteligencia artificial, un reto apasionante consiste en la generación de ilustraciones a partir de texto. En esencia, se trata de concebir una imagen mediante una descripción en lenguaje natural. Visualiza la posibilidad de redactar la descripción de una imagen que quisieras obtener y, de repente, lograr crearla. Ese es el desafío que NVIDIA pretende superar con su innovador modelo, Perfusion AI.
Perfusion AI es un sistema de inteligencia artificial diseñado para elaborar imágenes a partir de descripciones en lenguaje natural, al igual que DALL-E o Midjourney. Este modelo representa un avance significativo en comparación con las técnicas actuales, ya que permite generar ilustraciones más apegadas al contenido original.
El sistema funciona mediante el aprendizaje del "concepto" de un objeto, animal o persona y, posteriormente, generando dicho concepto en situaciones nuevas. El modelo se fundamenta en Stable Diffusion, una técnica también empleada en la generación de imágenes a partir de texto.
Imagine creating stunning Instagram images without leaving home or snapping photos! @nvidia's new AI model, Perfusion, advances text-to-image generation with enhanced control and fidelity!
Learn more in the video: https://t.co/sIlBVvMSI1#ai #nvidia #stablediffusion pic.twitter.com/OlQglgBKyZ
— Louis Bouchard (@Whats_AI) May 5, 2023
La divulgación del artículo de Nvidia indica que ha sido aceptado en SIGGRAPH 2023, aunque no ofrece detalles específicos acerca de cuándo estará disponible para su implementación.
Últimas Noticias de Internet
- Estos son los riesgos de escoger un mal hosting para tu Ecommerce o Tienda Online
- Free Planet VPN: Tu clave para una navegación segura, gratuita y privada
- Este truco del Code Interpreter de ChatGPT con el NASDAQ está haciendo ganar miles de euros a los traders
- ¡No lo dejes pasar! Amazon está casi regalando el robot aspirador Lefant M210 por un precio increíble
- La próxima vez que pidas comida por Uber Eats recibirás recomendaciones de clientes de su IA
SÍGUENOS EN 👉 YOUTUBE TV
Perfusion AI se basa en una arquitectura de Stable Diffusion con el fin de generar imágenes a partir de texto. Esto implica que el sistema aprende a crear ilustraciones de manera iterativa, ajustando progresivamente la imagen conforme se procesa la descripción en lenguaje natural.
Lo que distingue a Perfusion AI de otros sistemas similares es su capacidad para brindar un mayor control sobre el proceso de generación de imágenes. En concreto, el modelo puede generar múltiples "conceptos" en una única imagen y mantener la coherencia entre ellos, algo que los modelos previos no podían realizar.
Un modelo prometedor que también tiene sus limitaciones
A pesar del asombroso avance que representa Perfusion AI, el modelo aún enfrenta ciertas limitaciones. Una de ellas radica en la dificultad ocasional para preservar la identidad del objeto generado, debido a que el sistema emplea categorías generales en lugar de descripciones más minuciosas para concebir las imágenes.
Otro desafío es la generación de ilustraciones que abarquen múltiples conceptos, lo cual puede resultar un proceso intrincado que demanda una precisión en la ingeniería de los prompts. En otras palabras, al intentar crear una imagen con varios objetos distintos, será necesario describir cada uno con exactitud en el lenguaje natural.
Perfusion AI marca un paso relevante en la dirección adecuada para la generación de imágenes a partir de texto. Si bien aún hay limitaciones por superar, el modelo brinda un mayor control y fidelidad en la elaboración de imágenes en comparación con sus predecesores.
De cara al futuro, se prevé el desarrollo de modelos aún más sofisticados capaces de generar imágenes más precisas y detalladas a partir de descripciones en lenguaje natural. Esto podría impactar significativamente en diversos sectores, desde la publicidad hasta la producción de contenido digital.