Inteligencia Artificial Produce Rostros Humanos A Partir De Fotos Pixeladas


Inteligencia artificial curiosciencia
Duke University


Las redes de inteligencia artificial han aprendido un nuevo truco: poder crear caras fotorrealistas a partir de unos pocos puntos pixelados, agregando características como pestañas y arrugas que ni siquiera se pueden encontrar en el original.

Antes de enloquecer, es bueno tener en cuenta que esto no es una especie de pixelación inversa espeluznante que puede deshacer el desenfoque, porque las caras con las que aparece la IA son artificiales, no pertenecen a personas reales. Pero es un gran avance tecnológico de lo que dichas redes han podido hacer antes.

El sistema PULSE (Photo Upsampling via Latent Space Exploration por sus siglas en inglés) puede producir fotos con una resolución hasta 64 veces mayor que las imágenes de origen, que es 8 veces más detallado que los métodos anteriores.

"Nunca antes se habían creado imágenes de súper resolución con esta resolución con tanto detalle", dice la científica informática Cynthia Rudin, de la Universidad de Duke.

inteligencia artificial curiosciencia
Duke University

Lo que PULSE hace es trabajar hacia atrás, generando fotos de caras a resolución completa que se verían como originales borrosos cuando están pixeladas, en lugar de comenzar con la imagen borrosa e intentar agregar detalles para encontrar una coincidencia. Una cuadrícula de 16 x 16 píxeles se puede convertir en una imagen de 1.024 x 1.024 en segundos, con más de un millón de píxeles añadidos.

El sistema hace uso de una red generativa de confrontación o GAN, que esencialmente pone dos redes neuronales (motores de aprendizaje de IA complejos diseñados para imitar el cerebro humano) uno contra el otro, ambos entrenados en el mismo conjunto de fotos. Uno genera caras y el otro decide si la cara es lo suficientemente realista.

Al tomar esta ruta, los investigadores pueden obtener imágenes que no tienen las áreas borrosas o confusas que a veces aparecen en el producto final cuando se utilizan otras técnicas.

Parte del éxito del sistema se debe a la forma en que busca cualquier imagen que se reduzca a la original, en lugar de tratar de encontrar la única imagen 'verdadera' que se ajuste a la fuente. Prueba rápidamente una gran cantidad de opciones, trabajando a través del "espacio latente" en su nombre, hasta que encuentra una coincidencia.

Las GAN como esta continúan creciendo en complejidad: quizás recuerdes que el gigante tecnológico Nvidia ha estado mostrando una red generativa de adversarios que puede producir imágenes espeluznantemente realistas de personas que en realidad no existen.

En ese caso, las imágenes se generan mezclando caras existentes en algo nuevo. En el sistema PULSE demostrado por los investigadores aquí, los bloques de una imagen pixelada se utilizan como fuente.


Inteligencia artificial curiosciencia
La transferencia de estilo divide las caras en diferentes elementos. (Nvidia)


Se pueden producir múltiples caras a partir de la misma imagen de origen, y se puede aplicar la misma idea para crear fotos de cualquier cosa a partir de una imagen en bloque, dicen los investigadores: gatos, puestas de sol, árboles, globos o cualquier otra cosa.

Este aspecto podría hacerlo adecuado para su uso en todo tipo de otras áreas, incluida la medicina, la microscopía, la astronomía y las imágenes satelitales.

Puedes encontrar más detalles en el sitio web de PULSE e incluso probarlo en tus propias imágenes.

La investigación se presentó en la Conferencia 2020 sobre reconocimiento de patrones y visión por computadora (CVPR), y hay un documento disponible en el servidor de preimpresión arXiv.org.


0/Post a Comment/Comments

Artículo Anterior Artículo Siguiente