Nvidia puede hacer un video de ti bailando con una foto
Nvidia ha desarrollado una nueva IA capaz de imitar los movimientos de un sujeto de un video a otra persona con una sola imagen de entrada. Esta técnica se llama síntesis de video a video
Como dicen los investigadores, la síntesis de video a video convierte un video semántico de entrada como poses humanas o máscaras de segmentación en un video fotorrealista de salida. Han mencionado dos limitaciones principales en los esfuerzos previos para lograr esto: disponibilidad de datos y capacidad de generalización limitada.
"Para abordar el problema, proponemos la normalización espacialmente adaptativa, una capa de normalización condicional que modula las activaciones utilizando diseños semánticos de entrada a través de una transformación espacialmente adaptativa y aprendida y puede propagar efectivamente la información semántica a través de la red", escribieron los investigadores.
El nuevo modelo desarrollado por investigadores aprende a crear videos de sujetos que nunca antes se habían visto utilizando imágenes de ejemplo. De esta manera, se aborda la necesidad de una gran cantidad de datos sobre la entrada.
El modelo logró convertir las acciones en videos con una sola imagen de entrada. ¿Guay, verdad?
Los investigadores realizaron varios experimentos para probar la eficiencia de su modelo de IA. Esto incluye videos de baile humano, videos de cabezas parlantes y videos de escenas callejeras.
Según los investigadores, este es el primer modelo de síntesis de imagen semántica capaz de producir salidas fotorrealistas para distintas escenas, incluidas escenas interiores, exteriores, paisajes y calles.
¿Te es util este articulo?. ¿Tienes una opinion relacionada con este articulo?. ¿Te has entretenido con nosotros?.
Si la respuesta es afirmativa, dejanos un comentario :) y como no Gracias por vernos