Runway lança modelo de IA que simula o mundo real e aprimora geração de vídeos

A corrida para lançar modelos de mundo está em andamento, e a empresa de geração de imagens e vídeos por IA, Runway, se junta a um número crescente de startups e grandes empresas de tecnologia ao apresentar seu primeiro modelo. Chamado de GWM-1, o sistema opera por meio de previsão quadro a quadro, criando uma simulação com compreensão da física e de como o mundo realmente se comporta ao longo do tempo, conforme explicado pela companhia.

Um modelo de mundo é um sistema de inteligência artificial que aprende uma simulação interna de como o mundo funciona, permitindo que ele raciocine, planeje e aja sem a necessidade de ser treinado em todos os cenários possíveis da vida real.

A Runway, que no início deste mês lançou seu modelo de vídeo Gen 4.5, que superou tanto o Google quanto a OpenAI no ranking Video Arena, afirmou que seu modelo de mundo GWM-1 é mais ‘geral’ do que o Genie-3 do Google e outros concorrentes. A empresa o posiciona como um modelo capaz de criar simulações para treinar agentes em diferentes áreas, como robótica e ciências da vida.

‘Para construir um modelo de mundo, primeiro precisávamos construir um modelo de vídeo realmente excelente. Acreditamos que o caminho certo para construir um modelo de mundo é ensinar os modelos a prever pixels diretamente, pois essa é a melhor maneira de alcançar uma simulação de propósito geral. Em escala suficiente e com os dados certos, você pode construir um modelo que tenha compreensão suficiente de como o mundo funciona’, disse o CTO da empresa, Anastasis Germanidis, durante uma transmissão ao vivo.

A Runway lançou versões específicas do novo modelo de mundo, denominadas GWM-Worlds, GWM-Robotics e GWM-Avatars.

GWM-Worlds é uma aplicação do modelo que permite criar um projeto interativo. Os usuários podem definir uma cena por meio de um prompt ou uma imagem de referência, e conforme se explora o espaço, o modelo gera o mundo com compreensão de geometria, física e iluminação. A empresa mencionou que a simulação é executada a 24 fps e resolução de 720p. A Runway afirmou que, embora o Worlds possa ser útil para jogos, também está bem posicionado para ensinar agentes a navegar e se comportar no mundo físico.

Com o GWM-Robotics, a empresa pretende usar dados sintéticos enriquecidos com novos parâmetros, como mudanças nas condições climáticas ou obstáculos. A Runway diz que esse método também pode revelar quando e como os robôs podem violar políticas e instruções em diferentes cenários.

A Runway também está desenvolvendo avatares realistas sob o GWM-Avatars para simular o comportamento humano. Empresas como D-ID, Synthesia, Soul Machines e até o Google têm trabalhado na criação de avatares humanos que parecem reais e funcionam em áreas como comunicação e treinamento.

A empresa destacou que, tecnicamente, Worlds, Robotics e Avatars são modelos separados, mas eventualmente planeja fundir todos em um único sistema.

Além de lançar um novo modelo de mundo, a empresa também está atualizando seu modelo fundamental Gen 4.5, apresentado no início do mês. A nova atualização traz áudio nativo e capacidades de geração de longa duração e múltiplas tomadas para o modelo. A empresa disse que com este modelo, os usuários podem gerar vídeos de um minuto com consistência de personagens, diálogo nativo, áudio de fundo e cenas complexas de vários ângulos. A empresa afirmou que também é possível editar áudio existente e adicionar diálogos. Além disso, você pode editar vídeos de múltiplas tomadas de qualquer duração.

A atualização do Gen 4.5 aproxima a Runway do pacote de vídeo all-in-one do concorrente Kling, que também foi lançado no início deste mês, particularmente em torno de áudio nativo e narrativa com múltiplas tomadas. Também sinaliza que os modelos de geração de vídeo estão passando de protótipos para ferramentas prontas para produção. O modelo Gen 4.5 atualizado da Runway está disponível para todos os usuários de planos pagos.

A empresa informou que disponibilizará o GWM-Robotics por meio de um SDK. Acrescentou que está em conversas ativas com várias empresas de robótica e corporações para o uso de GWM-Robotics e GWM-Avatars.

Confira também

Rivian demonstra avanços em direção autônoma com novo modelo de IA, mas desafios persistem

O robô se esquivava pela cafeteria do escritório da Rivian em Palo Alto, passando por …