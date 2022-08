A Apple apresentou recentemente uma nova inteligência artificial capaz de gerar vídeos em três dimensões de ambientes usando apenas uma imagem fixa e uma ordem de texto predeterminada pelo usuário. Batizada de GAUDI, a tecnologia ainda está em fase inicial de seu desenvolvimento, mas já impressiona pelo seu alto nível de detalhes.

Ao contrário de outras IAs mais famosas, geralmente capazes de gerar apenas imagens em 2D (tal como o DALL-E, por exemplo), a tecnologia da Maçã vai além e cria cenas complexas e imersivas a partir de simples fotos, como se alguém tivesse “entrado” no espaço representado pela imagem e gravado um vídeo. Seu nome, por sua vez, é uma homenagem ao arquiteto espanhol Antoni Gaudí.

Dada a ordem “caminhar para a cozinha”, tomando como referência uma imagem fixa, GAUDI pode gerar planos de diferentes níveis para construir artificialmente um percurso visual de movimento.

Por se tratar de algo em desenvolvimento, as imagens geradas pelo GAUDI ainda são de baixa resolução e apresentam artefatos que com certeza serão eliminados em versões mais avançadas da IA. Como notado pelo Patently Apple, essa tecnologia pode muito bem servir como um ponto de partida para futuras experiências tridimensionais em um possível headset de realidade virtual/aumentada da Maçã.

De forma bastante resumida, o sistema usa a imagem fornecida pelo usuário para analisar as variáveis do ambiente, adaptando-se suas características (como o ângulo da câmera, por exemplo). Feito isso, ele gera um modelo 3D navegável do ambiente que segue exatamente o comando dado previamente.

A Apple, vale notar, já publicou uma série de informações sobre o GAUDI em sua página oficial no GitHub, onde ela também divulgará novidades sobre a tecnologia. O documento com os detalhes técnicos acerca do seu funcionamento pode ser conferido aqui [PDF].