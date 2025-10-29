A Apple publicou um estudo chamado “Pico-Banana-400K: A Large-Scale Dataset for Text-Guided Image Editing” (“Pico-Banana-400K: um conjunto de dados em larga escala para edição de imagens guiada por texto”, na tradução livre), que apresenta uma nova base de dados multimodal com 400 mil imagens reais voltada ao treinamento de modelos de edição de imagem guiada por texto.

Segundo os pesquisadores da Maçã, o objetivo do Pico-Banana-400K é preencher a lacuna de datasets abertos e de alta qualidade para essa área. O conjunto foi criado a partir de fotos do OpenImages, submetidos ao modelo Nano-Banana, responsável por gerar edições visuais com base em instruções escritas. Cada resultado foi avaliado automaticamente pelo sistema Gemini-2.5-Pro, que atribuiu notas de conformidade e qualidade técnica antes de compor o conjunto de dados final.

O acervo está organizado em 35 tipos de edição, distribuídos em 8 categorias — de ajustes fotoelétricos, como mudança de cor e iluminação, a transformações complexas, incluindo conversão de pessoas em versões no estilo Pixar, LEGO ou Funko-Pop.

Além das edições únicas, o conjunto inclui sequências de múltiplos comandos e pares de comparação entre resultados bem-sucedidos e falhos, para auxiliar no treinamento de modelos capazes de aprender preferências e evitar distorções.

A Apple afirma que o Pico-Banana-400K oferece uma base robusta para o desenvolvimento da próxima geração de sistemas de edição de imagem baseados em linguagem. O estudo reconhece, porém, que há limitações técnicas em tarefas de geometria precisa, tipografia e reposicionamento de objetos.

Com o lançamento do material, a empresa abre pela primeira vez um dataset público em larga escala voltado à pesquisa, indicando que a Maçã enxerga na presença acadêmica o futuro do desenvolvimento do ecossistema da Apple Intelligence.

O conjunto de dados está disponível no GitHub, sob licença de uso não comercial.

