Navegue

Android aplicativo aplicativos app Apple Apple TV Apple TV+ Apple Watch apps App Store atualização beta Brasil câmera desconto desenvolvedores Design dica Dicas Dinheiro Estados Unidos fotos Gadgets game Google Internet iOS iPad iPadOS iPhone iPod touch iTunes iTunes Store jogo Jogos lançamento loja Mac Mac App Store MacMagazine macOS Mac OS X Microsoft Música novidades oferta OS X Pesquisa processo produção promoção Recurso recursos rumor Samsung Segurança smartphone Software tablet Tecnologia tela testes Tutoriais tutorial update usuários vendas vídeo Vídeos áudio

MM NEWS

NOSSAS REDES SOCIAIS

Facebook
Twitter
Bluesky
Instagram
YouTube
Mastodon
Telegram
SoundCloud
LinkedIn
GitHub
Google News
RSS
O melhor pedaço da Maçã.
Visual Intelligence

Novo modelo visual da Apple permite processar imagens em instantes

Bruno Cardoso
13/05/2025 • 10:18
Leitura de 2 minuto

No fim de 2023, falamos aqui sobre o MLX, framework aberto de machine learning da Maçã feito especificamente para chips da família Apple Silicon, com o objetivo de facilitar o treinamento de modelos de inteligência artificial que rodam localmente.

Publicidade

Agora, como notado pelo 9to5Mac, a empresa apresentou outro avanço nessa área: o FastVLM, um modelo de linguagem visual (VLM, na sigla em inglês) que se aproveita do MLX para processar imagens quase que instantaneamente ao mesmo tempo em que exige poucos recursos do sistema.

De acordo com a Apple, o novo modelo é 3,2 vezes mais rápido e 3,6 vezes menor do que soluções concorrentes, além de ganhar no quesito privacidade — uma vez que nada está sendo enviado para um computador na nuvem para processamento. Projetado para gerar menos tokens, ele também começa a entregar sua resposta 85 vezes mais rápido que modelos similares a partir do momento que o usuário envia seu prompt.

Além disso, FastVLM é baseado no encoder FastViTHD, que foi projetado para aumentar a eficiência desse tipo de modelo em imagens com resoluções maiores, permitindo resultados como os dos GIFs acima.

Embora essa tecnologia seja perfeita para o recurso inteligência visual (visual intelligence) do iOS 18, é bem possível que ela tenha sido desenvolvida com os rumorados óculos inteligentes da Apple em mente, os quais, como comentamos aqui, deverão contar com câmeras para escanear o ambiente ao redor do usuário.

Publicidade

Caso tudo corra como esperado, veremos o “Apple Glass” chegar ao mercado em aproximadamente dois anos — e, aí sim, provavelmente veremos o FastVLM em toda a sua glória.

O FastVLM está disponível no GitHub. Interessados em saber mais sobre o modelo podem ler o seu relatório no arXiv — mas prepare-se, pois trata-se de um texto extremamente denso/técnico.

Ver comentários do post

Compartilhe este artigo
URL compartilhável
Bruno Cardoso
Paulista e formado em Design pela Universidade São Judas Tadeu (USJT), acompanha o mundo Apple de perto desde os 11 anos de idade, quando assistiu a um evento de apresentação de um iPhone pela primeira vez. Atualmente, escreve para o MacMagazine de um MacBook Air de 13 polegadas (M2).
Post Ant.

macOS 16 alertará usuários sobre apps usando a área de transferência
Próx. Post

Oferta: iPhone 16 (512GB) com 27% de desconto!
Posts relacionados