A Apple revelou em um novo artigo [PDF] que utilizou chips na nuvem do Google para pré-treinar os modelos de linguagem fundamentais que alimentam a Apple Intelligence, conjunto de recursos de inteligência artificial lançado hoje em fase de testes pela empresa na primeira beta do iOS 18.1 para desenvolvedores.
Esses modelos base, denominados Apple Foundation Models (AFM), foram projetados para promover experiências como escrita, refinamento de texto, priorização e resumo de notificação, criação de imagens para conversação e rastreamento de atividades para simplificar a interação em apps, segundo o artigo.
No trabalho, a Apple detalhou dois desses modelos: o AFM-on-device (modelo menor, projetado para ser executado diretamente no dispositivo dos usuários) e o AFM-server (modelo maior, executado em servidores para suportar tarefas mais complexas e intensas).
De acordo com a Apple, esses modelos foram pré-treinados em chips TPUs na nuvem, uma abordagem que permitiu um treinamento de seus modelos AFM de forma eficiente e escalável — “incluindo o AFM-on-device, o AFM-server e modelos grandes” desenvolvidos pela companhia.
O AFM-on-device foi treinado em uma parcela de 2.048 chips de TPU v5p, enquanto o AFM-server foi treinado em 8.192 chips de TPU v4 — ambos desenvolvidos pelo Google e comercializados pela empresa para outras companhias ou organizações visando principalmente treinamento de modelos de IA.
Como pontuado pela CNBC, o uso das TPUs do Google pode indicar um aumento na procura por alternativas à NVIDIA, que domina o lucrativo mercado de GPUs 1Graphics processing units, ou unidades de processamento gráfico. projetadas para treinamento de IA e conta com clientes já consolidados nesse mercado como OpenAI, Anthropic e Microsoft.
Notas de rodapé
- 1Graphics processing units, ou unidades de processamento gráfico.