O melhor pedaço da Maçã.

Apple Intelligence: expectativa vs. realidade

Aqui vai uma confissão: por mais criativa e conceitualmente apropriada que seja, a brincadeira de batizar a IA 1Inteligência artificial. da Apple como Apple Intelligence soou meio brega. Divertidinha, maaaas… meio brega.

Publicidade

E arriscada, também. Pense na quantidade de vezes que “it just works”, o bordão favorito de Steve Jobs, foi subvertido e utilizado ironicamente ao longo das últimas décadas sempre que um produto, app, sistema ou serviço da Apple pipocou.

Ao batizar sua IA de Apple Intelligence, a empresa precisa estar muito certa de que as suas soluções não deixarão a desejar, sob risco de ver seu novo termo virar sinônimo de incompetência 2Alô, Siri!, ao invés de algo mágico e proprietário, como é a intenção.

Dito isso, as perspectivas são boas. Olhando para a lista de desejos que eu polvilhei ao longo dos últimos meses em que escrevi sobre IA, foi impossível não me animar e ver que, por mais que tenha demorado, a Apple parece ter feito a lição de casa em múltiplos aspectos para dar às suas atrasadas IAs a melhor chance possível de sucesso.

Agentes: ✅

No artigo “Se o Ferret-UI der olhos à Siri, os agentes podem lhe dar um cérebro”, eu explorei como um recém-anunciado modelo de IA da Apple, capaz de compreender elementos de interface, poderia ser o ponto de partida para uma função ainda mais avançada que agiria dentro de aplicativos, em nome do usuário. Mencionei inclusive os App Intents, que foram uma primeira tentativa (meio fracassada) de permitir interações entre a Siri e os aplicativos.

Pois bem. Na última semana, a Apple explicou que não só pretende dar à Siri a habilidade de um agente, como também levará em conta o histórico de conversas e de arquivos do usuário 3Alô, Microsoft Recall! para executar ações como as dos exemplos na imagem acima. Além disso, a API 4Application programming interface, ou interface de programação de aplicações. de App Intents será atualizada, levando essas novas habilidades a apps de terceiros! O potencial disso é enorme para aproximar o uso da Siri daquele que sempre vimos e invejamos em filmes de ficção científica, ou pelo menos da proposta inicial da Siri de 2011.

APIs: ✅

Na semana passada, eu escrevi sobre como seria essencial que a Apple permitisse que apps de terceiros tivessem acesso às suas novidades de IA (fosse por APIs ou extensões do sistema), mas registrei meu ceticismo sobre quanto acesso ela daria em um primeiro momento.

Felizmente, precisou de pouco tempo para essa preocupação se provar excessiva. Dos novos App Intents, à API do Image Playground, passando pela disponibilização das ferramentas de escrita generativa em apps de terceiros, a Apple mostrou que sabe que não basta criar bons recursos para si própria, e que o verdadeiro poder de equipar seus produtos com IA está nas possibilidades que isso abrirá para todos os outros apps que nós usamos diariamente. Isso, é claro, se tudo funcionar como a Apple demonstrou no evento.

Múltiplos LLMs: ⏳

No artigo “Esqueça o Gemini: o iPhone precisa mesmo é de uma loja de LLMs” 5Escrito quando o rumor mais atual era de que a Apple havia pausado as negociações com a OpenAI e vinha conversando com o Google para implementar o modelo Gemini nos iPhones., eu fiz a seguinte colocação: e se, ao invés fazer apenas acordos individuais com um ou outro fornecedor de LLM 6Large language model, ou grande modelo de linguagem., a Apple permitir que o usuário escolha quais LLMs ele quer que complementem a IA nativa do sistema?

Na última segunda-feira, a Apple nos entregou um acordo e uma promessa. O acordo, é claro, foi com a OpenAI — e não com o Google. Já a promessa, desprovida de detalhes, foi de que: “Nós também pretendemos adicionar suporte a outros modelos de IA no futuro.”

Publicidade

No dia seguinte, perguntado sobre isso pelo jornalista Michael Grothaus em entrevista à Fast Company, Federighi disse o seguinte:

Publicidade

Por exemplo, se eu sou um médico, talvez um dia eu queira implementar um modelo de medicina; ou se eu sou um advogado, talvez exista algum modelo com refinamento para trabalhos legais que eu queira incluir na experiência. Nós vemos isso como algo bastante complementar ao que estamos fazendo com inteligência pessoal.

Não é exatamente a promessa de uma loja de LLMs, mas já é um ótimo começo para quem deseja múltiplos LLMs a serem usados em diferentes momentos. Unir os modelos locais da Apple, as parcerias para implementar bons modelos de conhecimento geral, e a possibilidade de o usuário escolher quais outros modelos com refinamentos específicos devem compor o leque de LLMs do iPhone, pode ser algo verdadeiramente poderoso.

Sustentabilidade: ⏳

No mês passado, na coluna “Como fica o projeto Apple 2030 na era dos iPhones com LLMs?”, eu explorei o que seria do compromisso da Apple de zerar o impacto ambiental da sua operação até o ano 2030, agora que ela estava entrando em um mercado quase tão ambientalmente dispendioso quanto o de criptomoedas. Além disso, também observei que nenhum evento recente de uma gigante da tecnologia trouxe um segmento sobre o meio ambiente. E na keynote da WWDC24 não foi diferente.

Por outro lado, perguntado sobre os servidores do Private Cloud Compute 7Que irão lidar com os pedidos com os quais o modelo local da Apple não consiga resolver. pela YouTuber iJustine na segunda-feira, Federighi disse que “os data centers rodam em energia 100% renovável”. O liveblog completo do evento, incluindo essa afirmação de Federighi, pode ser encontrado na cobertura do The Verge.

Isso aparentemente indica que a questão do impacto de carbono nos servidores está resolvida, mas ainda há trabalho a fazer. Primeiro, porque a Apple ainda não falou sobre o impacto energético que ela prevê com a integração de uma IA local à Siri que, atualmente, já recebe 1,5 bilhão de consultas todos os dias.

Em segundo lugar, existe a questão da parceria com a OpenAI. Eu não sei quanto a você, mas a OpenAI não me parece exatamente preocupada neste momento com o impacto ambiental das suas iniciativas, o que suplanta o incentivo de sustentabilidade que a Apple prega em suas próprias operações.

É bem verdade que, ambientalmente, a Apple faz mais do que qualquer concorrente, e é bastante provável que ela consiga manter seus objetivos ambientais mesmo com o dispêndio extra causado pelas IAs. Mas enquanto ela própria não disser algo sobre isso, vale segurar o ✅.

Ecossistema: ✅

No artigo “E se não houver ‘Siri GPT’ nenhuma?”, eu explorei que, por mais que fosse desejável ter uma Siri mais competente nos nossos iPhones, poderia ser ainda mais interessante ver as manifestações de IA da Apple de forma descentralizada, permeando os aplicativos e sistemas operacionais.

Felizmente, assim será. Por mais promissora que seja a ideia de perguntar algo à Siri e, incrivelmente, ela responder direito, será infinitamente mais útil lidar com IA generativa diretamente no contexto dos apps que já utilizamos, das conversas que tivemos e dos arquivos que visualizamos, tendo na Siri a capacidade de compreender e de resgatar esses contextos para executar ações complementares.

Personalização: ✅

Existe uma frase que encapsula bem o que eu desejava ver do LLM da Apple quando eu escrevi o artigo “O ‘Siri GPT’ provavelmente não funcionará como você imagina”:

O verdadeiro poder de algo como um “Siri GPT” provavelmente se apoiará em dois pilares: integração com o sistema, e fine-tuning com os dados do usuário 8Ou ajuste fino, termo usado para a técnica de complementar os dados gerais de treinamento de um modelo, com dados mais específicos e relacionados com a tarefa que aquele modelo em particular terá de cumprir..

Muito bem. De todas as expectativas correspondidas na última semana, talvez essa seja a mais satisfatória. Em múltiplos momentos ao longo do keynote de segunda-feira, a Apple explicou como irá catalogar semanticamente tudo o que o dispositivo sabe a respeito do usuário para identificar dados relevantes, alimentar às IAs e retornar resultados (ou disparar ações) contextualmente apropriados.

Mais do que todo o resto junto, aqui, resta torcer muito para funcionar tão bem quanto a Apple prometeu.

E agora?

Quem acompanha a Apple há mais tempo sabe que sempre existe uma diferença entre o que ela promete e a forma como ela entrega. Depois de começar a usar alguma novidade — por mais empolgante que ela seja —, sempre existem detalhes e limitações 9Muitas vezes sob os pretextos de segurança e de privacidade. que tornam a coisa menos eficiente ou menos útil do que ela poderia ser.

Eu não tenho dúvidas de que, aqui, não será diferente. Isso sem mencionar a pergunta que está na cabeça de todos os interessados: quanto tempo levará para que nós possamos de fato tirar proveito de tudo o que foi anunciado? E em português? E não podemos esquecer que é uma pena que haja uma limitação tão estrita do acesso ao uso, especialmente por parte dos iPhones. Da mesma forma, é decepcionante saber que parte do modelo tenha sido treinada com materiais coletados na web sem autorização prévia. E fico extremamente curioso para ver como a Apple irá lidar com as inevitáveis questões de mau uso da ferramenta Image Playground.

Dito tudo isso, analisando toda a estrutura que a empresa montou e, especialmente levando em conta que ela foi muito além do que qualquer concorrente na mesma escala já foi nos quesitos segurança e privacidade (como tende a ser quando o assunto é a Apple) — mesmo estando absurdamente atrasada —, não faltam motivos para estar otimista. A entrada da Apple na era da IA generativa é um divisor de águas não apenas na escala da operação da companhia, mas no que isso significa para todos nós em questão de produtividade, lazer e usabilidade dos nossos produtos.

A questão que fica é: e agora? Digo isso porque o anúncio de todas essas IAs não foi a conclusão, mas sim o início de um longo processo. E, ao mesmo tempo que estou ansioso para testar tudo o que ela anunciou, já fico curioso para descobrir o que virá a seguir, quando a Apple finalmente estiver com tempo suficiente para alcançar a concorrência onde quer que ela esteja.

Notas de rodapé

  • 1
    Inteligência artificial.
  • 2
    Alô, Siri!
  • 3
    Alô, Microsoft Recall!
  • 4
    Application programming interface, ou interface de programação de aplicações.
  • 5
    Escrito quando o rumor mais atual era de que a Apple havia pausado as negociações com a OpenAI e vinha conversando com o Google para implementar o modelo Gemini nos iPhones.
  • 6
    Large language model, ou grande modelo de linguagem.
  • 7
    Que irão lidar com os pedidos com os quais o modelo local da Apple não consiga resolver
  • 8
    Ou ajuste fino, termo usado para a técnica de complementar os dados gerais de treinamento de um modelo, com dados mais específicos e relacionados com a tarefa que aquele modelo em particular terá de cumprir.
  • 9
    Muitas vezes sob os pretextos de segurança e de privacidade.

Ver comentários do post

Compartilhe este artigo
URL compartilhável
Post Ant.

MM Fórum: Mac mini não atualiza, iPhone 13 no lugar do 11 e mais!

Próx. Post

Como é a experiência de migrar do iPhone XR para o iPhone 13 em 2024?

Posts Relacionados