O melhor pedaço da Maçã.

O rabbit r1 mostra exatamente o que esperar de um iPhone com IA

Na última terça-feira (23/4), a startup rabbit fez o evento de lançamento do seu dispositivo r1 em Nova York, com direito a uma transmissão (iniciada com mais de uma hora de atraso) no YouTube.

Publicidade

No evento, algumas dezenas de compradores do r1 assistiram a Jesse Lyu, CEO 1Chief executive officer, ou diretor executivo. e fundador da empresa, apresentar diversas funções do pequeno dispositivo laranja, incluindo algumas que ainda não estavam prontas durante o anúncio do produto em janeiro.

Ao longo de pouco mais de uma hora, Lyu elencou as principais capacidades do r1, e também ofereceu alguns spoilers do que vem por aí:

YouTube video

Tirando o constrangedor número musical no final, a apresentação foi interessante e, no mínimo, posicionou o r1 como o primeiro dispositivo AI-first que realmente funciona 2Lyu, por sinal, fez questão de reforçar múltiplas vezes como seu produto era melhor e mais rápido do que o Ai Pin. É verdade? Sim. Precisava chutar o cachorro morto? Não. Depois da quarta ou quinta vez, começou a ficar feio.. Ao final do evento, no entanto, uma coisa ficou bastante clara: até mesmo a rabbit já sabe que seu primeiro produto, por mais bem-aceito que venha a ser, terá um prazo de validade curtíssimo.

O LAM é o maior benefício do r1 — e também é a sua maior limitação

Do ponto de vista de tecnologia, a ideia mais interessante do rabbit r1 é o conceito do LAM 3Large action model, ou grande modelo de ação., derivado daquele sistema de agentes que eu explorei recentemente aqui e aqui.

Ao munir seu LLM 4Large language model, ou grande modelo de linguagem. com a habilidade de executar pequenas tarefas em sequência de forma autônoma, a rabbit deu ao r1 o poder de interagir sozinho com sites de plataformas e de serviços de uso cotidiano, como Uber, Amazon, Spotify e DoorDash.

Eu dei ênfase à palavra sites no parágrafo acima porque essa é uma limitação bastante significativa do r1. Assim como o coitado do Ai Pin que tanto apanhou na apresentação, o r1 não tem a habilidade de controlar os aplicativos no telefone do usuário.

Publicidade

Em vez disso, ele faz as vias de uma máquina virtual operada por um agente que navega sozinho, por exemplo, no site da Uber quando o usuário pede para chamar um carro, no site da Amazon quando a usuária pede para adicionar algo ao carrinho de compras, e assim por diante.

Publicidade

Ainda assim, existe uma ameaça existencial ao rabbit r1 que é só uma questão de tempo até que se concretize: é inevitável que os nossos iPhones e aparelhos Android passem a oferecer agentes nativos associados a um LLM, e esses agentes muito provavelmente irão interagir diretamente com os apps instalados.

Além disso isso, o rabbit r1 sofre do mesmo problema do Ai Pin: ele é apenas um envelope para um LLM que a empresa não controla, e funcionalidades como resumo avançado de notas, recuperação de informações relevantes em pesquisas e identificação de conteúdos e de objetos em imagens também passarão a existir muito em breve de forma nativa nos nossos telefones 5Algumas dessas coisas já marcam presença em telefones Samsung Galaxy e Google Pixel..

Sabendo disso, inclusive, Lyu dedicou o segmento final da apresentação para anunciar algumas outras ideias que a empresa vem investigando. E nenhuma delas parece envolver o r1.

Algumas outras ideias que a empresa vem investigando

De acordo com Lyu, se o LAM 1.0 foi feito para interagir com sites e sistemas, o LAM 1.5 levará isso para “o mundo analógico”. Interessante, certo?

Publicidade

O problema está no slide ilustrando o produto que abrigará esse tal LAM 1.5, e que até agora eu não consegui me decidir se foi uma brincadeira ou se era sério:

Digo isso porque achar que alguém usará uma pulseira com câmera para poder sair apontando para as coisas pela casa e dizendo, por exemplo, “ajuste o termostato para 21ºC” é loucura.

No entanto, se a rabbit embutir essa tal LAM 1.5 em um par de óculos conectados, no estilo dos Ray-Ban Meta Smart Glasses, a coisa soará infinitamente mais promissora.

Há questões importantes de privacidade a serem discutidas aqui? Sem dúvida. Ainda mais com o produto da Meta. Mas a essa altura, estou convencido de que óculos sejam o lugar mais adequado para se embutir um LLM com visão computacional. Não é uma questão de se eles chegarão ao mercado, mas sim de quando.

Já a segunda ideia apresentada por Lyu foi a de algo chamado Generative UI 6Generative user interface, ou interface generativa — uma referência ao termo Generative AI.. Aqui, o CEO disse que, assim como o iPhone quebrou a noção de ter um teclado físico permanente como parte integrante dos telefones, a rabbit pretende fazer o mesmo com aplicativos. Parafraseando o executivo:

Quando eu e outras 10 milhões de pessoas baixamos um app, ele é igual para todo mundo. A interface é fixa, e não permite que eu mude o tamanho de um botão, traga alguma função para a home, etc. Isso não é computação verdadeiramente pessoal. Por isso, estamos explorando um conceito de interface generativa, que permitirá customizar a experiência dentro dos apps, sem se prender ao layout definido pelo desenvolvedor.

De certa forma, isso não é diferente do que o Arc Browser possibilita com os utilíssimos Boosts, que basicamente deixam o usuário customizar de forma permanente como o código do site se comporta, adicionando, removendo ou modificando áreas, cores e conteúdos que ele queira (ou não queira) ver.

YouTube video

A diferença é que o Arc Browser faz isso em sites, e o que Lyu parece pretender é modificar aplicativos, valendo-se da experiência do LAM. Apesar da falta de detalhes técnicos sobre como de fato atingir esse objetivo, a ideia de usar IA para otimizar conteúdos individualmente para cada usuário é bem interessante.

Resumo da ópera

O rabbit r1 não parece ter um futuro muito promissor. Em janeiro, eu disse que ele não era é o futuro, mas sim parte do caminho — e seu lançamento apenas me confirma essa impressão.

É provável que, dentro de um ano, nossos telefones já ofereçam (ou estejam próximos de oferecer) nativamente tudo que o r1 oferece hoje em dia, e que boa parte das mais de 100.000 unidades vendidas já estejam acumulando poeira em mais de 100.000 gavetas por aí.

Ainda assim, eu não descartaria a rabbit como uma agente de influência no mercado de hardware para IA generativa. Apesar de cansativa, há valor na aura de inovação e de disrupção que Lyu tenta convencer a todos de que ele e sua empresa emanam. Ainda que a maioria de nós nunca chegue a comprar um produto da empresa, fico curioso para ver o que ela anunciará a seguir — nem que seja para ter uma prévia do que poderá chegar aos iPhones nos anos seguintes.

Notas de rodapé

  • 1
    Chief executive officer, ou diretor executivo.
  • 2
    Lyu, por sinal, fez questão de reforçar múltiplas vezes como seu produto era melhor e mais rápido do que o Ai Pin. É verdade? Sim. Precisava chutar o cachorro morto? Não. Depois da quarta ou quinta vez, começou a ficar feio.
  • 3
    Large action model, ou grande modelo de ação.
  • 4
    Large language model, ou grande modelo de linguagem.
  • 5
    Algumas dessas coisas já marcam presença em telefones Samsung Galaxy e Google Pixel.
  • 6
    Generative user interface, ou interface generativa — uma referência ao termo Generative AI.

Ver comentários do post

Compartilhe este artigo
URL compartilhável
Post Ant.

MM Fórum: recall de AirPods Pro, macOS Monterey em iMac de 2010 e mais!

Próx. Post

Confira alguns projetos de brasileiros vencedores do Swift Student Challenge 2024

Posts Relacionados