A OpenAI lançou hoje o GPT-4o (“o” de “omni”), uma nova versão da sua inteligência artificial generativa — agora com capacidades de texto, visão e áudio. Segundo a empresa, o novo modelo é um grande avanço na IA e conta com melhorias em diversas áreas.
Durante a apresentação, a CTO 1Chief technology officer, ou diretor de tecnologia. da OpenAI, Mira Murati, destacou seu potencial, focando na capacidade de entender voz, texto e imagens. Segundo ela, isso é fundamental para moldar o futuro da interação humano-máquina.
Ainda de acordo com Murati, o GPT-4o é capaz de fornecer respostas 2x mais rápido e é 50% mais barato que a versão anterior, o GPT-4 Turbo. Este modelo, inclusive, analisava imagens e texto, mas não suportava áudio.
O ChatGPT agora usa o GPT-4o e traz uma experiência “mais natural e interativa”. Ele pode conversar em tempo real e em diferentes idiomas, como se fosse uma pessoa, além de responder a perguntas sobre imagens com mais precisão.
Com o lançamento do GPT-4o, a OpenAI introduziu uma nova interface para o ChatGPT na web e uma versão desktop para o macOS. O app, contudo, ainda não foi disponibilizado oficialmente e deverá chegar “nas próximas semanas”, de acordo com a empresa — vale notar que assinantes do plano Plus terão prioridade.
Estamos lançando o aplicativo macOS para usuários Plus a partir de hoje e o tornaremos mais amplamente disponível nas próximas semanas. Também planejamos lançar uma versão para Windows ainda este ano.
Ainda segundo um engenheiro da companhia, o aplicativo é totalmente nativo, tendo sido construído a partir de estruturas como SwiftUI e AppKit. Uma versão para Windows está prevista para ser lançada ainda este ano.
Agora, também, os usuários gratuitos do ChatGPT têm acesso à GPT Store, na qual podem encontrar chatbots de terceiros, além de recursos como a capacidade de o sistema lembrar informações, que antes eram pagos.
A companhia anunciou que o GPT-4o chegará tanto à versão gratuita do ChatGPT quanto para assinantes dos planos Plus e Team, que terão um limite de mensagens 5x maior; uma melhoria na experiência de voz para usuários Plus chegará em breve.
Coincidentemente (ou não), nós comentamos que a Apple e a OpenAI estariam finalizando um acordo para integrar o ChatGPT ao iOS 18 e possivelmente a outros sistemas operacionais da empresa.
O passo tomado pela OpenAI de disponibilizar o GPT-4o para todos os usuários pode “casar” com o rumor que a Apple poderá apresentar a novidade já na WWDC24, marcada para a segunda semana de junho. O evento deverá ser palco para a Maçã revelar também possíveis outros recursos de IA, incluindo melhorias para a Siri, transcrição de áudio e edição de fotos. Por ora, ambas as empresas não comentaram o assunto publicamente.
Notas de rodapé
- 1Chief technology officer, ou diretor de tecnologia.