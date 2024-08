Uma vez que a inteligência artificial vem modificando em cheio a dinâmica da internet, grandes players estão revendo ou atualizando a forma como lidam com informações — principalmente em meio a discussões envolvendo propriedade intelectual desencadeadas pelo uso de dados em larga escala para treinar modelos de IA.

A Apple, por exemplo, passou a usar seu Applebot — lançado em 2015 para melhorar as sugestões da Siri e do Spotlight — para vasculhar a web em busca de conteúdos que possam ser usados para o treinamento de IA. Ao contrário da primeira versão (ainda em funcionamento), no entanto, a mais atual se tornou opcional recentemente.

A opcionalidade se dá graças à ferramenta denominada Applebot-Extended, que é uma extensão do Applebot a qual permite a sites e plataformas online informar à Apple que não desejam ter seus dados usados para treinamento de IA — algo que a Maçã vem chamando de “controle no uso de dados”.

Embora não impeça que o Applebot rastreie o site — isso ainda é necessário para indexá-lo aos resultados de pesquisa nas plataformas da Maçã —, o Applebot-Extended é visto na gigante de Cupertino como uma maneira de “respeitar os direitos dos editores”, afirmou uma assessora da empresa ao site WIRED.

Dois levantamentos compilados pelo veículo indicam que apenas cerca de 6% a 7% dos sites de alto tráfego ativaram o bloqueio — a maioria deles, sites de notícias e comunicação. Mesmo assim, apenas cerca de ¼ dos sites de notícias ativaram o Applebot-Extended, segundo levantamento do jornalista Ben Welsh.

Tais sites frequentemente levantam uma maior preocupação envolvendo direitos autorais sobre o conteúdo que publicam e tendem a liberar seus dados para IA apenas por meio de acordos financeiros tradicionais. Apenas a título de comparação, 53% desses sites bloquearam o bot da OpenAI e 43% o do Google, por exemplo.

Entre os sites que já optaram por bloquear o bot da Apple, estão veículos de notícias como o The New York Times, bem como redes sociais como o Facebook, o Instagram e o Tumblr — o que indica uma necessidade cada vez maior das empresas de IA de pagar por conteúdo factual de qualidade para alimentar seus modelos.