O melhor pedaço da Maçã.

Apple usou legendas de vídeos do YouTube para treinar sua IA [atualizado]

Midjourney
Logo da Apple sobre cérebro azul com conexões neurais em alusão a inteligência artificial (IA/AI)

Uma investigação da organização de mídia sem fins lucrativos Proof News descobriu que a Apple e outras empresas, que notadamente vêm encampando projetos com inteligência artificial (IA) — como Anthropic, NVIDIA e Salesforce —, usaram legendas de centenas de milhares de vídeos do YouTube para treinar seus modelos de IA.

Publicidade

Tais legendas estão compiladas em um conjunto denominado YouTube Subtitles (Legendas do YouTube, em tradução direta), o qual conta com conteúdo extraído de vídeos de canais educacionais, acadêmicos, de notícias e até mesmo de canais de tecnologia famosos, como o do YouTuber Marques “MKBHD” Brownlee.

A Apple, especificamente, descreveu o uso da Pile (conjunto de dados de código aberto para treinamento de IA que abriga o YouTube Subtitles) nos artigos e publicações sobre seus modelos. Os documentos revelam que a Maçã usou o conjunto para treinar a OpenELM, modelo revelado pela companhia em abril.

Ao entrar em contato com alguns dos YouTubers que tiveram as legendas dos seus vídeos incluídas no YouTube Subtitles, a Proof News descobriu que nenhum dos que foram contatados estava ciente de que conteúdos produzidos por eles haviam sido utilizados, prática que alguns classificaram como “roubo”.

Publicidade

Alguns especialistas argumentam que o Google poderia implementar maneiras para impedir que algoritmos especializados capturem a legenda de vídeos hospedados no YouTube. Procurada, a empresa afirmou apenas que tomou ações para evitar a tomada abusiva e não autorizada de materiais nos últimos anos.

A Apple, por sua vez, não respondeu aos pedidos de comentários da Proof News sobre o uso das legendas do YouTube em seus treinamentos de IA.

via 9to5Mac

Atualização, por Bruno Cardoso18/07/2024 às 08:50

Em resposta ao 9to5Mac, a Apple esclareceu que o OpenELM não está por trás de nenhuma de suas ferramentas de IA, incluindo a Apple Intelligence. Ainda segundo a empresa, o modelo — que é de código aberto — foi criado apenas para fins de pesquisa e para contribuir com o avanço desse tipo de tecnologia.

Publicidade

A Maçã já chegou a dizer no passado, vale lembrar, que todos os recursos da Apple Intelligence são treinados com base em “dados licenciados”, o que inclui “dados selecionados para aprimorar recursos específicos, bem como dados disponíveis publicamente coletados por nosso rastreador da web”.

Em outras palavras, garantiu a empresa, nenhum dos recursos apresentados pela Apple na WWDC24 foram desenvolvidos com a ajuda de legendas do YouTube.

Ver comentários do post

Compartilhe este artigo
URL compartilhável
Post Ant.

Minecraft: Beats Solo 4 ganham edição especial pelos 15 anos do jogo

Próx. Post

Update do Overcast traz novo visual e melhorias de performance [atualizado]

Posts relacionados