Talvez um dos primeiros aplicativos que ganharam popularidade no início da era dos smartphones foi o Shazam, hoje integrado nativamente ao iOS após ter sido adquirido pela Apple, em 2017. Com um funcionamento simples, o app oferece a possibilidade de algo quase “mágico”: revelar o nome de uma música que está tocando ao analisar apenas alguns segundos dela.
Por trás da “simples” descoberta das informações sobre a música, porém, há um complexo algoritmo, o qual foi detalhado em um vídeo do The Wall Street Journal. Nele, o cofundador do Shazam, Chris Barton, entre outras pessoas, contaram a história da empresa e o funcionamento do software que nos permite a descobrir nomes de músicas tão rápido.
Inicialmente, é interessante perceber que o Shazam em si é anterior ao próprio app. O serviço foi lançado em 2002 e funcionava por meio de uma chamada telefônica: ligava-se para um número, o qual identificava a música e retornava com as informações por SMS1Short message service, ou serviço de mensagens curtas.. Antes disso, músicas de mais de 100 mil CDs foram digitalizadas/compiladas por jovens contratados pela empresa.
Para identificar as canções, o algoritmo do app cria uma “impressão digital” de cada uma, de modo que o áudio das faixas é transformado em um espectrograma, que faz uma espécie de mapeamento das ondas e frequências sonoras da canção. Do mapeamento, os pontos mais importantes são os picos de áudio e, mais especificamente, a ordem deles ao longo da música.
Se fosse para pesquisar apenas por músicas que correspondessem ao mesmo padrão de picos — ou o espectrograma inteiro —, o processo duraria muito tempo e a usabilidade não seria tão boa. O sistema, então, procura na base de dados por múltiplos picos ao mesmo tempo, conectando-os em pares e buscando — nos dados — pares que combinem. Se houver combinações o suficiente, o resultado é dado.
Dessa forma, ao tocar para o Shazam identificar uma música, o sistema capta o áudio pelo microfone do aparelho, limpa o ruído de fundo e transforma o som em um espectrograma. Então, é feito o trabalho envolvendo os picos, até que se encontrem combinações dos pares, tudo isso em questão de segundos. E por mais complexo que seja o procedimento, são mais de 23 mil identificações por minuto.
Apesar dessa grande inventividade por trás do serviço, o cofundador da empresa afirmou que o negócio só passou a ser lucrativo em 2016, passando por períodos bastante difíceis financeiramente. O lançamento do app, em meados de 2008, segundo Barton, foi importante para que uma base de usuários pudesse ser conquistada — até que a empresa foi comprada pela Apple, como já comentamos.
Com a aquisição, o Shazam teve acesso a toda a biblioteca do Apple Music, o que fez com que o algoritmo fosse aprimorado e ficasse ainda mais abrangente. Com a integração ao iOS — por meio do recurso Reconhecimento de Música —, o serviço certamente solidificou a sua popularidade, reforçando-se como algo indispensável para o cotidiano.
Notas de rodapé
- 1Short message service, ou serviço de mensagens curtas.