O Google sabia que a web era grande… mas não tanto assim. Os últimos dados da gigante (agora maior ainda) de buscas revelam que a rede já é composta de mais de 1.000.000.000.000 (1 trilhão) de páginas (URLs) únicas. É isso mesmo: a cada nova busca que você realiza por lá, essa quantidade de páginas é varrida à caça das palavras-chave especificadas.
Quando o Google começou, em 1998, o número de páginas indexadas já era estronodoso: 26 milhões. Dali para 2000, ele já havia atingido a marca de 1 bilhão de URLs. Em oito anos, o crescimento acelerou-se desenfreadamente e hoje o número de páginas na web cresce na casa de alguns bilhões por dia!
Para achar tanta coisa assim, o Google segue o princípio básico de “seguir” cada link que acha nas páginas varridas: assim, ele só pára quando chega numa página com texto puro, sem qualquer conexão com outra página da rede.
E, acredite se quiser, o número de 1 trilhão de páginas exclui duplicatas identificadas pelos computadores do Google e serviços como um calendário online que, se você parar pra pensar, tem um número infinito de páginas — caso você fique clicando para avançar o mês sem parar.
“Estamos orgulhosos de ter o sistema de buscas online mais detalhado possível. Nossa meta sempre foi a de indexar todos os dados do mundo”, afirmaram
Imagine, então, o poder dos sistemas que tornam o Google possível e que hoje baixam todo o conteúdo da web contínua e diariamente. Eles gostam de comparar seu gráfico de 1 trilhão de URLs a um mapa rodoviário com 1 trilhão de interseções. Haja poder de processamento!