Deep Web – O “lado oculto” da internet

Deep Web – O “lado oculto” da internet

A internet possui um “lado oculto”: muitos arquivos não são encontrados quando pesquisados nos buscadores, como Google, Bing ou Ask. Fm – o que inclui arquivos científicos, livros raros e até mesmo vírus. Tudo isso porque os dados que percorrem a rede mundial de computadores vão além do que é mostrado nessas ferramentas conhecidas como Crawnlers. Esse “bloqueio” ocorre devido à Deep Web .

Não entendeu? Para acessar um site, as pessoas digitam um endereço nominal, ex: www.receita.fazenda.gov.br, mas como o endereço da página está hospedado em uma máquina com IP, você também pode acessar o site pelo IP dessa máquina, que no caso da Receita Federal é: 161.148.25.177.

Assim, os buscadores da web acessam esses servidores e rastreiam detalhadamente todos os conteúdos com permissão para serem acessados, mas têm conteúdos que só são permitidos quando o endereço do IP é digitado. Em alguns casos, é necessário navegadores específicos para o acesso.

De acordo com a pesquisa da empresa BrightPlanet, 95% dos dados disponíveis nesse “lado oculto” da web são páginas públicas, normalmente vindas de órgãos públicos, universidades e empresas.

Dentre os conteúdos que podemos encontrar nesse submundo da internet, o conteúdo da Deep Web pode ser classificado em uma ou mais das seguintes categorias:

Conteúdo dinâmico: páginas dinâmicas que são retornadas em resposta a uma requisição ou por meio de um formulário;

Conteúdo isolado: páginas que não possuem referências ou ligações vindas de outras páginas, o que impede o acesso ao seu conteúdo através de web crawlers (programa de computador que navega pela World Wide Web [www] de uma forma metódica e automatizada). Dizem que essas páginas não possuem backlinks (são links de entrada para uma página do site ou web);

Web privada: sites que exigem um registro e um login (conteúdo protegido por senha);

Web contextual: páginas cujo conteúdo varia de acordo com o contexto de acesso (por exemplo, IP do cliente ou sequência de navegação anterior). Muitos sites estão escondidos e não há possibilidade de acesso propositalmente;

Conteúdo de scripts: páginas que são acessíveis apenas por links gerados por JavaScript, assim como o conteúdo baixado dinamicamente através de aplicações em Flash ou Ajax;

Conteúdo não-HTML/texto: conteúdo textual codificado em arquivos multimídia (imagem ou vídeo) ou formatos de arquivo específicos que não são manipulados pelos motores de busca.

Atualmente, existem pessoas que fazem a manutenção de máquinas e alimentam esse conteúdo para várias finalidades, tanto a Polícia Federal quanto o FBI. Além disso,  outras polícias do mundo estão infiltradas "analisando” o que está sendo publicado, porque a Deep Web trouxe conteúdos ilegais, como propagandas de venda de drogas ilícitas, textos preconceituosos escritos por grupos radicais, pessoas ligadas à pedofilia e outros crimes.



Gostou? compartilhe!

LiveZilla Live Chat Software