segunda-feira, 28 de abril de 2008

Filtro automático de conteúdo usando o SquidGuard

Filtro automático de conteúdo usando o SquidGuard



Um dos grandes problemas para quem administra redes com muitos usuários acessando a web, sobretudo em escolas e empresas é restringir o acesso a alguns tipos de conteúdos. Bloquear domínios e endereços IP individuais funciona bem para bloquear páginas específicas, mas não funciona para bloquear páginas pornográficas, por exemplo, simplesmente porque existem muitas delas e você iria morrer louco se tentasse bloquear todas manualmente.

Existem grupos destinados a manter listas com URLs de páginas pornográficas, páginas de cassinos e jogos e páginas ilícitas em geral, que são atualizadas freqüentemente. Por serem construídas através da combinação dos esforços de muitas pessoas, auxiliadas por ferramentas semi-automáticas de indexação e classificação de conteúdo, estas listas permitem bloquear a maior parte das páginas ilícitas sem muito esforço. Apenas a lista mantida pelo Shalla Security possui mais de 1.5 milhões de URLs cadastradas, que formam um arquivo compactado de 9 MB.

A lista mais usada é provavelmente a MESD blacklists, que é a indicada pela equipe do SquidGuard, por ser completamente livre e utilizável para qualquer fim. Ela tem pouco mais de 1 milhão de links e pode ser baixada no: http://squidguard.mesd.k12.or.us/blacklists.tgz.

Outra lista muito usada é a Shalla's Blacklists, disponível no: http://www.shallalist.de/. A lista é livre para uso pessoal ou não comercial e é mais completa que a lista do MESD, com mais de 1.5 milhões de URLs. Uso comercial é permitido desde que você preencha um contrato de uso, sem custo.

Outra opção é a lista do URLBlacklist.com. Ela é uma lista comercial, que conta com mais de 2 milhões de links e é atualizada regularmente, contando inclusive com um script de atualização automática. A assinatura custa de US$ 6 a US$ 55 mensais, de acordo com o tipo de uso.

Estas listas nada mais são do que longas listas de links, com um por linha. Elas até podem ser usadas diretamente no Squid, através da opção url_regex (a mesma que usamos para criar uma lista de sites bloqueados), mas, por serem arquivos muito grandes, o desempenho seria ruim, já que o Squid processa cada linha dos arquivos a cada acesso, o que consome muito processamento.

Entra em cena então o SquidGuard, que permite usar longas listas de URLs, com milhões de links sem uma grande perda de desempenho. Ele permite integrar listas gigantescas como os três exemplos anteriores sem comprometer o desempenho do seu servidor proxy. As listas se encarregarão de bloquear a maior parte das páginas impróprias e você poderá fazer ajustes manuais conforme necessário. A página do projeto é a: http://www.squidguard.org.

Nos próximos dias teremos um tutorial mais completo sobre a instalação e o uso do SquidGuard, até lá :)


Comente em: http://www.guiadohardware.net/comunidade/filtro-automatico/859682/




Postado por Carlos E. Morimoto em 24/04/2008 às 06:47



Fonte: GuiadoHardware.net

2 comentários:

Eli Afonso disse...

O squidGuard é uma ótima solução, por usar o Berkley DB, ser leve, estável e maduro. O único problema esta na documentação ainda confusa. Mas nada que uma boa pesquisada no Google não resolva.
Estou usando a lista do site http://urlblacklist.com/?sec=download
Muito completa.

Meus blogs:
http://elirios.blogspot.com/
http://macetinhos.blogspot.com/

Squidblacklist disse...

Looking for a Porn Blacklist? Ask yourself, what good is your web filter if you are using junk free blacklists from shalla list?

--
Signed,

http://www.pornblacklist.com