segunda-feira, 22 de março de 2010

A luta contra o spam - no prelúdio de uma luta inglória


Em 2006 foram preparados uma série de ensaios e testes sobre formas de combater o spam:

dos quais destaco:
Claramente estamos no prelúdio de uma luta inglória face a uma actividade criminosa que afecta biliões de pessoas -- concretamente o E-mail spam:
E-mail spam, known as unsolicited bulk Email (UBE), junk mail, or unsolicited commercial email (UCE), is the practice of sending unwanted e-mail messages, frequently with commercial content, in large quantities to an indiscriminate set of recipients.
Em português:
  • email spam, conhecido por email (comercial) não solicitado, em massa, é a prática de envio de mensagens de email não solicitadas, normalmente com conteúdo comercial, ou de propaganda;
  • o spam é geralmente enviado em grandes quantidades, e para um elevado número de destinatários.
O fenómeno do spam
---
Este fenómeno ainda não é criminalizado por alguns países, e é de difícil aplicação na generalidade dos países que têm legislação para o efeito. Por diversos motivos, um dos quais a responsabilização de quem gere os servidores de email na rede -- porque potencialmente qualquer utilizador final pode enviar emails para qualquer destinatário. Pior, os computadores infectados com certos trojans agem como bots, podendo enviar, potencialmente milhares de mensagens a destinatários todos os dias. Neste caso são ambos vítimas.

O spam mail não contém necessariamente malware, ou virus; pode ser simplesmente uma mensagem inocente a apelar ao destinatário para comprar um relógio de luxo, comprimidos viagra, ou salientar que ganhou um concurso (de que certamente não se lembra) -- e portanto, basta clicar num link, e navegar no sítio que pretende ser, desta forma, ilegalmente publicitado.

O spam em números
---
O número de mensagens de spam é, per si, difícil de contabilizar. O primeiro argumento para este facto é que dificilmente se percebe se uma mensagem é spam, ou não, sem ler a mensagem.
Há heurísticas, tais como as utilizadas pelo SpamAssassin (um popular conjunto de scripts em Perl que classifica automaticamente mensagens com base no seu conteúdo e proveniência), que permitem com algum grau de exactidão, determinar se uma mensagem é não solicitada (spam), ou normal (ham). O resultado deste programa é um spam-score, ou simplificadamente, um score (pontuação). Valores acima de 7.0 são geralmente spam, valores entre 5.0 e 7.0 poderão ser, potencialmente, spam ("flagged as spam, but accepted"), valores inferiores a 5.0 indicarão ham.
Claro que existem falsos negativos, isto é, mensagens que não foram filtradas, e aparecem (unflagged spam), e falsos positivos, que é sempre problemático: mensagens legítimas, ilegalmente filtradas.

O número de mensagens de spam total é igual a:
  • mensagens spam filtradas pelo ISP (provedor de internet), as vítimas secundárias,
    +
  • mensagens que chegam aos destinatários (as vítimas primárias.)
Designo por vítimas primárias aqueles que tiveram o trabalho de excluir a mensagem da sua caixa de entrada com filtros adicionais, ou não querendo, acabaram por perder tempo a excluí-las manualmente. Outros, porém, também as vítimas primárias, acabaram por "aceitar" a publicidade.
As vitimas secundárias são de longe as que têm os maiores desafios pela frente, ou seja, os ISPs ou as empresas de comunicações, como a Google (Internet-based services and products), ou a Microsoft (Hotmail), Yahoo, etc.
Há diferentes números para o número total de mensagens de spam.
Estima-se que entre 50% a 80% do correio electrónico seja, actualmente, spam.
Esta informação inútil massiva, não é facilmente combatida.
Embora haja uma diversidade de métodos dissuasores e de combate ao spam, os spammers (quem pratica spam, ou explora sistemas para propagar spam) estão sempre um passo à frente.

Dados históricos
---
O email "moderno" vai fazer 40 anos. O RFC 822 (IEEE) que o descreveu data de 1982 (http://tools.ietf.org/html/rfc822).
É um documento de uma enorme simplicidade, de apenas 47 páginas. Decorre, provavelmente, daí, o seu sucesso.
O caminho para qualquer máquina enviar uma mensagem a qualquer outra estava traçado.
Foi definido o que se entendia por transporte de dados de email, o formato das mensagens, dos destinatários, e outras características. O protocolo (TCP/IP) que o transportava estava datado da mesma altura (RFC 821), designado "Simple Mail Transfer Protocol", ou SMTP.
Estava dado um passo de gigante, numa época onde ainda imperavam os micro-computadores como o ZX Spectrum, e o seu económico processador, Z80. A internet estava a crescer, naturalmente, sem obstáculos.
Esta simplicidade proporcionou, por um lado, a interoperabilidade, palavrão que significa, neste particular, que qualquer mensagem poderia chegar ao seu destino, sem barreiras.
Por outras palavras, sem autenticação nem encriptação:
  • quem diz que envia a mensagem, presume-se que é quem diz ser;
  • a mensagem é enviada em texto simples, sem qualquer verificação de validade ou plausibilidade.
O que parece, pode não ser, o que é talvez não o seja no destino.
Durante muito tempo qualquer servidor podia encaminhar qualquer mensagem para outro destino, sem restrições. Posteriormente designados "open relays", serviam de ponte para enviar mensagens indiscriminadamente a qualquer destinatário. Hoje em dia são raros (e proibidos, no verdadeiro significado da coisa), mas outros mecanismos igualmente simples, que utilizam esta maravilha tecnológica, o email, proliferam, quer para uso legítimos, quer para o abuso.

É como aqueles autocolantes amarelos que colocamos na caixa do correio, a dizer:
  • Publicidade não endereçada?, não obrigado.
Neste caso, o spam, tem um destinatário. É você. No seu próprio correio.

Um comentário:

Unknown disse...

Spamassassin Authority, learn more... here:

http://www.cloudmark.com/en/serviceproviders/authority-spamassassin.html