Dopo aver parlato del content spam, di quelle che possono essere considerate le difese a monte, vediamo oggi cosa si può fare per bloccare i contenuti spazzatura anche se lo spammer (umano o software che sia) è effettivamente riuscito a inserire il contenuto nel sistema.
Difese a valle
Esistono dei software che analizzano automaticamente i contenuti e soprattutto i commenti proposti cercando di individuare quelli dal contenuto sospetto. Il principe di questi software è Akismet, creato dal papà di wordpress, gratuito in certi casi e forte dell’esperienza maturata analizzando miliardi di messaggi.Non si tratta di chiudere la stalla dopo che i buoi sono scappati, i commenti e i messaggi che non passano il controllo di Akismet possono essere dirottati nella spazzatura senza essere pubblicati.
L’obiettivo dei content spammer è di inserire un link dal vostro sito diretto al sito che vogliono promuovere, è quindi qualcosa profondamente diverso da quello che avviene dai messaggi di posta indesiderati: in quest’ultimo caso infatti gli spammer stanno cercando di vendere un prodotto, di farvi installare un software, di farvi cliccare su un link o di truffarvi in qualche modo, per fare questo faranno di tutto per farsi notare, nel caso del content spam succede esattamente il contrario, cercheranno di passare inosservati magari con una velata lusinga, cercando di postare un commento tipo “grazie dell’articolo, bel post” o qualcosa del genere ma quello che a loro interessa veramente è veder pubblicato il link che in qualche modo inseriranno insieme al contenuto, in firma o nel corpo del commento ad esempio.
Se un contenuto di questo tipo supera i controlli e viene pubblicato nel vostro sito ne avete un doppio danno: prima di tutto state regalando della pubblicità e del PR al sito dello spammer e poi rischiate di compromettere la credibilità del vostro dominio: i motori di ricerca infatti individueranno quel link, un collegamento che voi avete pubblicato o approvato, vedranno quindi un collegamento tra il vostro sito e un altro che, nel migliore dei casi è un sito di dubbia di qualità e con un tema completamente diverso dal vostro (un casinò, un sito con contenuti pornografici o uno che vende un’imitazione di qualche farmaco sono i casi più diffusi) se non addirittura qualcosa di completamente illegale.
Akismet mette a disposizione dei programmatori delle API per cui il messaggio viene analizzato dai loro server passando attraverso centinai di controlli frutto dell’esperienza acquisita analizzando miliardi (letteralmente) di contenuti; se il messaggio supera i controlli le API restituiscono una luce verde e il contenuto può essere considerato pubblicabile, se viceversa non li passano restituiscono una luce rossa che indica un contenuto molto sospetto.
Akismet non è infallibile ma, nella nostra esperienza, sbaglia molto raramente e contribuisce ad eliminare in modo automatico il 98% della spazzatura. A titolo di curiosità segnaliamo che un nostro collega e amico guarda le statistiche di akismet considerandole un indice indiretto della popolarità di un blog: più un sito è popolare e frequentato maggiore sarà il numero dei messaggi bloccati da questo ottimo software.
Teoricamente akismet può essere utilizzato in qualsiasi sito e per qualunque tipo di contenuto, è particolarmente usato con wordpress dato che è compreso nell’istallazione base ma può essere utilizzato per la maggior parte dei CMS in circolazione.
Difese attive
Se avete voglia di partecipare attivamente alla guerra contro il content spam abbiamo un servizio da segnalarvi, si tratta del progetto honeypot (in inglese vaso di miele), si tratta di qualcosa di divertente e partecipando si ha la soddisfazione di contribuire con un ruolo attivo nella lotta alla mondezza del web.
Il progetto consiste nel creare delle esche per gli spammer creando degli indirizzi di posta elettronica fasulli o dei contenuti trappola sul vostro sito. Le informazioni pubblicate sono fatte apposta per ingolosire gli spammer e l’elenco di chi abbocca viene passato automaticamente ai server del progetto che, analizzando informazioni provenienti da tutti i siti che aderiscono volontariamente al progetto individuano i fattori comuni: nomi host, indirizzi ip ed altri elementi comuni. Tutto questo contribuisce alla creazione di un elenco di generatori di spazzatura che possono essere stroncati sul nascere, bloccandoli permanentemente dal sito.
Lascia un commento