In un post precedente abbiamo parlato del content spam, vediamo oggi quali sono le difese per proteggere il proprio sito, forum, blog dallo spam.
Per riassumere brevemente: i messaggi di contenuto spazzatura che vengono postati sul vostro sito possono essere generati da software o (più raramente) da essere umani; a differenza dello spam che si riceve via e-mail in questo caso l’obiettivo non siete voi, gestori e/o proprietari del sito l’obiettivo degli spammer, loro mirano ai vostri visitatori e soprattutto ai motori di ricerca, quello che vogliono è avere dei link dal vostro sito.
Gli strumenti a disposizione per proteggersi da questo tipo di “infezioni” sono sostanzialmente di due tipi: difese a monte e a valle.
Difese a monte
Con il termine “difese attive” intendiamo qui quei sistemi di filtraggio che tentano di arginare gli spammer a monte bloccandoli prima che riescano a compilare i form necessari, in altre parole i captcha, ovvero qui test automatici che cercano di capire distinguere macchine da esseri umani e che nella maggior parte dei casi presentano in forma grafica numeri e caratteri da inserire in un campo di controllo, il più famoso e diffuso è sicuramente recaptcha, un servizio messo gratuitamente a disposizione da Google ma che purtroppo molti software antispam hanno imparato ad aggirare. E’ una lotta continua dato che il sistema è in continua evoluzione, Google aggiorna ma gli spammer non stanno a guardare e anche loro continuano ad aggiornare i loro software, generatori di spazzatura.
Oltre al famosissimo recaptcha ci sono innumerevoli altri software di questo tipo, li abbiamo visti tutti in azione e bisogna spezzare una lancia a favore di quelli più “artigianali”: per quanto semplice e banale possa sembrare un controllo creato ad hoc da un programmatore potrebbe nondimeno rivelarsi efficace dato che le agenzie che fanno dello spam una delle loro armi costruiscono software per riconoscere i sistemi antispam più diffusi, in altre parole non stanno prendendo di mira proprio il vostro sito, è più probabile che stiano cercando di inserire dei link sul vostro sito “per caso”, uno delle centinaia di migliaia della giornata.
I proprietari dei siti, soprattutto nella fase iniziale dello sviluppo e ancora di più se sono al loro primo sito odiano i captcha e insistono con i programmatori per non mettere nessun tipo di controllo (soprattutto nei moduli di richiesta informazioni e contatto) salvo poi cambiare idea, qualche mese dopo, in seguito alla ricezione di decine di migliaia di richieste di contatto contenenti pura immondizia. Succede infatti che il sito, prima o poi, finisce nell’elenco dei siti da scansionare da parte degli spammer e i loro software non vanno tanto per il sottile: appena trovano un form lo compilano e premono invio. Il loro non è un lavoro di fino, sparano a mitraglia sapendo di colpire qualcosa, prima o poi.
Un’altra tecnica “passiva” che può avere una certa efficacia è nascondere il tag generator. I software degli spammer infatti hanno imparato a riconoscere i CMS più diffusi come wordpress, joomla, phpbb. Quando trovano un sito che nel codice delle pagine mostra, ad esempio, di essere gestito da wordpress vanno a colpo sicuro sapendo esattamente come si chiamano e dove si trovano i campi per scrivere i commenti; qualcosa di simile avviene per tutti gli altri siti e alcuni webmaster ritengono che nascondere il CMS usato significa complicare un po’ la vita degli spammer.
Nella nostra esperienza questa tecnica, anche quando realmente permessa dalla licenza del CMS, ha un’efficacia molto limitata, pensiamo che in molti casi il webmaster consigli al cliente di usare questo trucchetto quasi per nascondere il fatto di aver utilizzato un cms per la costruzione del sito, come se ci fosse qualcosa di cui vergognarsi.
Molto più efficace invece usare la possibilità, prevista in tutti i CMS, di non pubblicare immediatamente un contenuto proposto (soprattutto se proviene da un utente che non ha mai contribuito prima al sito) ma lasciare sempre un controllo umano per l’approvazione del contenuto.
In uno dei prossimi articoli vedremo alcune delle possibili protezioni dal content spam “a valle”, conoscendo anche alcune realtà che possono dare qualche soddisfazione 🙂
Lascia un commento