Spam y Trackbacks

En el último incidente que tuve me recomendaron varias alternativas para reducir el spam que llega a este blog y desde el momento que puse en práctica algunas de éstas (cambiar el nombre de uno de los campos de los comentarios), el número de comentarios spam enviados directamente a wp-comments-post.php literalmente desapareció, pero todavía siguen llegando trackbacks no válidos.

En base a un archivo modificado de wp-trackback.php que me envió Maty, hice unos cambios a éste para que haga casi lo mismo que el plugin Trackback Validator, que básicamente verifica que el sitio que envía la petición contenga un enlace recíproco a la entrada a la que se hace referencia (ver el paper para mayores detalles). La limitación de este método, tal y como reconoce una de las personas que participó en ese proyecto, es que puede evadirse fácilmente de diferentes modos (con CSS, comentarios HTML, JavaScript, generación dinámica de contenidos, etc).

Estos días estuve recibiendo spam de distintos sitios (supongo del mismo spammer), que generan temporalmente enlaces para los trackbacks que envían, logrando de este modo pasar las validaciones de la presencia de enlaces recíprocos, vean por ejemplo las últimas líneas que aparecen en el siguiente log de acciones:

code:
[2007-09-26 06:29:52] 64.22.110.2
[2007-09-26 06:29:52] Array
(
    [title] => Web Hosting Reviews, Web Site Hosting
    [url] => http://sitio_eliminado/
    [excerpt] => I couldn\'t understand some parts of this article, but it sounds interesting
    [blog_name] => Web Hosting Reviews, Web Site Hosting
)

[2007-09-26 06:29:55] http\://www\.buayacorp\.com/archivos/edicion-12-de-architechture-journal/
[2007-09-26 06:29:55] Array
(
    [0] => <a href='http://www.buayacorp.com/archivos/edicion-12-de-architechture-journal/trackback/'>link 3656</a>
    [1] => link 3656
)

Una forma de mejorar este método de verificación de trackbacks supongo que sería añadiendo una lista negra de dominios/IP/palabras, aunque en realidad no sé si valga la pena implementar algo así por el momento, puesto que los comentarios/trackbacks que logran saltar esta primera comprobación, son capturados Akismet.

Spam en páginas de universidades

Luego del último problema que tuve con el spam en este blog, instalé -- como solución temporal -- Spam Karma; gracias a los reportes que brinda este plugin, veo que algunos spammers usan sitios crackeados de algunas universidades. En dos de tres sitios afectados que miré usan WordPress, obviamente esto no indica que la culpa sea de este CMS, sino que al parecer hacen uso de temas descargados desde sitios no confiables -- es sólo una suposición, podría ser cualquier cosa.

La siguiente lista muestra algunos dominios .edu que fueron baneados en algún momento por el mencionado plugin:

code:
mysql> select value from sk2_blacklist where value like '%.edu%' limit 10;
+----------------+
| value          |
+----------------+
| washington.edu |
| psu.edu        |
| usc.edu        |
| uci.edu        |
| tufts.edu      |
| simmons.edu    |
| jalc.edu       |
| upr.edu        |
| cmccd.edu      |
| rice.edu       |
+----------------+

Tomando como ejemplo uno de los sitios de la Universidad de Puerto Rico, se puede ver que alrededor de 160 páginas spam fueron indexadas por Google, Yahoo muestra 4 páginas de ese tipo y sorprendentemente Live Search devuelve sólo páginas sin spam -- no estoy seguro si el operador site hace lo mismo en los 3 buscadores.

Spam mediante trackbacks

Al parecer mi ausencia en el Blog hizo que los spammers se pongan a enviar más spam de lo que normalmente lo hacían, lo peor de todo es que -- al igual que otras ocasiones -- Akismet deja pasar casi todo.

Pequeña muestra del spam recibido
Pequeña muestra del spam recibido hasta el momento

Instalé WP-Morph con ciertas modificaciones, pero al parecer estos comentarios son enviados como trackbacks, así que el mencionado plugin no es de mucha utilidad en este caso.

Antes de recurrir a soluciones pesadas como Bad Behavior o Spam Karma 2 ¿Alguien conoce un plugin ligero que se encargue de este tipo de spam?

Los comentarios temporalmente entran en moderación

Hoy este -pequeño- blog recibió una cantidad considerable de spam en tan solo unas cuantas horas, lo peor de todo esto es que todos los comentarios pasaron como "buenos" sin que Akismet pueda hacer algo al respecto*.

Esta es una pequeña muestra del "ataque" de hoy:

Spam referer

Debido a que últimamente ando algo ocupado, he tomado la decisión de moderar los comentarios -al menos hasta que encuentre una solución, puesto que me resulta más fácil hacer eso que estar borrando manualmente el spam.

¿Alguien conoce o ha desarrollado algún plugin para evitar los spam floods?

*: Akismet se basa en los aportes que hacen diferentes bloggers al marcar un comentario como spam, pero si tienes la mala suerte de que nadie haya hecho ese trabajo sobre un comentario X, pues estás en problemas.