Lista de palabrotas y spam
¿Os suena haber visto o conocéis una lista de "palabrotas" en inglés de esas que incluye términos que usan los spammers como viagra, cialis, fuck, cunt y todo eso?
Lo más que he encontrado son listas cortas de términos que se ponían antes en wordpress y tal para "detener los spammers", pero buscaba algo más extenso, tipo un .txt que pudiera bajar.
Había pensado en echar un vistazo al código fuente de algún programa de e-mail pero no estoy segura de que vaya a servir, ya que por ejemplo Thunderbird usa reglas "bayesianas" (o eso creo) y las palabras prohibidas dependerán de cada usuario.
Aunque debe haber un cuerpo común de palabras prohibidas para empezar. ¿Alguna pista? ¿Algún término nuevo por el que buscar en google? (ya he usado: swear words, spam keywords, y variaciones)
karramarro
EN la admin del wordpress viene este link.
http://codex.wordpress.org/Spam_Words
sole
No hay urls con palabrotas, hay e-mails con novedades mensuales cuyos titulos son "ofensivos".
Hmm, buscare por censored words list.
zigotica
sole
No, lo de las imagenes no servira. Son listas de canciones, pero las canciones a veces tienen palabrotas como Bitch (fucking assholes remix) o los artistas se llaman hoxton whores, y cosas asi.
Asi que los clientes no reciben el correo con las novedades, y por eso estaba buscando alguna lista de palabras para sustituirlas por ******.
Seguire buscando si eso...
mmmm lo dices porque la URL de las canciones lleva esas palabras? y no podeis servirlas desde otras URL? con eso y haciendo el listado usando imagenes...
zigotica
creo que lo que buscas es algo del estilo "palabras a evitar":
gratis, oferta, descuento, ...
mayúsculas en el subject
configuración de los SPF, reverse lookup, etc del email remitente
sole
No, lo de las imagenes no servira. Son listas de canciones, pero las canciones a veces tienen palabrotas como Bitch (fucking assholes remix) o los artistas se llaman hoxton whores, y cosas asi.
Asi que los clientes no reciben el correo con las novedades, y por eso estaba buscando alguna lista de palabras para sustituirlas por ******.
Seguire buscando si eso...
zigotica
pues usad imágenes servidas desde un servidor web (no adjuntas en el email)
yo lo que hago es recortar el diseño del email e ir poniendo imagenes (en el alt pongo el texto evitando las palabras raritas o sospechosas de causar bloqueo).
sole
No es para un formulario de entrada sino para enviar e-mails. Resulta que ciertos productos incluyen palabrotas y tenemos que ocultarlos porque si no los correos se quedan en la carpeta de correo basura.
Y no trabajo en una productora porno :D
Ni envio spam! :)
zigotica
dagi3d
hombre, entiendo que esto lo harán para sites más o menos grandes donde interese hacerlo y supongo que este método está enfocado sobre todo a lidiar con los <em>spiders</em> que van recorriendo la red en busca del formulario perdido
no, eso precisamente lo hacen con CUALQUIER formulario de contacto que envia email al propietario. saben que detrás hay un mail() y por tanto lo hackean. mira el mensaje de encima, explica por encima cómo. si lo hacen bien tu ni te enteras, solo por lo emails del bounce.
zigotica
porque ya la encontré online, es publica. l ounico que hice fue añadir algunas palabras. si hubiese funcionado lo colgaria online.
lo que no me importa colgar de momento es esto otro: haz un check de estas cadenas (extracto), indican con muy alta probabilidad un posible intento de hacking:
<code>...
eregi("\r",$email) ||
eregi("\n",$email) ||
eregi("%0A",$email) ||
eregi("Content-Type",$email) ||
eregi("text/html",$email) ||
eregi("multipart/mixed",$email) ||
...</code>
dagi3d
zigotica
<div class="quote">
dagi3d
<blockquote>por cierto, hace poco lei acerca de un método antispam bastante curioso que consistía en meter en el formulario un campo de texto 'trampa'. este campo se ocultaría al usuario usando css, y claro, si al servidor se enviaba ese campo rellenado, significaría que había sido enviado por un bot que no habría interpretado la hoja de estilos</blockquote>
</div>lo veo poco efectivo, los spammers normalmente siempre prueban los formularios manualmente, luego van modificando su script hasta poder usarlo a saco.
hombre, entiendo que esto lo harán para sites más o menos grandes donde interese hacerlo y supongo que este método está enfocado sobre todo a lidiar con los <em>spiders</em> que van recorriendo la red en busca del formulario perdido
dagi3d
y por qué enviarla al mail pudiendo colgarla en cualquier sitio y que quede ahí para la posteridad? :P
zigotica
dagi3d
por cierto, hace poco lei acerca de un método antispam bastante curioso que consistía en meter en el formulario un campo de texto 'trampa'. este campo se ocultaría al usuario usando css, y claro, si al servidor se enviaba ese campo rellenado, significaría que había sido enviado por un bot que no habría interpretado la hoja de estilos
lo veo poco efectivo, los spammers normalmente siempre prueban los formularios manualmente, luego van modificando su script hasta poder usarlo a saco.
zigotica
te puedo mandar un mail con un blacklist, que modifiqué añadiendo palabras. de todos modos ahora uso otro método (home brewed), una especie de doble optin que requiere de una persona para enviar realmente el formulario. desde entonces zero spam.
dagi3d
mira a ver esta lista, que aunque no hace referencia a palabras en concretas, se refiere a sitios de spam: http://meta.wikimedia.org/wiki/Spam_blacklist
también puedes intentar buscar por 'badwords' y 'black list'
de todas maneras, ¿para qué es ese filtro? si es para un formulario lo que yo te recomendariá sería meter un captcha que será siempre más fiable
por cierto, hace poco lei acerca de un método antispam bastante curioso que consistía en meter en el formulario un campo de texto 'trampa'. este campo se ocultaría al usuario usando css, y claro, si al servidor se enviaba ese campo rellenado, significaría que había sido enviado por un bot que no habría interpretado la hoja de estilos