Detección de correos electrónicos spam utilizando Machine Learning
oleh Alvaro Andres Romero Rojas @andress_romero_2004
- 111
- 0
- 0
Introducción
Construir un modelo de clasificación capaz de identificar si un correo electrónico es spam o no spam (ham), usando técnicas de procesamiento de lenguaje natural (NLP) y algoritmos básicos de Machine Learning.

Materiales
Python, Colab, Git
Detección de correos electrónicos spam utilizando Machine Learning
Este proyecto tiene como objetivo desarrollar un sistema de detección automática de mensajes spam utilizando técnicas de Machine Learning y procesamiento de lenguaje natural (NLP). El spam representa un problema recurrente en los sistemas de comunicación digital, ya que puede generar pérdidas de tiempo, riesgos de seguridad y una mala experiencia para los usuarios.
Para abordar este problema, se utiliza un dataset de mensajes SMS etiquetados como spam y no spam (ham), el cual permite entrenar modelos de aprendizaje supervisado. Los textos son preprocesados y transformados en representaciones numéricas mediante la técnica TF-IDF (Term Frequency – Inverse Document Frequency), que permite capturar la importancia de las palabras dentro del conjunto de datos.
Posteriormente, se entrenan y evalúan modelos de clasificación como Naive Bayes y Regresión Logística, los cuales son ampliamente utilizados en tareas de clasificación de texto debido a su simplicidad y eficiencia. El desempeño de los modelos se evalúa utilizando métricas como accuracy, precision, recall y F1-score, además de la matriz de confusión.
Finalmente, los resultados obtenido

1 komentar
Masuk atau bergabung Gratis untuk berkomentar