Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)Vélez Uribe, Juan PabloSánchez García, Cristian David2026-01-222026-01-222025https://repositorio.uniremington.edu.co/handle/123456789/8996Mediante técnicas de Big Data y el aprendizaje automático se desarrolló el siguiente proyecto, donde el objetivo principal es lograr hacer una eficiente identificación de correos electrónicos tipo Phising. El siguiente planteamiento tuvo como objetivo realizar una aplicación prototipo que permitió implementar una identificación manual de correos tipo Phishing, ya que esta sigue siendo una de las amenazas más frecuentes a los usuarios de internet. El identificador de correos tipo Phising se realizó utilizando Python y Term Frequency-Inverse Document Frequency (TF-IDF) para la captura de características del contenido dentro de los correos electrónicos, transformando este contenido en una representación numérica para su análisis. Después, se entrenó un modelo Multinomial Naive Bayes, que se caracteriza por su eficiencia en tareas de clasificación de texto, ya sea en datasets pequeños o medianos y por último se diseñó una interfaz gráfica inicial con Streamlit, para que cualquier persona pueda hacer uso de la aplicación. Este es un prototipo inicial, por lo que se plantea que pueda ser escalable en el tiempo utilizando técnicas de Big Data para capturar grandes cantidades de información, almacenarla y analizarla. Los resultados que se presentan en el siguiente documento son evidencia que incluso haciendo uso de modelos sencillos con el correcto uso de las herramientas, podemos identificar correos electrónicos tipo Phising y garantizar la seguridad de la información; ya sea personal o empresarial.23 p.application/pdfspaDerechos Reservados - Corporación Universitaria Remington, 2026Big dataCiberseguridadMachine learningPhishingClasificador de correosSistema de detección de correos phishing basado en big dataTrabajo de grado - Especializacióninfo:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Correo electrónicoSeguridad en computadoresCiberespacio