Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)Castaño Osorio, IvonneAmortegui Granada, John EdisonCastro Sánchez, Cristian CamiloOspina Burbano, Juan José2024-07-262024-07-262024https://repositorio.uniremington.edu.co/handle/123456789/3674Este documento tiene como objetivo implementar la metodología CRISP-DM de IBM, la cual es una guía para realizar proyectos de análisis de datos de manera organizada. Siguiendo una serie de pasos, esta metodología guía a lo largo de todo el proceso para lograr un objetivo propuesto, explicando por qué y para qué se realiza dicho análisis. Puesto en marcha un objetivo claro, se selecciona un enfoque o método analítico para resolver el problema planteado en el objetivo, eso significa que se deben identificar qué tipos de patrones serán necesarios para abordar el problema de manera más efectiva. Se extrae un conjunto de datos, los cuales se deben describir y verificar su calidad. La verificación de la calidad incluye la identificación de datos faltantes, inconsistencias y errores. Luego, se preparan los datos, seleccionando los necesarios y limpiándolos. La limpieza de los datos implica eliminar o corregir datos erróneos, manejar datos faltantes y transformar los datos en un formato adecuado para el análisis. Este paso garantiza que los datos cumplan con el objetivo indicado y ayuden a dar respuesta al problema inicial. En la etapa de modelado, se aplican técnicas adecuadas al tipo de análisis que se va a realizar. Esto puede incluir la construcción de modelos predictivos, machine learning, enfoques descriptivos u otros métodos estadísticos. Estos se entrenan con los datos preparados y luego se validan para asegurar su precisión y eficacia. Se revisan los modelos construidos para garantizar que cumplen con los objetivos del proyecto. Aquí se compara el rendimiento con los criterios de éxito definidos al inicio del proyecto y se decide si los modelos son suficientemente buenos para ser implementados. En resumen, la metodología CRISP-DM proporciona un marco estructurado y flexible que guía el análisis de datos desde la comprensión inicial del problema hasta la implementación de soluciones prácticas. A lo largo de la Metodología de la Ciencia de Datos, cada paso prepara el escenario para el siguiente. Esto asegura que cada paso del proceso esté alineado con los objetivos del negocio y que se obtengan resultados valiosos y accionables.16 p.application/pdfspaDerechos Reservados - Corporación Universitaria Remington, 2024MetodologíaAnálisisCiencia de datosMigraciónEconomíaAnálisis de datos para determinar el impacto de la huida humana y la grievancia grupal en la economía mundialTrabajo de grado - Pregradoinfo:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Análisis de datosAprendizaje automático (Inteligencia artificial)Control de calidad