Para el desarrollo de un proyecto de ciencia de datos, es necesario contar con alguna metodología que permita realizar el trabajo de la manera más eficiente y controlada posible, bajo esta necesidad, encontramos la manera de llevar tu proyecto más allá, adaptando dos metodologías para poner mayor orden en tus proyectos, uniendo Scrum y CRISP-DM.
CRISP-DM es el modelo ideal para poner orden en tus proyectos, la cual, al igual que el framework Scrum, se presenta flexible y adaptable para definir de mejor manera las tareas a realizar y lo que se busca obtener, dando resolución a posibles problemas.
¿La diferencia? CRISP-DM usa la minería de datos como estrategia; donde se pretende obtener resultados fácilmente procesables, para convertirlos en procesos de negocios; estos datos son analizados para beneficiar la toma de decisiones con la ayuda de 6 fases:
- Comprensión del negocio.
- Comprensión de datos.
- Preparación de datos.
- Modelado.
- Evaluación.
- Despliegue.
Sabiendo esto, es posible que otorgues un mayor orden a tus proyectos uniendo Scrum y CRISP-DM, pues se complementan de la siguiente manera:
La comprensión del negocio y la comprensión de datos se relaciona con el armado del Product Backlog. Como hemos visto en otros artículos (Desarrollar el mejor product backlog), en resumen, en el Product Backlog se planifica, gestiona y prioriza la realización de tareas, de manera que se obtiene el seguimiento correspondiente, para poder identificar posibles problemas y cumplir con las expectativas de lo que se va a desarrollar.
Por otro lado, las etapas de: preparación de datos, modelado y despliegue, incluyen un tratamiento de datos, que se relaciona con el trabajo que se desarrolla a lo largo de un sprint. Como sabemos, un sprint es una iteración que se divide según periodos de tiempo de una a cuatro semanas, donde se pretende alcanzar un objetivo y finalmente ofrecer retroalimentación y mejora continua.
Y por último, la relación de la última etapa CRISP-DM: evaluación; se presenta en la reunión de sprint review, donde se obtiene una retroalimentación de una tarea desarrollada y terminada para completar y adaptar al proceso del Product Backlog, con la finalidad de ofrecer al cliente un resultado, aunque sea parcial, de lo que es está obteniendo con ayuda de la analítica y la metodología.
Uniendo Scrum y CRISP-DM, se obtienen beneficios considerables para ofrecer a las partes interesadas, pues ambas están diseñadas para el desarrollo ágil de software. Conforme se completa cada uno de los sprints, la visión que se tiene sobre el proyecto va evolucionando, a medida que se vuelve más fácil para el equipo comprender la cantidad de datos existentes y la disponibilidad de ofrecer una mejora en cada una de las entregas siguientes.
De manera gráfica, unir estas metodologías se presentan de la siguiente marea, unificando un objetivo que es ofrecer una entrega favorable y eficiente en los proyectos de ciencia de datos:
En conclusión, mientras que CRISP-DM nos funciona de guía para conocer lo que se tiene que entregar con base en la ciencia de datos, Scrum nos ayuda a crear y entregar un producto funcional en términos de satisfacción y eficiencia, dejando de lado el uso de metodologías tradicionales que resultan ser confusas o que en ocasiones no presentan el control que se desea obtener en el desarrollo de proyectos.
Uniendo Scrum y CRISP-DM, se da paso a ofrecer un control y comunicación efectiva entre los desarrolladores y los clientes, contar con capacidad reactiva e involucrar diferentes técnicas o herramientas que se adapten al modelo en el que se esté trabajando.