CRISP-DM aparece en casi todos los cursos de ciencia de datos.
Business Understanding, Data Understanding, Data Preparation, Modeling, Evaluation, Deployment.
Suena lineal y ordenado, pero en la práctica no lo es.
CRISP no es un flujo, es un ciclo de fricción constante.
Y eso es bueno.
- Business Understanding no es una reunión inicial
En teoría, el proyecto empieza entendiendo el problema de negocio.
En la práctica, el “problema” suele venir formulado como:
- “Necesitamos un modelo predictivo”
- “Queremos usar IA”
- “Queremos algo con GenAI”
Eso no es un problema, es una solución disfrazada.
La fase de Business Understanding real implica:
- redefinir el problema en términos medibles,
- entender qué decisión se quiere mejorar,
- y algo clave: entender qué pasa si el modelo falla.
Si esta fase se hace mal, el resto del proyecto será técnicamente correcto y estratégicamente irrelevante.
- Data Understanding es donde empiezan las sorpresas
Aquí es donde CRISP deja de ser teoría.
Los datos:
- no están completos,
- no están documentados,
- no representan exactamente el proceso de negocio,
- o cambian sin aviso.
En la práctica, Data Understanding y Data Preparation se mezclan constantemente.
Y muchas veces regresan a Business Understanding porque descubres que el problema planteado no es viable con los datos existentes.
CRISP no es lineal. Es iterativo.
- Modeling no es el centro del proyecto
Uno de los mayores mitos es que el modelado es “la parte importante”.
En proyectos reales, modelar suele representar una fracción del esfuerzo total. Lo que consume tiempo es:
- limpiar
- redefinir métricas
- alinear expectativas
- ajustar supuestos
- explicar resultados
- Evaluation no es sólo performance
En libros, Evaluation significa revisar métricas.
En la práctica, significa responder preguntas incómodas:
- ¿Este modelo realmente mejora la decisión?
- ¿Qué pasa en escenarios extremos?
- ¿Es estable en el tiempo?
- ¿Qué riesgos regulatorios existen?
Aquí es donde muchos proyectos “técnicamente buenos” se caen.
- Deployment no es el final
CRISP termina en Deployment, pero en proyectos reales ese es el inicio de otra etapa:
- monitoreo
- detección de drift
- ajustes
- reentrenamiento
- gobierno
Un modelo sin monitoreo es un experimento en producción.
Y si lo conectas con gobierno de modelos, Deployment no es sólo poner en producción, es hacerlo observable y controlable.
Lo que he aprendido usando CRISP en la práctica
- Es más iterativo de lo que parece.
- La mayor parte del valor se define antes de modelar.
- El éxito depende más de claridad de negocio que de sofisticación algorítmica.
- Sin gobierno y monitoreo, CRISP se queda incompleto. CRISP-DM sigue siendo uno de los marcos más sólidos para proyectos de datos, pero su poder no está en seguir las fases como checklist, sino en entender que cada fase conversa con las demás.
Cuando se usa bien, no estructura sólo el proyecto.
Estructura la conversación entre datos y negocio.
Top comments (0)