talk to a human
Reading

Cómo Predecir Qué Deudores van a Incumplir con Machine Learning

Explicación completa de cómo el machine learning predice el incumplimiento de deudores, qué variables son clave y cómo las fintech de LATAM usan estos modelos para priorizar su cobranza.

Mar 17, 2026 - 11 min read

|

by ed-escobar Co-Founder & CEO

El desafío de predecir el comportamiento del deudor

Toda empresa que otorga crédito enfrenta la misma pregunta: ¿quién va a pagar y quién no? Históricamente, la respuesta llegaba después del hecho: cuando el deudor ya estaba en mora, cuando ya era demasiado tarde para una intervención preventiva efectiva.

El machine learning cambia esta ecuación. Los modelos predictivos modernos pueden identificar, con semanas o incluso meses de anticipación, qué deudores tienen alta probabilidad de incumplir su próxima cuota. Esa anticipación es oro para cualquier estrategia de gestión de cobranza: permite actuar antes de que el problema escale, con el tipo de intervención correcta y en el momento óptimo.

En este artículo explicamos cómo funcionan estos modelos, qué variables los alimentan y cómo las empresas financieras y fintech de LATAM están usando la IA para cobranza para transformar sus tasas de recuperación.

Qué es el modelado predictivo de incumplimiento

Un modelo predictivo de incumplimiento (o modelo de propensión a la mora) es un algoritmo entrenado con datos históricos que aprende los patrones que preceden al incumplimiento. Dado un conjunto de variables sobre un deudor específico, el modelo produce una probabilidad de que ese deudor incumpla en un período determinado (generalmente los próximos 30, 60 o 90 días).

Esta probabilidad se convierte en un score que puede usarse para priorizar la cartera: deudores con score alto de incumplimiento reciben atención proactiva antes de que fallen, mientras que los de score bajo pueden gestionarse con menor intensidad.

Variables que predicen el incumplimiento

Los modelos de machine learning para cobranza aprenden de docenas o cientos de variables. Aquí están las categorías más importantes:

Variables de comportamiento de pago

  • Historial de pagos en el tiempo (días de atraso promedio, frecuencia de mora)
  • Cantidad de veces que pagó justo al límite del vencimiento
  • Patrón de pagos parciales vs. totales
  • Velocidad de respuesta a gestiones de cobranza previas
  • Tendencia de comportamiento (¿mejora o empeora con el tiempo?)

Variables financieras

  • Monto de la deuda en relación con la capacidad de pago declarada
  • Número de productos financieros activos y nivel de endeudamiento total
  • Relación cuota/ingreso (ratio de servicio de deuda)
  • Cambios en el comportamiento bancario (disminución de saldos, aumento de disposición de tarjeta)

Variables de contexto e interacción

  • Respuesta a comunicaciones (abre emails, contesta llamadas, responde mensajes)
  • Cambios en datos de contacto (número de teléfono desactualizado es una señal)
  • Tiempo transcurrido desde el último contacto efectivo
  • Tipo de promesas realizadas y tasa de cumplimiento

Variables externas (cuando están disponibles)

  • Datos de bureaus de crédito: comportamiento en otras instituciones
  • Variables macroeconómicas: desempleo regional, inflación, variaciones de tipo de cambio
  • Datos de actividad empresarial (para créditos a PyMEs)
  • Estacionalidad: algunos períodos del año tienen mayor tasa de incumplimiento

Los algoritmos más usados en predicción de incumplimiento

No todos los modelos de machine learning son iguales. En el contexto de cobranza, los más usados son:

Gradient Boosting (XGBoost, LightGBM)

Los algoritmos de gradient boosting son los favoritos de la industria financiera por su capacidad de manejar variables mixtas, su robustez con datos desbalanceados (hay más pagadores que morosos) y su buen performance sin requerir feature engineering extenso. Son el estándar en competencias de predicción de riesgo crediticio.

Random Forest

Similar al gradient boosting en performance, con la ventaja de ser más interpretable. Permite identificar qué variables son más importantes para la predicción, lo que facilita la explicación de las decisiones a reguladores y deudores.

Redes neuronales y deep learning

Para grandes volúmenes de datos y cuando se incorporan fuentes no estructuradas (texto de conversaciones, imágenes de documentos), las redes neuronales pueden superar a los métodos tradicionales. Requieren más datos y más capacidad de cómputo.

Modelos de supervivencia

Los modelos de análisis de supervivencia (originalmente diseñados para medicina) son especialmente útiles para predecir no solo si un deudor va a incumplir, sino cuándo. Esto permite priorizar intervenciones según la urgencia.

Cómo se entrena un modelo predictivo de cobranza

El proceso de construcción de un modelo predictivo tiene varias etapas clave:

  • Definición del target: ¿Qué es exactamente lo que queremos predecir? (mora 30+, mora 60+, incumplimiento definitivo)
  • Recolección y limpieza de datos: Los datos históricos de comportamiento de pago son el insumo más valioso
  • Feature engineering: Crear variables calculadas que capturan patrones importantes (ej: tendencia de días de mora en los últimos 6 meses)
  • Entrenamiento y validación: El modelo aprende de datos históricos y se valida en un período de tiempo más reciente
  • Calibración del score: Transformar la salida del modelo en una probabilidad interpretable y accionable
  • Monitoreo continuo: Los modelos se degradan con el tiempo; necesitan reentrenamiento periódico

De la predicción a la acción: cómo usar los scores en cobranza

Un modelo predictivo sin una estrategia de acción asociada es solo un ejercicio académico. La clave está en convertir los scores en reglas de negocio claras:

Segmentación de cartera por score

  • Score alto (probabilidad alta de incumplir): Intervención proactiva, contacto preventivo antes del vencimiento, oferta de refinanciación
  • Score medio: Gestión de seguimiento estándar, monitoreo cercano
  • Score bajo: Gestión mínima, recursos concentrados en otros segmentos

Personalización del approach

El score de incumplimiento puede combinarse con otros modelos para definir no solo si contactar, sino cómo. Un deudor con alta propensión a incumplir pero con score de capacidad de pago saludable merece una oferta de refinanciación. Uno con baja capacidad de pago puede requerir una negociación de quita.

Kleva y la predicción de incumplimiento en la práctica

Kleva integra modelos predictivos de incumplimiento directamente en su plataforma de cobranza. Los algoritmos de scoring y priorización de cartera permiten a sus clientes:

  • Identificar deudores en riesgo antes de que fallen su primera cuota
  • Priorizar automáticamente qué deudores llaman los voice agents y en qué orden
  • Personalizar el mensaje y la oferta según el perfil de riesgo
  • Monitorear la evolución del riesgo de la cartera en tiempo real desde el dashboard de analytics

Con este enfoque, Kleva logra una tasa de éxito del 73% en sus gestiones, con más de $5M recuperados en la región. La clave está en que la tecnología interviene en el momento correcto, con el mensaje correcto y en el canal correcto para cada deudor.

Desafíos éticos y regulatorios del scoring predictivo

El uso de machine learning en cobranza no está exento de responsabilidades éticas y legales:

Sesgo algorítmico

Los modelos entrenados con datos históricos pueden perpetuar sesgos existentes. Si en el pasado ciertos grupos fueron tratados de manera diferencial, el modelo puede aprender esas diferencias injustas. Las empresas deben auditar sus modelos para detectar y corregir sesgos.

Transparencia y explicabilidad

En varios países de LATAM, los reguladores están prestando cada vez más atención a los modelos de decisión automatizada en crédito y cobranza. Las empresas deben poder explicar por qué un deudor recibe cierto tratamiento, lo que favorece el uso de modelos más interpretables.

Protección de datos

Los datos usados para entrenar modelos predictivos deben estar protegidos según las leyes de privacidad de cada país. La minimización de datos (usar solo lo necesario) es un principio importante.

El futuro: modelos en tiempo real y aprendizaje continuo

La próxima frontera en predicción de incumplimiento es el aprendizaje continuo: modelos que se actualizan en tiempo real con cada nueva interacción, sin requerir ciclos de reentrenamiento periódicos. Esto permite que el sistema adapte sus predicciones a cambios bruscos en el comportamiento de los deudores, como los que ocurren durante crisis económicas.

Kleva está a la vanguardia de esta evolución, integrando señales en tiempo real de sus 900,000+ minutos mensuales de conversaciones de cobranza para enriquecer continuamente sus modelos predictivos.

Conclusión: predecir para actuar a tiempo

La predicción de incumplimiento con machine learning no es ciencia ficción: es una capacidad disponible hoy para cualquier empresa financiera que tenga datos históricos y acceso a la tecnología correcta. Las empresas que la adoptan no solo mejoran su recuperación de deuda LATAM; también reducen el costo de la gestión al concentrar recursos donde más impacto generan.

La cobranza inteligente del futuro combina predicción precisa con acción oportuna. Kleva es la plataforma de cobranza que hace posible esa combinación para empresas financieras en toda LATAM.

Preguntas frecuentes sobre machine learning en cobranza

¿Cuántos datos históricos se necesitan para construir un modelo predictivo de incumplimiento?

Depende de la calidad y variedad de los datos, pero en general se necesita al menos 1-2 años de datos de comportamiento de pago con suficientes casos de incumplimiento para entrenar el modelo. Plataformas como Kleva tienen modelos preentrenados que pueden adaptarse a datos específicos de cada cliente.

¿Con qué precisión puede un modelo predecir el incumplimiento?

Los mejores modelos en industria financiera alcanzan AUC-ROC de 0.75 a 0.85, lo que significa que en 75-85% de los casos ordenan correctamente qué deudores van a incumplir vs. los que no. Es significativamente mejor que el azar (0.5) y que los métodos tradicionales.

¿El machine learning para cobranza requiere un equipo de data science interno?

No necesariamente. Las plataformas especializadas como Kleva incluyen los modelos de scoring como parte del servicio, sin requerir que el cliente tenga capacidades internas de data science.

¿Cómo afecta la inflación y la volatilidad macroeconómica de LATAM a los modelos predictivos?

Los modelos entrenados en períodos estables pueden degradarse rápidamente durante crisis. Por eso es importante monitorear el performance del modelo continuamente y reentrenarlo con datos recientes cuando hay cambios macroeconómicos significativos.

¿Qué diferencia hay entre un modelo de scoring crediticio y uno de predicción de incumplimiento para cobranza?

El scoring crediticio se usa al momento de otorgar el crédito para evaluar la capacidad de pago futura. El modelo de predicción de incumplimiento para cobranza se usa sobre créditos ya otorgados para predecir el comportamiento de clientes actuales, usando datos de comportamiento real que no existían al momento de la originación.

Talk to a human

No bots, no endless forms. Fill in your details and someone from our team will reach out.

Your information is secure and will only be used for scheduling purposes

Reach us out

Reach out directly to our team*

  • Email hi@kleva.co
  • WhatsApp +1 704-816-9059
  • Office Miami, Florida