Reach us out
Reach out directly to our team*
- Email hi@kleva.co
- WhatsApp +1 704-816-9059
- Office Miami, Florida
Cómo usar machine learning para segmentar cartera morosa y priorizar gestiones de cobranza, aumentando recuperación hasta 45% con los mismos recursos.
Apr 10, 2026 13 min read
|Todos los gerentes de cobranza en América Latina enfrentan el mismo dilema: recursos limitados (agentes, tiempo, presupuesto) versus cartera morosa creciente. Con 50,000 cuentas vencidas y capacidad para gestionar solo 10,000 este mes, ¿cuáles priorizar? La respuesta tradicional es simple pero subóptima: por monto (cobrar primero las deudas grandes) o por antigüedad (cobrar primero las más viejas). Ambos criterios ignoran la variable más importante: ¿cuáles tienen mayor probabilidad de pagar?
La segmentación de cartera morosa con machine learning responde esta pregunta con precisión estadística. Algoritmos avanzados analizan cientos de variables (historial de pagos, comportamiento transaccional, datos demográficos, información externa) para predecir qué deudores pagarán si se les contacta, cuánto pagarán y qué estrategia de contacto optimiza la recuperación. El resultado: aumentos de 35-45% en recuperación usando los mismos recursos.
En este artículo exploramos cómo funciona la segmentación inteligente con ML, qué algoritmos son más efectivos, casos de éxito en LATAM y cómo plataformas como Kleva integran modelos predictivos con voice agents para ejecutar automáticamente estrategias optimizadas, logrando 73% de tasa de éxito en 7 países de la región.
El criterio más común es priorizar deudas de mayor monto. La lógica es obvia: recuperar una deuda de $10,000 USD tiene más impacto que recuperar diez deudas de $100 USD. Pero este enfoque asume que todas las deudas tienen igual probabilidad de recuperación, lo cual es falso.
En la práctica, una deuda grande de un cliente en quiebra tiene 5% de probabilidad de recuperación, mientras que una deuda pequeña de un cliente con dificultad temporal tiene 80% de probabilidad. Ignorar esto resulta en desperdiciar recursos en cuentas incobrables mientras se descuidan oportunidades de alta probabilidad.
Otra estrategia común es priorizar deudas más antiguas (180+ días de mora) antes de que se castiguen. Esto tiene sentido desde perspectiva contable, pero ignora que la probabilidad de pago decrece exponencialmente con el tiempo. Una deuda de 30 días tiene 60-70% de probabilidad de recuperación; una de 180 días solo 15-25%.
Dedicar recursos escasos a cartera castigada frecuentemente significa descuidar mora temprana, que es más fácil y rentable de recuperar. Este enfoque maximiza "cobertura contable" pero no maximiza recuperación real.
Algunos equipos de cobranza sofisticados hacen segmentación manual: analistas revisan cartera, identifican patrones, clasifican cuentas en categorías ("alta prioridad", "prioridad media", etc.). Este approach funciona para carteras pequeñas (menos de 5,000 cuentas) pero no escala y depende de la experiencia subjetiva del analista.
El núcleo del sistema es un modelo de clasificación supervisada que predice la probabilidad de que un deudor pague en los próximos 30-60 días si es contactado. El modelo se entrena con datos históricos de millones de gestiones previas, aprendiendo qué variables predicen pago exitoso.
Las variables más predictivas incluyen: historial de puntualidad (deudores que históricamente pagaron con 5-10 días de retraso tienen alta propensión a pagar con recordatorio), utilización de línea de crédito (uso al 90%+ indica stress financiero, reduce propensión), comportamiento de pago en últimos 3 meses (tendencia al alza o baja), respuesta a contactos previos (contestó llamadas anteriores o las ignoró), datos demográficos (edad, ocupación, región), información externa (scoring de burós, morosidad con otros acreedores).
El modelo output es un score de 0-100: score de 80+ indica alta probabilidad de pago (contactar urgentemente), 50-79 probabilidad media (contactar según capacidad), 0-49 baja probabilidad (estrategia conservadora o no contactar).
No basta predecir "¿pagará?"; también necesitamos predecir "¿cuánto pagará?". Un deudor puede tener alta propensión a pagar pero solo ofrecer 30% de la deuda, mientras otro con propensión media puede pagar 100%. El valor esperado de recuperación combina ambas variables: probabilidad de pago × monto esperado.
Ejemplo: Deuda A de $5,000 USD, 60% probabilidad de pago, monto esperado $4,000 (80% de deuda) = valor esperado $2,400. Deuda B de $10,000 USD, 25% probabilidad de pago, monto esperado $3,000 (30% de deuda) = valor esperado $750. Priorizar Deuda A maximiza recuperación esperada.
Adicionalmente, ML predice qué estrategia de contacto optimiza recuperación para cada perfil: llamada telefónica, WhatsApp, email, SMS, visita en campo. También predice mejor horario de contacto (mañana vs. tarde vs. noche), frecuencia óptima (contactar diario vs. cada 3 días) y mensaje apropiado (recordatorio amigable vs. oferta de plan de pago vs. advertencia de consecuencias).
Esta personalización a escala es imposible con segmentación manual pero trivial con ML.
AlgoritmoVentajasDesventajasMejor Uso
Regresión LogísticaInterpretable, rápido, bajo riesgo de overfittingAsume relaciones lineales, precisión limitadaBaseline, modelos simples con pocas variables
Random ForestManeja no-linealidad, robusto a outliers, feature importancePuede ser lento en predicción con muchos árbolesProducción en empresas medianas, buen balance precisión-interpretabilidad
Gradient Boosting (XGBoost, LightGBM)Máxima precisión, maneja relaciones complejasRequiere tuning cuidadoso, riesgo de overfittingEmpresas grandes con data scientists experimentados, competencias de ML
Redes NeuronalesCaptura patrones muy complejos, mejora con más datos"Black box", requiere mucho dato, costoso de entrenarInstituciones financieras grandes con millones de registros
La calidad del modelo depende más de qué variables se crean (feature engineering) que del algoritmo usado. Variables derivadas poderosas incluyen: tendencia de pagos (¿mejorando o empeorando en últimos 3-6 meses?), velocidad de deterioro (cuántos días adicionales de retraso por mes), estacionalidad de pagos (paga consistentemente después de día 15 del mes cuando recibe sueldo), utilización relativa de crédito (cambio porcentual en utilización últimos 3 vs. 6 meses), ratio de promesas cumplidas (de compromisos previos, cuántos cumplió).
Estas variables requieren conocimiento profundo del negocio de cobranza, no solo expertise técnico de ML.
Un banco chileno con cartera de créditos de consumo de $180 millones USD en mora implementó segmentación con machine learning en 2025. Entrenaron modelo de propensión a pagar con 5 años de datos históricos (2.3 millones de gestiones, 180,000 deudores).
El modelo identificó tres segmentos: Segmento A (25% de cuentas, score 75+): alta propensión a pagar, requieren solo recordatorio amigable. Gestionados por voice agents de Kleva con llamadas automáticas + WhatsApp. Tasa de recuperación: 78%. Segmento B (45% de cuentas, score 50-74): propensión media, requieren negociación de plan de pago. Gestionados por combinación de voice agents (contacto inicial) + agentes humanos (negociación compleja). Tasa de recuperación: 52%. Segmento C (30% de cuentas, score 0-49): baja propensión, gestionados con estrategia conservadora (email/SMS, sin llamadas intensivas). Tasa de recuperación: 18%.
Resultado: recuperación aumentó de $8.2 millones mensuales (enfoque tradicional por monto) a $11.3 millones mensuales (+38%) usando el mismo equipo de 28 agentes y presupuesto de contacto.
Una fintech mexicana de créditos personales tenía dilema: su cartera morosa de 85,000 cuentas incluía perfiles muy diversos (empleados formales vs. freelancers, millennials vs. adultos mayores, CDMX vs. ciudades pequeñas). Estrategia uniforme resultaba en tasa de éxito de solo 42%.
Implementaron segmentación con ML que predecía no solo propensión a pagar sino estrategia óptima de contacto: Millennials en CDMX (35% de cartera): mejor respuesta a WhatsApp con links de pago, horario óptimo 8-10 PM. Empleados formales mayores de 45 años (25% de cartera): mejor respuesta a llamadas telefónicas, horario 6-8 PM después del trabajo, prefieren hablar con persona (escalamiento rápido a agente humano). Freelancers/informales (40% de cartera): mejor respuesta a SMS con opciones de pago flexible, horarios variables (contactar en diferentes momentos del día).
Resultado: tasa de compromiso de pago aumentó de 42% a 68%, tiempo promedio hasta primer pago se redujo de 18 a 11 días.
Una cadena retail colombiana castigaba anualmente $4.5 millones USD en cartera de tarjeta propia con más de 180 días de mora. Implementaron modelo predictivo que identificaba cuentas en riesgo de castigo cuando aún estaban en mora temprana (30-60 días).
El modelo detectaba señales: cambio súbito en comportamiento de pago (cliente que pagaba puntual atrasa 2 meses consecutivos), aumento en utilización de línea (de 40% a 95%), reducción en pagos de cuota completa (pasa de pagar total a pagar mínimo). Estas señales indicaban 70%+ de probabilidad de evolucionar a castigo si no se intervenía.
Activaban intervención preventiva con voice agents: contacto proactivo antes de mora severa, ofrecimiento de refinanciamiento, planes de pago flexibles. Resultado: castigos anuales se redujeron de $4.5 millones a $3.1 millones (-31%), ahorrando capital y preservando relaciones con clientes.
El modelo requiere datos históricos de al menos 12-24 meses: cartera morosa (monto, antigüedad, producto), historial de pagos (fechas, montos, método de pago), historial de gestiones (cuándo se contactó, por qué canal, cuál fue el resultado), datos del deudor (demográficos, scoring, comportamiento transaccional).
Estos datos típicamente están fragmentados en múltiples sistemas (core bancario, CRM, sistema de cobranza, data warehouse). El primer paso es consolidarlos en dataset unificado con un registro por deudor-mes, incluyendo todas las variables relevantes.
División de datos en entrenamiento (70%), validación (15%) y testing (15%). Entrenar múltiples algoritmos (regresión logística como baseline, random forest, XGBoost) y comparar desempeño. Métricas clave: AUC-ROC (mide discriminación entre pagadores y no-pagadores, objetivo 0.75+), precisión de top decile (de los deudores clasificados en top 10% de propensión, qué porcentaje realmente paga, objetivo 75%+), lift (cuántas veces mejor que selección aleatoria, objetivo 2.5x+).
El modelo debe integrarse con sistema de cobranza para automatizar priorización. Cada día/semana, el modelo score la cartera morosa actualizada, generando ranking de prioridad. Este ranking alimenta: asignación automática de cuentas a agentes (top scores a mejores agentes), activación de campañas automatizadas de voice agents para segmentos de alta propensión, priorización de casos para seguimiento humano.
Kleva integra modelos de segmentación con voice agents: el modelo identifica cuentas de alta propensión, el voice agent contacta automáticamente con estrategia optimizada (script personalizado, horario óptimo, canal preferido), los resultados realimentan el modelo para mejora continua.
Los modelos decaen con el tiempo por cambios en comportamiento de deudores, condiciones económicas, productos. Monitorear mensualmente performance del modelo: ¿La precisión se mantiene? ¿Los deudores de score alto siguen pagando a tasa esperada? Si performance cae 10%+, reentrenar modelo con datos más recientes.
El reentrenamiento típico es trimestral o semestral, incorporando últimos 3-6 meses de gestiones para capturar cambios en patrones.
No solo importa recuperar la deuda morosa sino preservar la relación con clientes valiosos. Modelos avanzados incluyen CLV (Customer Lifetime Value): valor esperado del cliente en próximos 3-5 años si la relación se mantiene.
Un cliente moroso por $500 USD pero con CLV de $10,000 USD (usa múltiples productos, historial de 8 años, alto ingreso) merece estrategia empática y flexible. Un cliente moroso por $500 USD con CLV de $300 USD (cliente nuevo, bajo engagement, alto riesgo) merece estrategia más directa.
Algunos deudores responden mejor a llamadas, otros a WhatsApp, otros a email. Modelos de uplift modeling predicen no solo quién pagará sino qué estrategia maximiza la probabilidad de pago para cada individuo. Esto permite asignar recursos escasos (tiempo de agentes humanos) donde generan máximo impacto.
Ciertos perfiles de deudores (adultos mayores, personas con discapacidad, casos con dispute de servicio) requieren manejo especialmente cuidadoso por riesgo de quejas regulatorias o daño reputacional. El modelo puede identificar estos casos y activar protocolos especiales: escalamiento automático a agentes senior, scripts extra empáticos, documentación exhaustiva de interacciones.
Si históricamente se priorizó cobrar a clientes de alto monto, el modelo aprenderá que esos clientes tienen alta propensión a pagar (porque se les gestionó intensivamente), perpetuando el sesgo. Mitigación: usar técnicas de causal inference que intentan estimar qué hubiera pasado si se hubiera contactado a clientes que no se contactaron.
Reguladores y deudores pueden cuestionar: "¿Por qué me clasificaron como baja prioridad?" Modelos de explainable AI generan justificaciones: "Tu score de 42 se basa en: historial de no respuesta a 8 contactos previos (-15 puntos), mora actual en 3 productos con otros acreedores (-12 puntos), reducción de 60% en ingresos detectada en últimos 6 meses (-18 puntos)."
Los modelos no deben discriminar por variables protegidas (género, etnia, religión, orientación sexual). En LATAM, regulaciones como Ley 20.575 en Chile prohíben discriminación en cobranza. Modelos deben auditarse regularmente para detectar disparate impact: si un grupo protegido recibe sistemáticamente scores más bajos sin justificación objetiva en comportamiento de pago.
No necesariamente. Plataformas modernas como Kleva incluyen modelos de segmentación pre-entrenados que se adaptan automáticamente a tus datos. Provees acceso a datos históricos, la plataforma entrena el modelo específico para tu cartera, tu equipo de cobranza simplemente usa los scores generados. Para empresas grandes que quieren control total, sí conviene tener data scientists que construyan modelos custom.
Mínimo: 12-18 meses de datos, idealmente 24-36 meses. Esto debe incluir al menos 50,000-100,000 registros de gestiones con outcome conocido (pagó/no pagó). Con menos datos, el modelo tiene riesgo de overfitting (aprende ruido en lugar de patrones reales). Empresas nuevas sin historial pueden comenzar con modelos simples (regresión logística con 5-10 variables clave) y evolucionar a modelos complejos a medida que acumulan datos.
Modelos maduros en empresas con buenos datos alcanzan AUC-ROC de 0.75-0.85. Esto significa que si seleccionas aleatoriamente un deudor que pagó y uno que no pagó, el modelo asignará score más alto al que pagó en 75-85% de los casos. En términos prácticos: si priorizas el top 20% de cuentas según el modelo, ese 20% generará 40-50% de la recuperación total (2-2.5x lift vs. selección aleatoria).
Sí, pero requieren variables adaptadas al contexto. En mercados con alta informalidad laboral (50-60% en varios países LATAM), variables tradicionales como "ingreso estable" o "empleador" tienen menos poder predictivo. Modelos exitosos usan proxies: patrones de flujo de caja (depósitos irregulares pero consistentes en cuenta), comportamiento transaccional (uso de servicios de pago móvil), historial de micropagos previos, información de círculo social (¿familiares/referencias tienen buen historial crediticio?).
El modelo puede optimizar función objetivo compuesta: recuperación a corto plazo + valor de vida del cliente (CLV) - costo de quejas/complaints. Esto evita estrategias que maximizan recuperación inmediata pero destruyen relación (llamadas agresivas que resultan en queja regulatoria o pérdida permanente de cliente valioso). En Kleva, voice agents incluyen análisis de sentimiento en tiempo real: si detectan frustración alta, adaptan estrategia o escalan a agente humano empático.
Recomendación general: reentrenamiento trimestral o semestral. Monitoreo mensual de performance: si AUC cae 5%+ versus baseline, reentrenar anticipadamente. Eventos que requieren reentrenamiento inmediato: cambios significativos en producto (nueva política de crédito, cambio en tasas de interés), crisis macroeconómica (pandemia, recesión severa), cambios regulatorios que afectan comportamiento de pago. El reentrenamiento típico toma 1-2 semanas e incorpora últimos 6-12 meses de datos.
No bots, no endless forms. Fill in your details and someone from our team will reach out.
Reach out directly to our team*
No bots, no endless forms.