talk to a human
Reading

Segmentación de Cartera Morosa con Machine Learning: Priorizar para Maximizar Recuperación

Cómo usar machine learning para segmentar cartera morosa y priorizar gestiones de cobranza, aumentando recuperación hasta 45% con los mismos recursos.

Apr 10, 2026 - 13 min read

|

by ed-escobar Co-Founder & CEO

Segmentación de Cartera Morosa con Machine Learning: Priorizar para Maximizar Recuperación

Todos los gerentes de cobranza en América Latina enfrentan el mismo dilema: recursos limitados (agentes, tiempo, presupuesto) versus cartera morosa creciente. Con 50,000 cuentas vencidas y capacidad para gestionar solo 10,000 este mes, ¿cuáles priorizar? La respuesta tradicional es simple pero subóptima: por monto (cobrar primero las deudas grandes) o por antigüedad (cobrar primero las más viejas). Ambos criterios ignoran la variable más importante: ¿cuáles tienen mayor probabilidad de pagar?

La segmentación de cartera morosa con machine learning responde esta pregunta con precisión estadística. Algoritmos avanzados analizan cientos de variables (historial de pagos, comportamiento transaccional, datos demográficos, información externa) para predecir qué deudores pagarán si se les contacta, cuánto pagarán y qué estrategia de contacto optimiza la recuperación. El resultado: aumentos de 35-45% en recuperación usando los mismos recursos.

En este artículo exploramos cómo funciona la segmentación inteligente con ML, qué algoritmos son más efectivos, casos de éxito en LATAM y cómo plataformas como Kleva integran modelos predictivos con voice agents para ejecutar automáticamente estrategias optimizadas, logrando 73% de tasa de éxito en 7 países de la región.

Límites de la Segmentación Tradicional de Cartera

Segmentación Por Monto: Eficiente Pero Incompleto

El criterio más común es priorizar deudas de mayor monto. La lógica es obvia: recuperar una deuda de $10,000 USD tiene más impacto que recuperar diez deudas de $100 USD. Pero este enfoque asume que todas las deudas tienen igual probabilidad de recuperación, lo cual es falso.

En la práctica, una deuda grande de un cliente en quiebra tiene 5% de probabilidad de recuperación, mientras que una deuda pequeña de un cliente con dificultad temporal tiene 80% de probabilidad. Ignorar esto resulta en desperdiciar recursos en cuentas incobrables mientras se descuidan oportunidades de alta probabilidad.

Segmentación Por Antigüedad: Útil Pero Reactivo

Otra estrategia común es priorizar deudas más antiguas (180+ días de mora) antes de que se castiguen. Esto tiene sentido desde perspectiva contable, pero ignora que la probabilidad de pago decrece exponencialmente con el tiempo. Una deuda de 30 días tiene 60-70% de probabilidad de recuperación; una de 180 días solo 15-25%.

Dedicar recursos escasos a cartera castigada frecuentemente significa descuidar mora temprana, que es más fácil y rentable de recuperar. Este enfoque maximiza "cobertura contable" pero no maximiza recuperación real.

Segmentación Manual: No Escalable

Algunos equipos de cobranza sofisticados hacen segmentación manual: analistas revisan cartera, identifican patrones, clasifican cuentas en categorías ("alta prioridad", "prioridad media", etc.). Este approach funciona para carteras pequeñas (menos de 5,000 cuentas) pero no escala y depende de la experiencia subjetiva del analista.

Cómo Funciona la Segmentación con Machine Learning

Modelo de Propensión a Pagar (Propensity to Pay)

El núcleo del sistema es un modelo de clasificación supervisada que predice la probabilidad de que un deudor pague en los próximos 30-60 días si es contactado. El modelo se entrena con datos históricos de millones de gestiones previas, aprendiendo qué variables predicen pago exitoso.

Las variables más predictivas incluyen: historial de puntualidad (deudores que históricamente pagaron con 5-10 días de retraso tienen alta propensión a pagar con recordatorio), utilización de línea de crédito (uso al 90%+ indica stress financiero, reduce propensión), comportamiento de pago en últimos 3 meses (tendencia al alza o baja), respuesta a contactos previos (contestó llamadas anteriores o las ignoró), datos demográficos (edad, ocupación, región), información externa (scoring de burós, morosidad con otros acreedores).

El modelo output es un score de 0-100: score de 80+ indica alta probabilidad de pago (contactar urgentemente), 50-79 probabilidad media (contactar según capacidad), 0-49 baja probabilidad (estrategia conservadora o no contactar).

Modelo de Monto Esperado de Recuperación

No basta predecir "¿pagará?"; también necesitamos predecir "¿cuánto pagará?". Un deudor puede tener alta propensión a pagar pero solo ofrecer 30% de la deuda, mientras otro con propensión media puede pagar 100%. El valor esperado de recuperación combina ambas variables: probabilidad de pago × monto esperado.

Ejemplo: Deuda A de $5,000 USD, 60% probabilidad de pago, monto esperado $4,000 (80% de deuda) = valor esperado $2,400. Deuda B de $10,000 USD, 25% probabilidad de pago, monto esperado $3,000 (30% de deuda) = valor esperado $750. Priorizar Deuda A maximiza recuperación esperada.

Modelo de Estrategia Óptima de Contacto

Adicionalmente, ML predice qué estrategia de contacto optimiza recuperación para cada perfil: llamada telefónica, WhatsApp, email, SMS, visita en campo. También predice mejor horario de contacto (mañana vs. tarde vs. noche), frecuencia óptima (contactar diario vs. cada 3 días) y mensaje apropiado (recordatorio amigable vs. oferta de plan de pago vs. advertencia de consecuencias).

Esta personalización a escala es imposible con segmentación manual pero trivial con ML.

Algoritmos de Machine Learning para Segmentación de Cartera

AlgoritmoVentajasDesventajasMejor Uso

Regresión LogísticaInterpretable, rápido, bajo riesgo de overfittingAsume relaciones lineales, precisión limitadaBaseline, modelos simples con pocas variables

Random ForestManeja no-linealidad, robusto a outliers, feature importancePuede ser lento en predicción con muchos árbolesProducción en empresas medianas, buen balance precisión-interpretabilidad

Gradient Boosting (XGBoost, LightGBM)Máxima precisión, maneja relaciones complejasRequiere tuning cuidadoso, riesgo de overfittingEmpresas grandes con data scientists experimentados, competencias de ML

Redes NeuronalesCaptura patrones muy complejos, mejora con más datos"Black box", requiere mucho dato, costoso de entrenarInstituciones financieras grandes con millones de registros

Feature Engineering: El Secreto del Éxito

La calidad del modelo depende más de qué variables se crean (feature engineering) que del algoritmo usado. Variables derivadas poderosas incluyen: tendencia de pagos (¿mejorando o empeorando en últimos 3-6 meses?), velocidad de deterioro (cuántos días adicionales de retraso por mes), estacionalidad de pagos (paga consistentemente después de día 15 del mes cuando recibe sueldo), utilización relativa de crédito (cambio porcentual en utilización últimos 3 vs. 6 meses), ratio de promesas cumplidas (de compromisos previos, cuántos cumplió).

Estas variables requieren conocimiento profundo del negocio de cobranza, no solo expertise técnico de ML.

Casos de Éxito en LATAM

Banco Chileno: 38% Más Recuperación con Mismos Recursos

Un banco chileno con cartera de créditos de consumo de $180 millones USD en mora implementó segmentación con machine learning en 2025. Entrenaron modelo de propensión a pagar con 5 años de datos históricos (2.3 millones de gestiones, 180,000 deudores).

El modelo identificó tres segmentos: Segmento A (25% de cuentas, score 75+): alta propensión a pagar, requieren solo recordatorio amigable. Gestionados por voice agents de Kleva con llamadas automáticas + WhatsApp. Tasa de recuperación: 78%. Segmento B (45% de cuentas, score 50-74): propensión media, requieren negociación de plan de pago. Gestionados por combinación de voice agents (contacto inicial) + agentes humanos (negociación compleja). Tasa de recuperación: 52%. Segmento C (30% de cuentas, score 0-49): baja propensión, gestionados con estrategia conservadora (email/SMS, sin llamadas intensivas). Tasa de recuperación: 18%.

Resultado: recuperación aumentó de $8.2 millones mensuales (enfoque tradicional por monto) a $11.3 millones mensuales (+38%) usando el mismo equipo de 28 agentes y presupuesto de contacto.

Fintech Mexicana: Optimización de Estrategia por Perfil

Una fintech mexicana de créditos personales tenía dilema: su cartera morosa de 85,000 cuentas incluía perfiles muy diversos (empleados formales vs. freelancers, millennials vs. adultos mayores, CDMX vs. ciudades pequeñas). Estrategia uniforme resultaba en tasa de éxito de solo 42%.

Implementaron segmentación con ML que predecía no solo propensión a pagar sino estrategia óptima de contacto: Millennials en CDMX (35% de cartera): mejor respuesta a WhatsApp con links de pago, horario óptimo 8-10 PM. Empleados formales mayores de 45 años (25% de cartera): mejor respuesta a llamadas telefónicas, horario 6-8 PM después del trabajo, prefieren hablar con persona (escalamiento rápido a agente humano). Freelancers/informales (40% de cartera): mejor respuesta a SMS con opciones de pago flexible, horarios variables (contactar en diferentes momentos del día).

Resultado: tasa de compromiso de pago aumentó de 42% a 68%, tiempo promedio hasta primer pago se redujo de 18 a 11 días.

Retail Colombiano: Segmentación Predictiva Reduce Castigos 31%

Una cadena retail colombiana castigaba anualmente $4.5 millones USD en cartera de tarjeta propia con más de 180 días de mora. Implementaron modelo predictivo que identificaba cuentas en riesgo de castigo cuando aún estaban en mora temprana (30-60 días).

El modelo detectaba señales: cambio súbito en comportamiento de pago (cliente que pagaba puntual atrasa 2 meses consecutivos), aumento en utilización de línea (de 40% a 95%), reducción en pagos de cuota completa (pasa de pagar total a pagar mínimo). Estas señales indicaban 70%+ de probabilidad de evolucionar a castigo si no se intervenía.

Activaban intervención preventiva con voice agents: contacto proactivo antes de mora severa, ofrecimiento de refinanciamiento, planes de pago flexibles. Resultado: castigos anuales se redujeron de $4.5 millones a $3.1 millones (-31%), ahorrando capital y preservando relaciones con clientes.

Implementación de Segmentación con ML

Paso 1: Recolección y Preparación de Datos

El modelo requiere datos históricos de al menos 12-24 meses: cartera morosa (monto, antigüedad, producto), historial de pagos (fechas, montos, método de pago), historial de gestiones (cuándo se contactó, por qué canal, cuál fue el resultado), datos del deudor (demográficos, scoring, comportamiento transaccional).

Estos datos típicamente están fragmentados en múltiples sistemas (core bancario, CRM, sistema de cobranza, data warehouse). El primer paso es consolidarlos en dataset unificado con un registro por deudor-mes, incluyendo todas las variables relevantes.

Paso 2: Entrenamiento y Validación del Modelo

División de datos en entrenamiento (70%), validación (15%) y testing (15%). Entrenar múltiples algoritmos (regresión logística como baseline, random forest, XGBoost) y comparar desempeño. Métricas clave: AUC-ROC (mide discriminación entre pagadores y no-pagadores, objetivo 0.75+), precisión de top decile (de los deudores clasificados en top 10% de propensión, qué porcentaje realmente paga, objetivo 75%+), lift (cuántas veces mejor que selección aleatoria, objetivo 2.5x+).

Paso 3: Integración con Sistema de Gestión

El modelo debe integrarse con sistema de cobranza para automatizar priorización. Cada día/semana, el modelo score la cartera morosa actualizada, generando ranking de prioridad. Este ranking alimenta: asignación automática de cuentas a agentes (top scores a mejores agentes), activación de campañas automatizadas de voice agents para segmentos de alta propensión, priorización de casos para seguimiento humano.

Kleva integra modelos de segmentación con voice agents: el modelo identifica cuentas de alta propensión, el voice agent contacta automáticamente con estrategia optimizada (script personalizado, horario óptimo, canal preferido), los resultados realimentan el modelo para mejora continua.

Paso 4: Monitoreo y Reentrenamiento

Los modelos decaen con el tiempo por cambios en comportamiento de deudores, condiciones económicas, productos. Monitorear mensualmente performance del modelo: ¿La precisión se mantiene? ¿Los deudores de score alto siguen pagando a tasa esperada? Si performance cae 10%+, reentrenar modelo con datos más recientes.

El reentrenamiento típico es trimestral o semestral, incorporando últimos 3-6 meses de gestiones para capturar cambios en patrones.

Segmentación Avanzada: Más Allá de Propensión a Pagar

Segmentación por Valor de Vida del Cliente (CLV)

No solo importa recuperar la deuda morosa sino preservar la relación con clientes valiosos. Modelos avanzados incluyen CLV (Customer Lifetime Value): valor esperado del cliente en próximos 3-5 años si la relación se mantiene.

Un cliente moroso por $500 USD pero con CLV de $10,000 USD (usa múltiples productos, historial de 8 años, alto ingreso) merece estrategia empática y flexible. Un cliente moroso por $500 USD con CLV de $300 USD (cliente nuevo, bajo engagement, alto riesgo) merece estrategia más directa.

Segmentación por Sensibilidad a Estrategia

Algunos deudores responden mejor a llamadas, otros a WhatsApp, otros a email. Modelos de uplift modeling predicen no solo quién pagará sino qué estrategia maximiza la probabilidad de pago para cada individuo. Esto permite asignar recursos escasos (tiempo de agentes humanos) donde generan máximo impacto.

Segmentación por Riesgo Legal/Reputacional

Ciertos perfiles de deudores (adultos mayores, personas con discapacidad, casos con dispute de servicio) requieren manejo especialmente cuidadoso por riesgo de quejas regulatorias o daño reputacional. El modelo puede identificar estos casos y activar protocolos especiales: escalamiento automático a agentes senior, scripts extra empáticos, documentación exhaustiva de interacciones.

Desafíos y Consideraciones Éticas

Sesgo en Datos Históricos

Si históricamente se priorizó cobrar a clientes de alto monto, el modelo aprenderá que esos clientes tienen alta propensión a pagar (porque se les gestionó intensivamente), perpetuando el sesgo. Mitigación: usar técnicas de causal inference que intentan estimar qué hubiera pasado si se hubiera contactado a clientes que no se contactaron.

Explicabilidad de Decisiones

Reguladores y deudores pueden cuestionar: "¿Por qué me clasificaron como baja prioridad?" Modelos de explainable AI generan justificaciones: "Tu score de 42 se basa en: historial de no respuesta a 8 contactos previos (-15 puntos), mora actual en 3 productos con otros acreedores (-12 puntos), reducción de 60% en ingresos detectada en últimos 6 meses (-18 puntos)."

Equidad y No Discriminación

Los modelos no deben discriminar por variables protegidas (género, etnia, religión, orientación sexual). En LATAM, regulaciones como Ley 20.575 en Chile prohíben discriminación en cobranza. Modelos deben auditarse regularmente para detectar disparate impact: si un grupo protegido recibe sistemáticamente scores más bajos sin justificación objetiva en comportamiento de pago.

Preguntas Frecuentes

¿Necesitamos data scientists internos para implementar segmentación con ML?

No necesariamente. Plataformas modernas como Kleva incluyen modelos de segmentación pre-entrenados que se adaptan automáticamente a tus datos. Provees acceso a datos históricos, la plataforma entrena el modelo específico para tu cartera, tu equipo de cobranza simplemente usa los scores generados. Para empresas grandes que quieren control total, sí conviene tener data scientists que construyan modelos custom.

¿Cuántos datos históricos necesitamos para entrenar un modelo efectivo?

Mínimo: 12-18 meses de datos, idealmente 24-36 meses. Esto debe incluir al menos 50,000-100,000 registros de gestiones con outcome conocido (pagó/no pagó). Con menos datos, el modelo tiene riesgo de overfitting (aprende ruido en lugar de patrones reales). Empresas nuevas sin historial pueden comenzar con modelos simples (regresión logística con 5-10 variables clave) y evolucionar a modelos complejos a medida que acumulan datos.

¿Qué precisión podemos esperar de modelos de propensión a pagar?

Modelos maduros en empresas con buenos datos alcanzan AUC-ROC de 0.75-0.85. Esto significa que si seleccionas aleatoriamente un deudor que pagó y uno que no pagó, el modelo asignará score más alto al que pagó en 75-85% de los casos. En términos prácticos: si priorizas el top 20% de cuentas según el modelo, ese 20% generará 40-50% de la recuperación total (2-2.5x lift vs. selección aleatoria).

¿Los modelos de segmentación funcionan en mercados LATAM con alta informalidad?

Sí, pero requieren variables adaptadas al contexto. En mercados con alta informalidad laboral (50-60% en varios países LATAM), variables tradicionales como "ingreso estable" o "empleador" tienen menos poder predictivo. Modelos exitosos usan proxies: patrones de flujo de caja (depósitos irregulares pero consistentes en cuenta), comportamiento transaccional (uso de servicios de pago móvil), historial de micropagos previos, información de círculo social (¿familiares/referencias tienen buen historial crediticio?).

¿Cómo balanceamos maximizar recuperación versus preservar experiencia del cliente?

El modelo puede optimizar función objetivo compuesta: recuperación a corto plazo + valor de vida del cliente (CLV) - costo de quejas/complaints. Esto evita estrategias que maximizan recuperación inmediata pero destruyen relación (llamadas agresivas que resultan en queja regulatoria o pérdida permanente de cliente valioso). En Kleva, voice agents incluyen análisis de sentimiento en tiempo real: si detectan frustración alta, adaptan estrategia o escalan a agente humano empático.

¿Cada cuánto tiempo debemos reentrenar los modelos de segmentación?

Recomendación general: reentrenamiento trimestral o semestral. Monitoreo mensual de performance: si AUC cae 5%+ versus baseline, reentrenar anticipadamente. Eventos que requieren reentrenamiento inmediato: cambios significativos en producto (nueva política de crédito, cambio en tasas de interés), crisis macroeconómica (pandemia, recesión severa), cambios regulatorios que afectan comportamiento de pago. El reentrenamiento típico toma 1-2 semanas e incorpora últimos 6-12 meses de datos.

Talk to a human

No bots, no endless forms. Fill in your details and someone from our team will reach out.

Your information is secure and will only be used for scheduling purposes

Reach us out

Reach out directly to our team*

  • Email hi@kleva.co
  • WhatsApp +1 704-816-9059
  • Office Miami, Florida