talk to a human
Reading

Datos Alternativos en Scoring de Cobranza: Guía Práctica 2026

Cómo integrar datos alternativos (open banking, telco, comportamiento digital, social) en modelos de scoring para mejorar segmentación y estrategia de cobranza.

May 1, 2026 - 12 min read

|

by ed-escobar Co-Founder & CEO

Cómo Usar Datos Alternativos en Scoring de Cobranza para Predecir Propensión a Pagar

El scoring tradicional de cobranza se basa en variables obvias: días de mora, saldo vencido, historial de pagos, score crediticio del buró. Estos datos son importantes, pero cuentan solo una parte de la historia.

Datos alternativos —información de fuentes no tradicionales como open banking, telco, comportamiento digital, redes sociales, y señales contextuales— pueden mejorar dramáticamente tu capacidad de predecir quién va a pagar, cuándo, por qué canal, y con qué estrategia.

En LATAM, donde una gran parte de la población está thin-file (poco historial crediticio formal) o no-file (sin historial), los datos alternativos no son un nice-to-have: son esenciales para cobranza efectiva.

Esta guía técnica desglosa qué datos alternativos usar, dónde conseguirlos, cómo integrarlos en modelos de scoring, y casos de uso probados en operaciones de cobranza en LATAM.

Por Qué los Datos Tradicionales No Son Suficientes

Limitaciones del Scoring Tradicional

Variables típicas en modelos de cobranza:

  • Días de mora (DPD - Days Past Due)
  • Saldo vencido y saldo total
  • Número de cuotas vencidas vs. pagadas a tiempo
  • Score de buró crediticio (FICO, Equifax, TransUnion, DataCrédito)
  • Producto (tarjeta de crédito, préstamo personal, auto, hipoteca)
  • Demografía básica (edad, ciudad, ocupación declarada)

Problemas con estas variables:

  1. Son retrospectivas: Te dicen qué pasó, no qué está pasando ahora o qué pasará
  2. No capturan contexto: Un deudor con 30 DPD que acaba de perder su empleo es MUY diferente de uno que simplemente olvidó pagar
  3. No diferencian dentro de segmentos: Dos deudores con 45 DPD, $500 de deuda, y score 650 pueden tener propensión a pagar radicalmente distinta
  4. No informan estrategia: Saber que alguien tiene 60 DPD no te dice si llamarlo a las 9am o 7pm, por voz o WhatsApp, con qué mensaje

El Valor de Datos Alternativos

Datos alternativos añaden contexto en tiempo real, señales conductuales, y capacidad predictiva prospectiva:

  • Predicen eventos futuros: Caída en ingresos bancarios detectada 3 semanas antes de que el deudor entre en mora
  • Segmentan con precisión: Identifican "olvidadizos" vs. "en crisis financiera" vs. "evasores intencionales"
  • Informan estrategia: Canal preferido, momento óptimo de contacto, mensaje que resuena
  • Mejoran performance: Estudios muestran que agregar datos alternativos mejora recovery rate 15-35% vs. modelos tradicionales

Taxonomía de Datos Alternativos para Cobranza

1. Open Banking / Datos Transaccionales

Qué son: Información de cuentas bancarias del deudor (con su consentimiento) accesible vía APIs de open banking.

Disponibilidad en LATAM:

  • Brasil: Mandatory open banking desde 2021, alta adopción
  • México: Open Finance regulado por Banxico, creciendo rápido
  • Colombia, Chile, Argentina: Iniciativas en desarrollo, disponibilidad variable

Variables clave:

  • Ingresos recurrentes: Depósitos de nómina, transferencias regulares (detecta pérdida de empleo)
  • Gastos categorizados: Cuánto gasta en comida, transporte, entretenimiento, servicios básicos
  • Saldo promedio: Liquidez actual vs. histórica (detecta estrés financiero)
  • Transacciones P2P: Uso de apps de pago (Nequi, Mercado Pago, PicPay) indica comportamiento digital
  • Pagos de servicios: Luz, agua, teléfono al día (indica estabilidad) o atrasados (señal de crisis)
  • Velocity: Cambios abruptos en patrones (ej: saldo promedio cayó 60% en 30 días)

Cómo usar en scoring:

  • Capacidad de pago actual: Ingresos del último mes - gastos fijos = disponible para pagar deuda
  • Stability score: Varianza en ingresos (bajo = estable, alto = volátil/riesgoso)
  • Early warning: Si ingresos cayeron > 30% mes a mes → prioridad alta para contacto temprano (antes de que entre en mora severa)

2. Datos de Telco (Telefonía y Conectividad)

Qué son: Información de operadores de telefonía móvil sobre uso, pagos, recargas.

Variables clave:

  • Pago de plan móvil: Al día vs. atrasado (correlaciona fuertemente con propensión a pagar otras deudas)
  • Frecuencia de recargas: Prepago con recargas regulares indica ingresos disponibles
  • Antiguedad del número: Número activo por 5+ años = estabilidad; número nuevo = potencial evasor que cambió contacto
  • Tipo de línea: Pospago (requiere aprobación crediticia) vs. prepago
  • Uso de datos: Consumo regular de internet móvil = digitalmente activo (mejor para WhatsApp, email)

Cómo usar en scoring:

  • Contactabilidad: Número activo con uso reciente → alta probabilidad de contacto efectivo
  • Canal preferido: Alto uso de datos → preferir WhatsApp/SMS a llamada de voz
  • Riesgo de fuga: Número inactivo o recién activado → potencial evasor, priorizar contacto

3. Comportamiento Digital (Engagement con tu Plataforma)

Qué son: Datos de interacción del deudor con tu app móvil, portal web, emails, SMS.

Variables clave:

  • Última actividad en app: Login reciente = usuario activo, receptivo
  • Opens de emails/SMS: Abrió los últimos 3 recordatorios de pago → estrategia de email es efectiva
  • Clicks en payment links: Clickeó pero no pagó → intención presente, fricciones en proceso de pago
  • Tiempo en sección de "Mi deuda": Revisó su estado de cuenta → consciente de la mora, momento óptimo para contactar
  • Uso de chat de soporte: Preguntó por opciones de pago → alta propensión, enviar oferta inmediatamente

Cómo usar en scoring:

  • Propensión a pagar: Usuario que revisó su deuda en los últimos 3 días tiene 3-5x más probabilidad de pagar que uno que no ha abierto la app en 30 días
  • Timing óptimo: Contactar dentro de 24h de que el usuario revise su estado de cuenta (el awareness está fresco)
  • Segmentación de canal: Si abre emails pero no responde llamadas → priorizar email/WhatsApp

4. Datos de Redes Sociales y Reputación Digital

Qué son: Información pública de redes sociales (LinkedIn, Facebook) y plataformas de reputación.

Variables clave:

  • Empleo actual (LinkedIn): Perfil actualizado con empleo activo vs. "buscando oportunidades"
  • Estabilidad laboral: 5 años en la misma empresa vs. 3 trabajos en 18 meses
  • Red profesional: 500+ conexiones (profesional establecido) vs. 50 conexiones
  • Actividad reciente: Posts, interacciones (activo = probablemente empleado y estable)

Consideraciones éticas y legales:

  • GDPR/LGPD compliance: Solo usa datos públicamente disponibles o con consentimiento explícito
  • No discriminación: No uses raza, religión, orientación sexual, afiliación política
  • Transparencia: Informa al deudor qué datos usas y por qué (derecho a explicación)

5. Datos Geoespaciales y de Movilidad

Qué son: Información de ubicación (con consentimiento) de apps móviles.

Variables clave:

  • Estabilidad de domicilio: Ubicación nocturna consistente en el mismo lugar por 6+ meses = estable
  • Movilidad laboral: Patrón diario de hogar → oficina → hogar (empleado formal) vs. sin patrón (desempleado o informal)
  • Cambio reciente de ciudad: Se mudó hace 2 semanas → potencial evasor o evento de vida mayor (reestructuración familiar, pérdida de empleo)

Cómo usar en scoring:

  • Riesgo de fuga: Cambio súbito de ubicación habitual → escalar prioridad de contacto
  • Verificación de empleo: Patrón de movilidad a zona corporativa 5 días/semana = probablemente empleado

6. Datos de Conversaciones de Cobranza (Voice Analytics)

Qué son: Insights extraídos de transcripciones y análisis de audio de llamadas de cobranza previas.

Variables clave:

  • Sentiment histórico: En últimas 3 conversaciones fue cooperativo, neutral, o hostil
  • Razones de no pago declaradas: "Olvidé" vs. "No tengo dinero" vs. "Disputo la deuda"
  • Cumplimiento de promesas: 80% de promesas cumplidas (confiable) vs. 10% (no confiable)
  • Canal preferido: Responde a WhatsApp pero no a llamadas (o viceversa)
  • Horario de contactabilidad: Contesta llamadas a las 7pm pero no a las 11am

Cómo usar en scoring:

  • Next best action: Si el deudor históricamente cumple promesas, ofrecer plan de pago flexible; si no cumple, pedir pago inmediato
  • Personalización de mensaje: Si respondió bien a tono empático, usar ese approach; si respondió a urgencia, usar ese tono

Kleva procesa 900,000+ minutos mensuales de conversaciones, extrayendo sentiment, razones de no pago, y patrones que alimentan modelos de scoring en tiempo real.

Integración Técnica: De Datos Crudos a Score Accionable

Paso 1: Recolección y Centralización

Infraestructura:

  • Data lake: S3, Google Cloud Storage para almacenar datos crudos de múltiples fuentes
  • ETL pipelines: Airflow, Prefect para orquestar ingesta diaria/horaria
  • Data warehouse: Snowflake, BigQuery para datos estructurados y consultables
  • Feature store: Feast, Tecton para versionar y servir features a modelos ML

Fuentes de datos:

  1. Internas: CRM, core bancario, logs de app/web, grabaciones de llamadas
  2. APIs externas: Open banking (Belvo, Fintoc), telco data (operadores locales), social (LinkedIn API)
  3. Proveedores de datos: Experian, Equifax, DataCrédito para scores tradicionales + alternativos

Paso 2: Feature Engineering

Transformar datos crudos en variables predictivas:

Dato CrudoFeature EngineeredValor Predictivo

Transacciones bancarias (últimos 90 días)ingresos_mes_actual / ingresos_promedio_3mRatio < 0.7 = caída de ingresos (alta mora futura)

Opens de emails de recordatorioemail_open_rate_last_7d> 60% = receptivo a email como canal

Llamadas de cobranza históricaspromesa_cumplimiento_rate_6m> 70% = confiable, ofrecer flexibilidad

Ubicación GPS (app móvil)dias_desde_cambio_ubicacion_habitual< 14 días = potencial evasor

Recargas de celular prepagorecarga_promedio_mensual> $20 USD = capacidad de pago presente

Sentiment de última llamadasentiment_score (-1 a +1)< -0.5 = riesgo de escalada, ofrecer callback

Paso 3: Modelado Predictivo

Tipos de modelos:

  1. Propensity to Pay (PTP): Probabilidad de que el deudor pague en los próximos 7/14/30 días
  2. Payment Amount: Monto esperado que pagará (total vs. parcial)
  3. Channel preference: Clasificación del mejor canal (voz, WhatsApp, email, SMS)
  4. Time-to-contact: Ventana horaria óptima para contacto (9-11am, 6-8pm, etc.)
  5. Churn risk: Probabilidad de que el deudor abandone completamente la relación

Algoritmos comunes:

  • Gradient Boosting (XGBoost, LightGBM): Alta precisión, maneja well features heterogéneas
  • Redes neuronales: Para datos no estructurados (texto de transcripciones, imágenes)
  • Logistic regression: Interpretable, bueno para compliance (explicas por qué decidiste X)

Entrenamiento:

  • Dataset: 50K-100K deudores históricos con outcome conocido (pagó / no pagó)
  • Train/validation/test split: 70/15/15
  • Métricas: AUC-ROC, precision/recall, lift en top decile
  • Re-entrenamiento: quincenal o mensual con nuevos datos

Paso 4: Scoring en Tiempo Real

Arquitectura de serving:

  • API de scoring: FastAPI, Flask que expone endpoint POST /score
  • Feature retrieval: Fetch features desde feature store en < 100ms
  • Model inference: Modelo cargado en memoria, inferencia en < 50ms
  • Caching: Redis para scores recién calculados (TTL de 1-6 horas según use case)

Flujo durante llamada de voice agent:

  1. Voice agent identifica al deudor (30 seg)
  2. Llama a API de scoring con ID del deudor
  3. API retorna: PTP score = 0.68, canal preferido = WhatsApp, mejor hora = 7pm, sentiment histórico = neutral
  4. Voice agent ajusta estrategia: ofrece plan de pago flexible, menciona que puede enviar WhatsApp con resumen
  5. Conversación optimizada según score → mayor conversión

Casos de Uso: Datos Alternativos en Acción

Caso 1: Detección Temprana de Estrés Financiero

Contexto: Banco retail en Colombia con cartera de tarjetas de crédito.

Problema: Recovery rate bajo en cartera 90+ días (muchos deudores ya en crisis financiera severa).

Solución con datos alternativos:

  • Integraron open banking para 40% de clientes que dieron consentimiento
  • Feature clave: caida_ingresos_30d = (ingresos mes actual / promedio 3m) - 1
  • Modelo detecta clientes con caída de ingresos > 25% antes de que entren en mora
  • Trigger proactivo: llamada de "¿todo bien? Vemos cambios en tu situación financiera, ¿podemos ayudarte con un plan?"

Resultado:

  • Contacto proactivo redujo entrada a mora 90+ en 32%
  • Recovery rate en cartera temprana mejoró de 58% a 76%
  • CSAT aumentó (clientes valoran que el banco "se preocupa" antes de que la situación empeore)

Caso 2: Optimización de Canal por Perfil Digital

Contexto: Fintech mexicana con base de usuarios jóvenes (18-35 años).

Problema: Baja tasa de contacto con voice agents (answer rate de 35%).

Solución con datos alternativos:

  • Analizaron engagement digital: uso de app, opens de emails, clicks en notificaciones push
  • Crearon feature: digital_engagement_score = weighted avg de logins/semana, emails abiertos, push clicks
  • Segmentación: high digital engagement (score > 0.7) → WhatsApp primero; low (< 0.3) → llamada directa

Resultado:

  • Contact rate general aumentó de 35% a 62%
  • Costo por gestión bajó 28% (WhatsApp es 60% más barato que voz)
  • Recovery rate mejoró de 51% a 64% (contactar por canal preferido mejora conversión)

Caso 3: Priorización con Voice Analytics

Contexto: Operador de telecomunicaciones en Chile con 100K cuentas en mora.

Problema: Capacidad limitada (solo pueden gestionar 30K/mes), necesitan priorizar.

Solución con datos alternativos:

  • Implementaron Kleva para voice agents con sentiment analysis en tiempo real
  • Features de voice analytics:

Features de voice analytics:

  • cumplimiento_promesas_6m: % de promesas cumplidas históricamente
  • sentiment_promedio_3_ultimas: cooperativo / neutral / hostil
  • razon_no_pago_frecuente: olvido / falta de dinero / disputa
  • Modelo de priorización: Score = f(DPD, saldo, PTP, cumplimiento histórico, sentiment)
  • Top 30K por score reciben gestión intensiva, resto gestión ligera (solo WhatsApp)

Resultado:

  • Recovery rate en top 30K: 81% (vs. 54% con priorización tradicional por DPD/saldo)
  • Recuperación total aumentó $2.1M USD/mes con la misma capacidad operativa

Consideraciones de Privacidad y Compliance

Regulaciones en LATAM

  • Brasil (LGPD): Requiere consentimiento explícito para datos sensibles, derecho a portabilidad y eliminación
  • México (Ley Federal de Protección de Datos): Aviso de privacidad obligatorio, consentimiento para datos financieros
  • Argentina (Ley 25.326): Registro de bases de datos, derecho de acceso y rectificación
  • Colombia, Chile: Leyes similares en línea con GDPR europeo

Best Practices

  1. Consentimiento granular: No agrupar todo en un "acepto términos"; explica qué datos usas y por qué
  2. Minimización de datos: Colecta solo lo que realmente usarás en modelos
  3. Anonimización: Para analytics internos, usa datos anonimizados cuando sea posible
  4. Retención limitada: Define políticas de cuánto tiempo guardas datos alternativos (ej: 12 meses post-liquidación de deuda)
  5. Explicabilidad: Usa modelos interpretables o técnicas (SHAP, LIME) para explicar decisiones a reguladores/deudores
  6. Auditoría de sesgo: Revisa periódicamente que tus modelos no discriminen por raza, género, ubicación geográfica

Kleva: Datos Alternativos Integrados

Kleva incorpora datos alternativos en su plataforma de cobranza automatizada:

  • Voice analytics incluido: 100% de conversaciones analizadas para sentiment, razones de no pago, cumplimiento de promesas
  • Integraciones pre-built: Conectores con proveedores de open banking (Belvo, Fintoc), telco data, y CRMs
  • Modelos propietarios: Entrenados con $5M+ USD cobrados en 7 países LATAM, optimizados para cada mercado
  • Scoring en tiempo real: Durante la llamada, el voice agent accede a score actualizado y ajusta estrategia dinámicamente
  • Compliance by design: Cumplimiento LGPD, GDPR, regulaciones locales, con auditoría de sesgo trimestral

Con 73% recovery rate y 94% FCR, hemos demostrado que integrar datos alternativos no es un experimento académico: es una ventaja competitiva medible en dólares recuperados.

Si tu scoring de cobranza aún se basa solo en días de mora y saldo vencido, estás dejando dinero sobre la mesa. Los datos para predecir propensión a pagar con precisión ya existen. La pregunta es: ¿cuándo empezarás a usarlos?

Talk to a human

No bots, no endless forms. Fill in your details and someone from our team will reach out.

Your information is secure and will only be used for scheduling purposes

Reach us out

Reach out directly to our team*

  • Email hi@kleva.co
  • WhatsApp +1 704-816-9059
  • Office Miami, Florida