Datos Alternativos en Scoring de Cobranza: Guía Práctica 2026
Cómo integrar datos alternativos (open banking, telco, comportamiento digital, social) en modelos de scoring para mejorar segmentación y estrategia de cobranza.
May 1, 2026 -12 min read
|
by ed-escobar Co-Founder & CEO
Cómo Usar Datos Alternativos en Scoring de Cobranza para Predecir Propensión a Pagar
El scoring tradicional de cobranza se basa en variables obvias: días de mora, saldo vencido, historial de pagos, score crediticio del buró. Estos datos son importantes, pero cuentan solo una parte de la historia.
Datos alternativos —información de fuentes no tradicionales como open banking, telco, comportamiento digital, redes sociales, y señales contextuales— pueden mejorar dramáticamente tu capacidad de predecir quién va a pagar, cuándo, por qué canal, y con qué estrategia.
En LATAM, donde una gran parte de la población está thin-file (poco historial crediticio formal) o no-file (sin historial), los datos alternativos no son un nice-to-have: son esenciales para cobranza efectiva.
Esta guía técnica desglosa qué datos alternativos usar, dónde conseguirlos, cómo integrarlos en modelos de scoring, y casos de uso probados en operaciones de cobranza en LATAM.
Por Qué los Datos Tradicionales No Son Suficientes
Limitaciones del Scoring Tradicional
Variables típicas en modelos de cobranza:
Días de mora (DPD - Days Past Due)
Saldo vencido y saldo total
Número de cuotas vencidas vs. pagadas a tiempo
Score de buró crediticio (FICO, Equifax, TransUnion, DataCrédito)
Producto (tarjeta de crédito, préstamo personal, auto, hipoteca)
Early warning: Si ingresos cayeron > 30% mes a mes → prioridad alta para contacto temprano (antes de que entre en mora severa)
2. Datos de Telco (Telefonía y Conectividad)
Qué son: Información de operadores de telefonía móvil sobre uso, pagos, recargas.
Variables clave:
Pago de plan móvil: Al día vs. atrasado (correlaciona fuertemente con propensión a pagar otras deudas)
Frecuencia de recargas: Prepago con recargas regulares indica ingresos disponibles
Antiguedad del número: Número activo por 5+ años = estabilidad; número nuevo = potencial evasor que cambió contacto
Tipo de línea: Pospago (requiere aprobación crediticia) vs. prepago
Uso de datos: Consumo regular de internet móvil = digitalmente activo (mejor para WhatsApp, email)
Cómo usar en scoring:
Contactabilidad: Número activo con uso reciente → alta probabilidad de contacto efectivo
Canal preferido: Alto uso de datos → preferir WhatsApp/SMS a llamada de voz
Riesgo de fuga: Número inactivo o recién activado → potencial evasor, priorizar contacto
3. Comportamiento Digital (Engagement con tu Plataforma)
Qué son: Datos de interacción del deudor con tu app móvil, portal web, emails, SMS.
Variables clave:
Última actividad en app: Login reciente = usuario activo, receptivo
Opens de emails/SMS: Abrió los últimos 3 recordatorios de pago → estrategia de email es efectiva
Clicks en payment links: Clickeó pero no pagó → intención presente, fricciones en proceso de pago
Tiempo en sección de "Mi deuda": Revisó su estado de cuenta → consciente de la mora, momento óptimo para contactar
Uso de chat de soporte: Preguntó por opciones de pago → alta propensión, enviar oferta inmediatamente
Cómo usar en scoring:
Propensión a pagar: Usuario que revisó su deuda en los últimos 3 días tiene 3-5x más probabilidad de pagar que uno que no ha abierto la app en 30 días
Timing óptimo: Contactar dentro de 24h de que el usuario revise su estado de cuenta (el awareness está fresco)
Segmentación de canal: Si abre emails pero no responde llamadas → priorizar email/WhatsApp
4. Datos de Redes Sociales y Reputación Digital
Qué son: Información pública de redes sociales (LinkedIn, Facebook) y plataformas de reputación.
Variables clave:
Empleo actual (LinkedIn): Perfil actualizado con empleo activo vs. "buscando oportunidades"
Estabilidad laboral: 5 años en la misma empresa vs. 3 trabajos en 18 meses
Red profesional: 500+ conexiones (profesional establecido) vs. 50 conexiones
Actividad reciente: Posts, interacciones (activo = probablemente empleado y estable)
Consideraciones éticas y legales:
GDPR/LGPD compliance: Solo usa datos públicamente disponibles o con consentimiento explícito
No discriminación: No uses raza, religión, orientación sexual, afiliación política
Transparencia: Informa al deudor qué datos usas y por qué (derecho a explicación)
5. Datos Geoespaciales y de Movilidad
Qué son: Información de ubicación (con consentimiento) de apps móviles.
Variables clave:
Estabilidad de domicilio: Ubicación nocturna consistente en el mismo lugar por 6+ meses = estable
Movilidad laboral: Patrón diario de hogar → oficina → hogar (empleado formal) vs. sin patrón (desempleado o informal)
Cambio reciente de ciudad: Se mudó hace 2 semanas → potencial evasor o evento de vida mayor (reestructuración familiar, pérdida de empleo)
Cómo usar en scoring:
Riesgo de fuga: Cambio súbito de ubicación habitual → escalar prioridad de contacto
Verificación de empleo: Patrón de movilidad a zona corporativa 5 días/semana = probablemente empleado
6. Datos de Conversaciones de Cobranza (Voice Analytics)
Qué son: Insights extraídos de transcripciones y análisis de audio de llamadas de cobranza previas.
Variables clave:
Sentiment histórico: En últimas 3 conversaciones fue cooperativo, neutral, o hostil
Razones de no pago declaradas: "Olvidé" vs. "No tengo dinero" vs. "Disputo la deuda"
Cumplimiento de promesas: 80% de promesas cumplidas (confiable) vs. 10% (no confiable)
Canal preferido: Responde a WhatsApp pero no a llamadas (o viceversa)
Horario de contactabilidad: Contesta llamadas a las 7pm pero no a las 11am
Cómo usar en scoring:
Next best action: Si el deudor históricamente cumple promesas, ofrecer plan de pago flexible; si no cumple, pedir pago inmediato
Personalización de mensaje: Si respondió bien a tono empático, usar ese approach; si respondió a urgencia, usar ese tono
Kleva procesa 900,000+ minutos mensuales de conversaciones, extrayendo sentiment, razones de no pago, y patrones que alimentan modelos de scoring en tiempo real.
Integración Técnica: De Datos Crudos a Score Accionable
Paso 1: Recolección y Centralización
Infraestructura:
Data lake: S3, Google Cloud Storage para almacenar datos crudos de múltiples fuentes
ETL pipelines: Airflow, Prefect para orquestar ingesta diaria/horaria
Data warehouse: Snowflake, BigQuery para datos estructurados y consultables
Feature store: Feast, Tecton para versionar y servir features a modelos ML
Fuentes de datos:
Internas: CRM, core bancario, logs de app/web, grabaciones de llamadas
APIs externas: Open banking (Belvo, Fintoc), telco data (operadores locales), social (LinkedIn API)
Proveedores de datos: Experian, Equifax, DataCrédito para scores tradicionales + alternativos
Paso 2: Feature Engineering
Transformar datos crudos en variables predictivas:
Dato CrudoFeature EngineeredValor Predictivo
Transacciones bancarias (últimos 90 días)ingresos_mes_actual / ingresos_promedio_3mRatio < 0.7 = caída de ingresos (alta mora futura)
Opens de emails de recordatorioemail_open_rate_last_7d> 60% = receptivo a email como canal
Llamadas de cobranza históricaspromesa_cumplimiento_rate_6m> 70% = confiable, ofrecer flexibilidad
Ubicación GPS (app móvil)dias_desde_cambio_ubicacion_habitual< 14 días = potencial evasor
Recargas de celular prepagorecarga_promedio_mensual> $20 USD = capacidad de pago presente
Sentiment de última llamadasentiment_score (-1 a +1)< -0.5 = riesgo de escalada, ofrecer callback
Paso 3: Modelado Predictivo
Tipos de modelos:
Propensity to Pay (PTP): Probabilidad de que el deudor pague en los próximos 7/14/30 días
Payment Amount: Monto esperado que pagará (total vs. parcial)
Channel preference: Clasificación del mejor canal (voz, WhatsApp, email, SMS)
Time-to-contact: Ventana horaria óptima para contacto (9-11am, 6-8pm, etc.)
Churn risk: Probabilidad de que el deudor abandone completamente la relación
Algoritmos comunes:
Gradient Boosting (XGBoost, LightGBM): Alta precisión, maneja well features heterogéneas
Redes neuronales: Para datos no estructurados (texto de transcripciones, imágenes)
Logistic regression: Interpretable, bueno para compliance (explicas por qué decidiste X)
Entrenamiento:
Dataset: 50K-100K deudores históricos con outcome conocido (pagó / no pagó)
Train/validation/test split: 70/15/15
Métricas: AUC-ROC, precision/recall, lift en top decile
Re-entrenamiento: quincenal o mensual con nuevos datos
Paso 4: Scoring en Tiempo Real
Arquitectura de serving:
API de scoring: FastAPI, Flask que expone endpoint POST /score
Feature retrieval: Fetch features desde feature store en < 100ms
Model inference: Modelo cargado en memoria, inferencia en < 50ms
Caching: Redis para scores recién calculados (TTL de 1-6 horas según use case)
Flujo durante llamada de voice agent:
Voice agent identifica al deudor (30 seg)
Llama a API de scoring con ID del deudor
API retorna: PTP score = 0.68, canal preferido = WhatsApp, mejor hora = 7pm, sentiment histórico = neutral
Voice agent ajusta estrategia: ofrece plan de pago flexible, menciona que puede enviar WhatsApp con resumen
Conversación optimizada según score → mayor conversión
Casos de Uso: Datos Alternativos en Acción
Caso 1: Detección Temprana de Estrés Financiero
Contexto: Banco retail en Colombia con cartera de tarjetas de crédito.
Problema: Recovery rate bajo en cartera 90+ días (muchos deudores ya en crisis financiera severa).
Solución con datos alternativos:
Integraron open banking para 40% de clientes que dieron consentimiento
Feature clave: caida_ingresos_30d = (ingresos mes actual / promedio 3m) - 1
Modelo detecta clientes con caída de ingresos > 25% antes de que entren en mora
Trigger proactivo: llamada de "¿todo bien? Vemos cambios en tu situación financiera, ¿podemos ayudarte con un plan?"
Resultado:
Contacto proactivo redujo entrada a mora 90+ en 32%
Recovery rate en cartera temprana mejoró de 58% a 76%
CSAT aumentó (clientes valoran que el banco "se preocupa" antes de que la situación empeore)
Caso 2: Optimización de Canal por Perfil Digital
Contexto: Fintech mexicana con base de usuarios jóvenes (18-35 años).
Problema: Baja tasa de contacto con voice agents (answer rate de 35%).
Solución con datos alternativos:
Analizaron engagement digital: uso de app, opens de emails, clicks en notificaciones push
Top 30K por score reciben gestión intensiva, resto gestión ligera (solo WhatsApp)
Resultado:
Recovery rate en top 30K: 81% (vs. 54% con priorización tradicional por DPD/saldo)
Recuperación total aumentó $2.1M USD/mes con la misma capacidad operativa
Consideraciones de Privacidad y Compliance
Regulaciones en LATAM
Brasil (LGPD): Requiere consentimiento explícito para datos sensibles, derecho a portabilidad y eliminación
México (Ley Federal de Protección de Datos): Aviso de privacidad obligatorio, consentimiento para datos financieros
Argentina (Ley 25.326): Registro de bases de datos, derecho de acceso y rectificación
Colombia, Chile: Leyes similares en línea con GDPR europeo
Best Practices
Consentimiento granular: No agrupar todo en un "acepto términos"; explica qué datos usas y por qué
Minimización de datos: Colecta solo lo que realmente usarás en modelos
Anonimización: Para analytics internos, usa datos anonimizados cuando sea posible
Retención limitada: Define políticas de cuánto tiempo guardas datos alternativos (ej: 12 meses post-liquidación de deuda)
Explicabilidad: Usa modelos interpretables o técnicas (SHAP, LIME) para explicar decisiones a reguladores/deudores
Auditoría de sesgo: Revisa periódicamente que tus modelos no discriminen por raza, género, ubicación geográfica
Kleva: Datos Alternativos Integrados
Kleva incorpora datos alternativos en su plataforma de cobranza automatizada:
Voice analytics incluido: 100% de conversaciones analizadas para sentiment, razones de no pago, cumplimiento de promesas
Integraciones pre-built: Conectores con proveedores de open banking (Belvo, Fintoc), telco data, y CRMs
Modelos propietarios: Entrenados con $5M+ USD cobrados en 7 países LATAM, optimizados para cada mercado
Scoring en tiempo real: Durante la llamada, el voice agent accede a score actualizado y ajusta estrategia dinámicamente
Compliance by design: Cumplimiento LGPD, GDPR, regulaciones locales, con auditoría de sesgo trimestral
Con 73% recovery rate y 94% FCR, hemos demostrado que integrar datos alternativos no es un experimento académico: es una ventaja competitiva medible en dólares recuperados.
Si tu scoring de cobranza aún se basa solo en días de mora y saldo vencido, estás dejando dinero sobre la mesa. Los datos para predecir propensión a pagar con precisión ya existen. La pregunta es: ¿cuándo empezarás a usarlos?
Talk to a human
No bots, no endless forms. Fill in your details and someone from our team will reach out.
Your information is secure and will only be used for scheduling purposes
from
·
Reach us out
Reach out directly to our team*
Email hi@kleva.co
WhatsApp+1 704-816-9059
OfficeMiami, Florida
Stop losing money oncollections
Every day you wait costs you thousands in lost recovery and wasted resources