Reach us out
Reach out directly to our team*
- Email hi@kleva.co
- WhatsApp +1 704-816-9059
- Office Miami, Florida
Diseño técnico completo de arquitectura de cobranza omnicanal con IA que orquesta voz, WhatsApp, SMS y email para maximizar recuperación.
May 8, 2026 11 min read
|Un sistema de cobranza omnicanal con IA no es simplemente conectar voice agents, WhatsApp y email. Es una arquitectura inteligente que decide qué canal usar, cuándo, con qué mensaje y en qué secuencia para cada deudor, aprendiendo continuamente de millones de interacciones.
La diferencia entre multicanal (tener varios canales operando independientemente) y omnicanal (orquestación inteligente con contexto unificado) marca 25-35% de diferencia en tasas de recuperación. Pero construir esta arquitectura correctamente requiere decisiones técnicas precisas en 8 capas críticas.
Esta guía presenta el blueprint arquitectónico completo para sistemas de cobranza omnicanal de nivel empresarial, basado en implementaciones que procesan $5M+ mensuales en recuperaciones en LATAM.
Antes de entrar en componentes técnicos, establece principios no-negociables:
Plataformas como Kleva implementan esta arquitectura en 7 países de LATAM, logrando 73% de tasa de recuperación con 94% de resolución en primer contacto gracias a orquestación inteligente cross-canal.
CapaFunción PrincipalTecnologías Clave
1. Ingesta y Normalización de DatosConsolidar carteras de múltiples fuentesAPIs REST, Webhooks, ETL, Message Queues
2. Motor de Decisión de CanalElegir canal óptimo para cada contactoML Models, Rule Engines, A/B Testing
3. Orquestador de CampañasCoordinar secuencias multicanalWorkflow Engines, State Machines
4. Capa de Canales (Voz, WhatsApp, SMS, Email)Ejecutar interacciones en cada canalVoice AI, WhatsApp Business API, Twilio, SendGrid
5. Motor de Contexto ConversacionalMantener estado unificado cross-canalRedis, PostgreSQL, Event Sourcing
6. Capa de Integración de PagosProcesar promesas y pagos en tiempo realPayment Gateways, Banking APIs, Crypto
7. Analytics y Machine LearningAprender y optimizar estrategiasData Warehouses, ML Pipelines, BI Tools
8. Capa de Compliance y AuditoríaAsegurar cumplimiento regulatorioLogging, Encryption, Access Control
Datos de cobranza vienen de múltiples sistemas: core bancario, CRM, archivos batch, APIs de terceros. Cada uno con formato, frecuencia y calidad diferente.
Componentes:
Flujo de datos:
Core Bancario (API) ──┐
CRM (Webhook) ├─→ API Gateway ─→ Message Queue ─→ Validation ─→ Normalization ─→ Database
Archivo CSV (SFTP) ─┘
DecisiónOpción AOpción BRecomendación
ProcesamientoSíncrono (bloqueante)Asíncrono (queue)Opción B - Mayor resiliencia y escalabilidad
ValidaciónRechazar datos inválidosAceptar y marcar para revisiónHíbrido - Rechazar críticos, marcar no-críticos
Frecuencia de ingestaBatch diarioTiempo real (streaming)Opción B para mora temprana, A para resto
¿Llamar, enviar WhatsApp o SMS? ¿En qué horario? ¿Con qué frecuencia? La respuesta óptima varía por deudor, mora, historial.
Modelo de 3 Niveles:
Nivel 1: Reglas de Negocio (Deterministicas)
Nivel 2: Scoring Predictivo (ML)
Modelo predice probabilidad de éxito por canal basado en:
Nivel 3: Optimización de Portfolio
Tecnologías:
Flujo de decisión:
Deudor ─→ Reglas de Compliance ─→ Scoring ML por Canal ─→ Optimización ─→ Decisión: Canal + Timing
(filtro eliminatorio) (probabilidades) (priorización) (acción ejecutable)
Gestionar secuencias multicanal complejas: "Si no contesta llamada, enviar WhatsApp en 2 horas. Si abre pero no responde, SMS al día siguiente. Si promete pagar, email de confirmación."
Patrón: State Machine por Deudor
Cada deudor tiene estado en workflow omnicanal:
Estado Inicial ─→ Intento Llamada 1 ─→ [No contesta] ─→ WhatsApp 1 ─→ [Leído sin respuesta] ─→ SMS Recordatorio
└─→ [Contesta] ─→ Conversación ─→ [PTP] ─→ Seguimiento Email
└─→ [Rechaza] ─→ Esperar 48h ─→ Llamada 2
Componentes:
HerramientaProsContrasIdeal Para
Apache AirflowMaduro, flexible, PythonNo diseñado para workflows por entidadCampañas batch periódicas
Temporal.ioWorkflows de larga duración, resilienteCurva de aprendizajeOrquestación compleja multicanal
Custom con Redis/PostgreSQLControl total, simple para casos básicosRequiere desarrollo customMVPs y prototipos rápidos
Recomendación: Temporal.io para producción escalable, custom para MVPs.
Stack técnico:
Flujo:
Deudor contesta ─→ ASR transcribe ─→ NLU detecta intención ─→ Lógica decide respuesta ─→ TTS genera audio ─→ Reproduce
└─→ Actualiza contexto ─→ Loop hasta fin de llamada
Stack técnico:
Consideraciones:
Stack técnico:
Best practices:
Stack técnico:
Todos los canales implementan interfaz consistente para el orquestador:
interface CanalEjecucion {
enviar(deudor, mensaje, contexto): Promise<Resultado>
verificarEstado(idMensaje): Promise<Estado> // entregado, leído, respondido
recibirRespuesta(callback): void
}
Deudor recibe llamada el lunes, WhatsApp el martes, SMS el miércoles. Cada interacción debe conocer historia completa sin hacer repetir al deudor.
Contexto Unificado por Deudor:
{
"deudor_id": "12345",
"historial_interacciones": [
{"timestamp": "2026-05-01T10:30", "canal": "voz", "resultado": "no_contesta"},
{"timestamp": "2026-05-01T14:00", "canal": "whatsapp", "resultado": "leido", "respuesta": null},
{"timestamp": "2026-05-02T09:15", "canal": "voz", "resultado": "ptp", "monto": 500, "fecha": "2026-05-05"}
],
"estado_actual": "promesa_pago_pendiente",
"preferencias": {"canal_preferido": "whatsapp", "horario_contacto": "tarde"},
"datos_deuda": {"monto_vencido": 1200, "dias_mora": 15},
"metadata": {"intentos_totales": 3, "ultimo_contacto": "2026-05-02T09:15"}
}
Almacenamiento:
Ejemplo en llamada:
Voice Agent: "Hola Juan, te llamamos nuevamente de Banco X. El lunes enviamos un WhatsApp sobre tu pago de $500 que vence mañana. ¿Podrás cumplir con ese compromiso?"
El agent sabe sobre el WhatsApp previo y la promesa anterior, sin preguntar de nuevo.
Componentes:
Flujo de pago omnicanal:
Voice Agent negocia monto ─→ Sistema genera link de pago ─→ Envía por SMS/WhatsApp ─→ Deudor paga
↓
Webhook notifica ─→ Sistema actualiza deuda ─→ Cancela contactos futuros programados ←┘
ETL hacia Data Warehouse:
Datos operacionales (PostgreSQL) ─→ ETL (Apache Spark/dbt) ─→ Data Warehouse (Snowflake/BigQuery)
↓
ML Feature Store ─→ Modelos
↓
BI Dashboard (Metabase/Looker)
ModeloInputOutputUso
Propensity to PayPerfil deudor, historial, contextoProbabilidad de pago 0-1Priorización de cartera
Channel EffectivenessDeudor, canal, timing, historialScore por canalDecisión de canal óptimo
Churn PredictionComportamiento de pagoRiesgo de default futuroCobranza preventiva
Sentiment AnalysisTranscripción de conversaciónSentimiento negativo/neutral/positivoEscalamiento a humano
Componentes:
Kleva opera en 7 países con 0 violaciones regulatorias integrando compliance en cada capa de la arquitectura.
┌─────────────────────────────────────────────────────────────────────────┐
│ FUENTES DE DATOS │
│ Core Bancario │ CRM │ Archivos │ APIs Externas │
└────────────────────────┬────────────────────────────────────────────────┘
│
┌────▼─────┐
│ Ingesta │
│ Gateway │
└────┬─────┘
│
┌────────────▼──────────────┐
│ Motor de Decisión │
│ (Reglas + ML) │
└────────────┬──────────────┘
│
┌────────────▼──────────────┐
│ Orquestador Campañas │
│ (Workflow Engine) │
└────────────┬──────────────┘
│
┌────────────────────┼────────────────────┐
│ │ │
┌───▼───┐ ┌────▼─────┐ ┌────▼────┐
│ Voice │ │ WhatsApp │ │ SMS │
│ Agent │ │ Business │ │ Gateway │
└───┬───┘ └────┬─────┘ └────┬────┘
│ │ │
└───────────────────┼───────────────────┘
│
┌───────────▼────────────┐
│ Contexto Unificado │
│ (Redis + PostgreSQL) │
└───────────┬────────────┘
│
┌──────────────┼──────────────┐
│ │ │
┌─────▼─────┐ ┌────▼─────┐ ┌────▼──────┐
│ Pagos │ │ Analytics│ │ Compliance│
│ Gateway │ │ + ML │ │ + Audit │
└───────────┘ └──────────┘ └───────────┘
CapaTecnología RecomendadaAlternativa
BackendPython (FastAPI) o Node.jsGo para alta performance
Message QueueKafka para volumen alto, RabbitMQ para simplicidadAWS SQS (managed)
DatabasePostgreSQL (relacional) + Redis (cache)MongoDB si prefieres NoSQL
WorkflowTemporal.ioApache Airflow, custom
Voice AIOpenAI Whisper + GPT-4 + ElevenLabsGoogle Dialogflow CX
WhatsAppWhatsApp Business API via Twilio360Dialog, MessageBird
SMSTwilio Programmable SMSAWS SNS, Nexmo
EmailSendGridAWS SES, Mailgun
Data WarehouseSnowflake o BigQueryRedshift, ClickHouse
ML PlatformScikit-learn + XGBoost en producciónAWS SageMaker (managed)
MonitoringDatadog o New RelicPrometheus + Grafana (open-source)
EscalaVolumenArquitectura
Startup1K-10K cuentas/mesMonolito simple, managed services
Empresa Mediana10K-100K cuentas/mesMicroservicios, queue-based, cache agresivo
Empresa Grande100K-1M+ cuentas/mesDistribuido multi-región, sharding, event-driven
Síntoma: Agregar WhatsApp requiere modificar código de Voice Agent.
Solución: Interfaz unificada de canal, cada uno como microservicio independiente.
Síntoma: Deudor se queja "ya les dije por WhatsApp que pagaré el viernes, ¿por qué me llaman?"
Solución: Motor de contexto centralizado que todos los canales consultan antes de contactar.
Síntoma: Sistema colapsa cuando se cargan 100K cuentas simultáneamente.
Solución: Message queue con rate limiting, procesamiento asíncrono.
Síntoma: Modelos predicen pero nunca se valida si acertaron.
Solución: Pipeline que une predicciones con outcomes reales (¿hubo pago?) para re-entrenamiento.
Síntoma: Post-lanzamiento descubren que violan regulación de frecuencia de contacto.
Solución: Capa de compliance que valida toda acción antes de ejecutar, no después.
DimensiónMétricaTarget
PerformanceLatencia decisión de canal
ResilienciaUptime del sistema>99.5%
EscalabilidadThroughput (cuentas/hora)Linear con recursos
EfectividadLift omnicanal vs canal único+25-35%
CostoCosto por cuenta gestionada$3-5 (vs $10-15 humano)
Una arquitectura de cobranza omnicanal bien diseñada no es solo infraestructura técnica; es activo estratégico que determina:
Instituciones financieras y BPOs que dominan esta arquitectura procesan 10-100X más volumen con mejor recuperación y menor costo que competidores con sistemas legacy fragmentados.
¿Listo para implementar arquitectura omnicanal de nivel empresarial? Descubre cómo Kleva ofrece esta arquitectura completa como plataforma en 7 países de LATAM, logrando 73% de recuperación, 94% de FCR y 70% de reducción de costos, con orquestación inteligente de voz, WhatsApp, SMS y email, procesando $5M+ mensuales en recuperaciones con 0 violaciones regulatorias.
No bots, no endless forms. Fill in your details and someone from our team will reach out.
Reach out directly to our team*
No bots, no endless forms.