Project Description
Busco un desarrollador o arquitecto de soluciones de IA con experiencia comprobable en la implementación de agentes de voz automatizados de baja latencia. El objetivo es gestionar un volumen de 5,700 llamadas mensuales (aprox. 28,000 minutos) de forma eficiente y con costos de infraestructura optimizados.
Requerimientos Técnicos (Stack Obligatorio):
Para este proyecto, NO buscamos soluciones cerradas (tipo Vapi o Retell). Queremos una arquitectura basada en componentes que nos permita escalar sin márgenes excesivos por minuto. El candidato debe dominar:
Orquestación: LiveKit o similares para el manejo de WebRTC y transporte de audio.
STT (Speech-to-Text): Deepgram (Nova-2) por su baja latencia.
LLM (Cerebro): Implementación vía Groq (usando Llama 3) para garantizar respuestas en milisegundos.
TTS (Text-to-Speech): Cartesia o Deepgram Aura.
Telefonía: Integración directa con Twilio o Telnyx.
Automatización: Conexión de datos mediante n8n para el registro de leads en CRM.
Desafíos a Resolver:
Optimización de Costos: El 80% de las llamadas son de prospección básica (<5 min). La arquitectura debe ser extremadamente barata en estos casos.
Latencia: La conversación debe sentirse natural, con tiempos de respuesta menores a 800ms.
Lógica de Negocio: El agente debe distinguir entre consultas breves (curiosos), soporte técnico y cierre de ventas (llamadas de 15 min).
Entregables:
Agente de voz funcional configurado en nuestro servidor/VPS.
Documentación de la arquitectura y flujos de n8n.
Pruebas de estrés iniciales para asegurar que soporta llamadas concurrentes.
A los candidatos:
Por favor, al postularte inicia tu mensaje con la frase "Latencia Cero" para saber que leíste todo. Adjunta ejemplos de agentes de voz que hayas desplegado previamente y explícanos brevemente cómo gestionarías la concurrencia en este volumen.