Skip to main content
Tous les cas

Des agents vocaux qui gèrent le prévisible, escaladent le reste

Une plateforme d'IA vocale qui résout les interactions structurées avec les clients de bout en bout, escalade à un humain dès que la conversation sort de l'enveloppe sûre, et journalise chaque échange avec des transcriptions vérifiables.

01

Les canaux vocaux sont la dernière frontière du service client. Les bots qui gèrent raisonnablement bien le chat web s'effondrent au téléphone parce que latence conversationnelle, accents et bruit ambiant se composent. La plupart des organisations ou bien staffent la ligne à plein coût ou bien perdent des clients sur de longues attentes.

L'organisation dans cette mission voulait du self-service pour les interactions prévisibles (vérifications de statut, réservations simples, demandes d'information de routine) sans compromettre la qualité des appels plus durs.

02

Focus AI a conçu un agent vocal contraint à une enveloppe d'intentions clairement définie. Chaque intention a un script, un ensemble de slots, et des critères de succès explicites. Le modèle a le droit d'être conversationnel à l'intérieur de l'enveloppe et est tenu de passer la main à un humain dès que la conversation sort.

La latence est ingénierie jusqu'au point où l'aller-retour sonne naturel. Speech-to-text, raisonnement du modèle et text-to-speech sont pipelinés ; les résultats partiels sont streamés pour que le temps de réponse perçu reste bas. Chaque appel est transcrit et résumé ; le résultat structuré est renvoyé dans le système opérationnel.

Le chemin de handoff est traité comme une fonctionnalité de premier ordre. Un humain reprend avec le contexte complet de la conversation déjà devant lui.

03

Les interactions de routine sont maintenant résolues sans intervention humaine alors que les cas vraiment complexes atteignent un humain plus vite qu'avant, parce qu'ils ne sont plus en file derrière les simples. Les scores de qualité d'appel sont montés au lieu de baisser, parce que les appels humains-seulement reçoivent toute l'attention.

La couche de transcriptions est aussi un actif de recherche : points de douleur, demandes récurrentes, schémas de langage sont maintenant visibles à l'échelle, plus anecdotiques.

  • TypeScript
  • Next.js
  • STT/TTS en streaming
  • LLM avec sorties contraintes
  • Stockage de transcriptions

Dites-nous où vous êtes bloqué.

Chaque projet commence par une session ciblée sur vos goulets d'étranglement. Pas de slides, pas de baratin. Nous écoutons, nous comprenons, nous exécutons sur le problème.