Skip to main content
Alle Cases

Sprachagenten, die das Vorhersehbare behandeln und den Rest übergeben

Eine Voice-KI-Plattform, die strukturierte Kundeninteraktionen Ende zu Ende löst, an einen Menschen eskaliert, sobald das Gespräch den sicheren Rahmen verlässt, und jeden Austausch mit überprüfbaren Transkripten protokolliert.

01

Sprachkanäle sind die letzte Front des Kundenservice. Bots, die Web-Chat einigermaßen gut bewältigen, scheitern am Telefon, weil sich Konversationslatenz, Akzente und Umgebungsgeräusche aufaddieren. Die meisten Organisationen besetzen die Linie zu vollen Kosten oder verlieren Kunden an lange Wartezeiten.

Die Organisation in diesem Auftrag wollte Self-Service für die vorhersehbaren Interaktionen (Statusprüfungen, einfache Buchungen, Routineanfragen), ohne die Qualität der schwierigeren Anrufe zu beeinträchtigen.

02

Focus AI entwarf einen Sprachagenten, der auf einen klar definierten Rahmen von Absichten beschränkt ist. Jede Absicht hat ein Skript, eine Reihe von Slots und explizite Erfolgskriterien. Das Modell darf innerhalb des Rahmens konversationell sein und muss an einen Menschen übergeben, sobald das Gespräch außerhalb davon abdriftet.

Die Latenz wird auf den Punkt heruntergeplant, an dem sich das Hin und Her natürlich anfühlt. Speech-to-Text, Modellschlussfolgerung und Text-to-Speech sind pipelined; Teilergebnisse streamen, sodass die wahrgenommene Antwortzeit niedrig bleibt. Jeder Anruf wird transkribiert und zusammengefasst; das strukturierte Ergebnis wird in das operative System zurückgespeist.

Der Übergabepfad wird als erstklassiges Feature behandelt. Ein Mensch übernimmt mit dem vollständigen Gesprächskontext bereits vor sich.

03

Routineinteraktionen werden nun ohne menschliches Eingreifen gelöst, während wirklich komplexe Fälle schneller als zuvor einen Menschen erreichen, weil sie nicht mehr hinter einfachen warten. Die Anrufqualitätswerte stiegen, statt zu sinken, weil die rein menschlichen Anrufe volle Aufmerksamkeit erhalten.

Die Transkriptschicht ist auch ein Forschungsasset: Schmerzpunkte, wiederkehrende Anfragen und Sprachmuster sind nun in großem Maßstab sichtbar, nicht anekdotisch.

  • TypeScript
  • Next.js
  • Streaming-STT/TTS
  • LLM mit eingeschränkten Ausgaben
  • Transkript-Speicher

Sagen Sie uns, wo Sie feststecken.

Jedes Projekt startet mit einer fokussierten Sitzung zu Ihren Engpässen. Keine Folien, keine Show. Wir hören zu, verstehen und führen am Problem aus.