Kontext
Ein Echtzeit-Assistent für deutsche Telefonate.
Problem
Mitarbeiter brauchen die richtige Antwort mitten im Call, auf Deutsch, sofort.
Meine Rolle
Alleiniger Architekt & Engineer.
Vorgehen
Mic → STT → Claude-Tipps → TTS, per WebSocket gestreamt mit Sub-Sekunden-Latenz.
Ergebnis
Live-Vorschläge, während echter deutscher Calls geflüstert.
Stack
DeepgramWhisperClaudeXTTS-v2WebSocket