VoiceBot
VoiceBot je volitelná funkce, která umožňuje automatizované hlasové konverzace s volajícími. Lze jej využít pro samoobslužné scénáře, kvalifikaci hovorů nebo jako plně autonomního hlasového agenta.
VoiceBot obsluhuje hlasový kanál — převádí mezi řečí a textem — takže konverzační backendy pracují pouze s prostým textem, podobně jako chatbot.
Architektura
Pipeline VoiceBota je rozdělen do tří kroků, pojmenovaných podle lidských orgánů:
| Krok | Název | Funkce |
|---|---|---|
| 👂 | Uši (Speech-to-Text) | Převádí hlas volajícího na text v reálném čase |
| 🧠 | Mozek (Konverzace) | Přijímá text, zpracovává jej a generuje textovou odpověď |
| 👄 | Ústa (Text-to-Speech) | Převádí textovou odpověď zpět na hlas pro volajícího |
Toto oddělení umožňuje stavět složité hlasové interakce nad backendy, které pracují pouze s textem. Například CRM systém nemusí řešit audio streamy, kodeky ani časování v reálném čase — jednoduše přijme textovou zprávu a vrátí textovou odpověď.
Kroky Uši a Ústa také obsahují interní funkce, které zlepšují uživatelský zážitek, jako je podkladový zvuk, přirozené pauzy a úpravy časování, aby konverzace působila přirozeněji.
Konverzační backendy
Krok Mozek podporuje více backendů:
- Interní (LLM) — používá Azure OpenAI (např. GPT-4.1) jako konverzační engine. Celá dialogová logika běží v rámci UCS.
- Externí (integrovaný systém) — deleguje konverzaci na externí systém (např. OSL nebo jinou CRM/dialogovou platformu). UCS odešle text volajícího externímu systému a přijme textovou odpověď. Dialogový tok řídí externí systém.