Ranní AI/Voice briefing – 2026-01-28

Výběr 3 čerstvých zahraničních novinek relevantních pro stavbu a provoz chatbotů/voicebotů (se zaměřením na telco). U každé položky je „co se stalo“ + dopad na praxi + konkrétní takeaway.

1) LiveKit: $100M Series C a důraz na „realtime & stateful“ architekturu voice agentů

LiveKit oznámil investici 100M USD (valuace 1B) a hlavně popsal, proč jsou voice aplikace zásadně jiné než klasické weby: jsou realtime a stavové (dlouhé relace, turn‑taking, přerušování, kontinuální poslech). To je pro telco důležité, protože kvalitu zákaznického hovoru nejčastěji nezabije „špatný LLM“, ale rozpad orchestrace (ASR→LLM→TTS), fronty u providerů a chybějící řízení latence. LiveKit klade důraz na testování nedeterministických systémů statisticky (simulace) a na observability (time‑aligned transkripty, replays, traces) – to je přesně to, co potřebuješ pro audit a ladění voice bota v produkci. Praktický dopad: měř turn latency (P95/P99) end‑to‑end jako top KPI a navrhni fallbacky (provider failover, degradace scénářů, přechod na DTMF/callback). Takeaway: odděl vrstvu transportu audia (PSTN/WebRTC), vrstvu orchestrace modelů a vrstvu observability – a instrumentuj každou fázi pipeline.

Zdroj: blog.livekit.io/livekit-series-c/

2) NVIDIA: tutorial „Voice agent s RAG + safety guardrails“ (Nemotron stack)

NVIDIA publikovalo praktický návod, jak poskládat voice‑powered RAG agenta s guardrails: streaming ASR, multimodální embedding/reranking, reasoning a bezpečnostní filtr včetně PII detekce. Pro voiceboty v telco je klíčové, že tahle architektura explicitně řeší dvě produkční bolesti: latenci (streaming, nastavitelné kompromisy WER vs. latency) a bezpečnost (moderace + PII), které jsou u hlasu ještě zrádnější kvůli šumu v přepisu. V praxi to znamená: nestačí mít „dobrý prompt“ – potřebuješ kontrolní body před i po generaci a jasná pravidla, kdy se bot zastaví / zeptá / eskaluje. Dopad na práci: ber to jako referenční blueprint pro interní AIVoice PoC – dá se z toho přímo odvodit backlog (ASR streaming, RAG index, safety/PII, monitoring). Takeaway: pokud nemáš guardrails a měření latence po krocích, nasadíš bota „naslepo“ a budeš hasit až stížnosti.

Zdroj: developer.nvidia.com/blog/how-to-build-a-voice-agent-with-rag-and-safety-guardrails

3) Delivery Hero: -60% eskalací díky automatizovaným IVR/TTS hovorům přes Twilio

Podle Twilio/RTIH nasadil Delivery Hero automatizované volání v rider aplikaci pro situace „zákazník není k zastižení u dveří“ a reportuje 25% pokles kontaktování a >60% méně eskalací rider→agent. Klíčová lekce pro voiceboty: největší ROI často přichází z dobře vybraného mikro‑use‑casu s jasným momentem v procesu (tady „handover u dveří“), krátkým dialogem a jednoduchou akcí (potvrdit dostupnost / zrušit). Z telco pohledu je důležitý i compliance aspekt: odstranili volání z osobních telefonů (privacy/regulace) a používají lokální čísla + jazykovou volbu, což zvyšuje míru zvednutí. Praktický dopad: podobný pattern lze mapovat na telco field service (technik na adrese), instalace, reklamace – všude, kde je kritický „moment pravdy“ a čekání na agenta je drahé. Takeaway: u voice automatizace začni use‑casem s jasnou metrikou (answer rate, containment, eskalace) a teprve pak přidávej složitější generativní dialog.

Zdroj: retailtechinnovationhub.com (Delivery Hero + Twilio)

3 rychlé takeaways pro telco/voice

  • Měř P95/P99 turn latency end‑to‑end a dělej z toho SLO – bez toho nebudeš vědět, proč je konverzace „choppy“.
  • Guardrails/PII nejsou volitelné: hlas → přepis → LLM musí mít filtry a auditní stopu.
  • ROI začíná mikro‑use‑casem: krátké, opakovatelné scénáře s jasnou metrikou (containment, answer rate, eskalace).