Ranní výběr novinek z posledních dní pro stavbu a provoz AI chatbotů a voicebotů (se zaměřením na telco provoz, latenci, náklady a spolehlivost).
OpenAI: Realtime API je „GA“ + nový speech‑to‑speech model gpt‑realtime (SIP, MCP, image input)
OpenAI oznámilo obecnou dostupnost Realtime API a současně nový model gpt-realtime pro end‑to‑end hlasové aplikace (audio in → audio out), který má být výrazně lepší v instrukcích, přirozenosti řeči a přesnosti tool-callingu. Důležité je, že API nově umí SIP telefonii, takže lze napojit agenta přímo na PBX/SBC/SIP trunk a obsloužit klasické hovory bez „lepení“ dalších vrstev. Přibyla i podpora remote MCP serverů (jednodušší napojení na firemní nástroje/knowledge) a image input – praktické pro operátorské scénáře typu „pošli screenshot chybové hlášky“ nebo „vyfoť štítek zařízení“. Pro telco voiceboty to znamená jednodušší architekturu s menším počtem komponent (méně míst, kde se rozbije streaming, VAD/turn-taking nebo synchronizace), typicky i lepší latenci a konzistenci. Praktický takeaway: pokud provozujete voiceboty přes SIP, stojí za to otestovat, zda end‑to‑end audio model zvládne vaše compliance skripty (doslovné čtení disclaimerů, alfanumerika) a zda vám MCP zjednoduší integrace (CRM/ticketing/KB) bez vlastního „tool routeru“.
Zdroj: openai.com – Introducing gpt-realtime
OpenAI API changelog (03/2026): GPT‑5.4 + tool search, compaction a dlouhoběžící agentní workflow
V březnovém changelogu OpenAI přidalo nové modely GPT‑5.4 a GPT‑5.4 pro do Chat Completions/Responses a zároveň několik funkcí mířených na produkční agentní systémy. Z pohledu chatbotů/voicebotů je zajímavý zejména tool search (model může „odložit“ velké tool-surface do runtime), což typicky snižuje tokeny, zlepšuje cache-hit a tím i latenci – u voice scénářů to často rozhoduje, jestli UX působí „přirozeně“. Další klíčová věc je nativní compaction a velké kontextové okno: pro telco to pomáhá u dlouhých hovorů (billing, reklamace) držet kontext bez nekontrolovaného růstu nákladů. V praxi to posouvá doporučený design směrem k „session state managementu“: průběžná komprese, limity kontextu a jasná strategie, co se má pamatovat (a co ne) mezi turny. Takeaway: zrevidujte své prompt-instrukce a tool definice – když je tool-surface obří (CRM/knowledge), zvažte rozdělení do menších nástrojů + runtime výběr, protože to obvykle zlevní a zrychlí hlasový dialog.
Zdroj: developers.openai.com – Changelog
Rasa Pro 3.15.16/3.15.15 (03/2026): stabilita provozu, keepalive pro brokery a robustnější privacy joby
Rasa Pro vydala v posledních dnech několik oprav (3.15.15 a 3.15.16), které míří na typické produkční bolesti: stabilitu dlouho běžících procesů, konektivitu na event brokery a korektnost background jobů. Konkrétně se řeší chování Kafka event brokeru (poll thread jako daemon, korektní životní cyklus, aby testy i procesy „nezamrzaly“) a přidávají se volby typu socket_keepalive a backoff/refresh intervaly pro snížení idle dropů – v telco prostředí, kde jsou síťové prvky a firewally často agresivní, to má přímý dopad na spolehlivost. Dále jsou tam změny kolem PII anonymizace a deletion cronů (lockování, obrana proti JSON patch edge-caseům, zachování pořadí eventů), což je důležité pro GDPR provoz a auditovatelnost. I když to nejsou „sexy“ novinky, je to přesně ten typ změn, který snižuje incidenty (zaseknuté joby, ztráta dat, nekonzistence trackerů) a tím i náklady na on-call. Takeaway: pokud Rasou obsluhujete hlasové kanály a spoléháte na event broker a privacy joby, naplánujte update a přidejte syntetické testy na reconnect/idle a na rekonstrukci trackeru po delete/anonymize – právě tam se produkce láme.
Zdroj: rasa.com – Rasa Pro Change Log
Závěr: 3 rychlé takeaway pro telco voice/AI
- Voice agentů se vyplatí zbavovat „lepené“ pipeline: end‑to‑end audio model + SIP integrace často zlepší latenci i stabilitu.
- Optimalizace tool-surface a práce s kontextem (compaction, runtime výběr toolů) je dnes přímo UX faktor u hlasu.
- „Nudné“ provozní opravy (keepalive/backoff, privacy cron joby) mají v telco větší ROI než další marketingové feature.
