PIXLA — on-premise řešení pro přepis mluveného slova do textu — si poradí s více než 30 jazyky, a má tedy ambice uspět i v zahraničí. Cílí na organizace pracující s citlivými texty, datově objemnými soubory k přepisu a na firmy, které potřebují přepsat velmi velké množství textu.
V době, kdy se vývojáři soustředí téměř výhradně na cloudová řešení, se společnost Venlan věnovala vývoji komplexního on-premise řešení AI Transcriber PIXLA určeného pro přepis mluveného slova do textu. Pracuje výhradně s daty v zabezpečené síti zákazníka a cílí tak na subjekty pracující s důvěrnými či datově velmi objemnými soubory. Uživateli mohou být soudy, státní či městské úřady, nemocnice, callcentra nebo i TV a rozhlasové stanice. „Troufám si tvrdit, že nabízíme nejlepší výsledky při převodu akademických textů plných odborných termínů z právní praxe, zdravotnictví či historie,“ doplňuje zaměření produktu Vladislav Janeček, jednatel společnosti Venlan. PIXLA si troufá na přepisy textů z mluveného slova ve více než 30 jazycích, přičemž základ tvoří všechny jazyky používané v EU. Díky pokročilým nástrojům umělé inteligence využívá nejen rozpoznávání slov či hlásek, ale bere v úvahu i kontext. Díky tomu by výsledkem měl být přirozeně znějící text, velmi se blížící vzoru a současně jsou do značné míry eliminovány přeřeknutí, odkašlání nebo často se opakující citoslovce. Základem Venlan AI Transcriber PIXLA je hardwarové zařízení určené k instalaci do infrastruktury vnitřní zabezpečené sítě. Ovládání je řešeno přes správce souborů: stačí přetáhnout audiovizuální soubor do okna aplikace, která zajistí jeho zkopírování do zabezpečeného úložiště PIXLY, kde je zvuk pomocí integrovaných výpočetních prostředků převeden na text a soubor je následně automaticky smazán. Z videí získá uživatel kromě čistého textu také soubor typu .srt s titulky. Části textu, kterým transcriber dobře nerozuměl, jsou barevně zvýrazněny. Aplikace je k dispozici pro operační systémy Windows, macOS i Linux. Kromě toho lze systém integrovat i přímo do firemního systému či spisové služby pomocí protokolu restAPI. Přestože možnosti převodu závisejí na kvalitě zvukového záznamu, překladač si prý dobře poradí i s nežádoucími ruchy. Aktuální novinkou implementovanou do řešení je převod hlasu do textu v reálném čase prostřednictvím aplikace běžící na počítači uživatele nebo na mobilním telefonu se systémem Android (aplikace prochází schvalováním v Google Play Store). Tuto funkci lze využít například pro diktování lékařských zpráv nebo titulkování mluvčích na konferencích. Technologie a modely Venlan AI Transcriber PIXLA jsou ovšem k dispozici také jako cloudová služba. /fv/