O hlasech v NVDA

Nastavení hlasu, kterým k uživateli promlouvá NVDA, nemusí být pro každého uživatele zřejmé. Navíc v terminologii panují jisté nejasnosti. Následující řádky proto mají za cíl vysvětlit způsob, jakým si může uživatel přizpůsobit parametry řečového výstupu. Nebude se řešit CO program říká, tedy jaké informace jsou prostřednictvím řeči prezentovány, ale JAK to říká (charakter hlasu, výška, hlasitost, rychlost apod.)

Úvodem definice pojmů použitých v rozhraní NVDA, jež budou postupně v dalším textu vysvětleny:
  • Hlasový výstup – zde by bylo přesnější Protokol hlasového výstupu, jenže by to v nabídce programu vypadalo strašně a stejně by to nic nevysvětlovalo. Jde o standard, na němž je založen konkrétní hlas.
  • Hlas - správněji Hlasový výstup, ale tento termín je již použit pro něco jiného. Faktem totiž je, že v rámci jedné technologie hlasového výstupu může být dostupných více jednotlivých hlasů lišících se svou barvou a dikcí, a navíc může být součástí konkrétního hlasového výstupu i podpora různých standardů, tedy SAPI4 a SAPI5.
  • SAPI – zkratka anglického Speech API, což znamená programové rozhraní pro (umělou) řeč. V současnosti se používají verze 4 a 5, nižší verze se nepoužívají. SAPI4 přežívá díky širší nabídce jednotlivých hlasů.
  • eSpeak – volně šířitelný hlas, jenž podporuje standard SAPI5 a je tedy možné jej instalovat do systému Windows. Je zabudován přímo do NVDA, aby měl uživatel k dispozici aspoň nějaký hlas i v případě, že je odečítač spuštěn na systému, kde nejsou k dispozici žádné hlasy. Máte-li tedy eSpeak ve Windows nainstalovaný, objeví se v NVDA hned dvakrát – jednou jako hlasový výstup, jenž aktivuje rodinu hlasů eSpeak přímo zabudovanou do NVDA, a jednak jako hlasy dostupné při vybrání hlasového výstupu SAPI5, kdy jsou k dispozici jen eSpeak hlasy přítomné v systému Windows.
  • Silence – pseudo výstup, jenž zcela umlčí NVDA. Ten se pak nebude po žádném hlasu shánět a bude se tvářit, jako by veškeré mluvení fungovalo normálně.
A jak to tedy funguje? Nejdříve se musíte rozhodnout, jaký standard hlasového výstupu si zvolíte. Po instalaci je předvolen eSpeak, jenž je součástí dodávky programu a je tedy k dispozici vždy. Problém může nastat jen v případě, že eSpeak nepodporuje vámi žádaný jazyk (neumí například dánsky nebo arabsky). Čeština a slovenština patří mezi eSpeakem podporované jazyky, take tohle nás bolet nemusí. Ne každý ale musí milovat „kvákání“, jímž se eSpeak projevuje. Pokud navíc spouštíte NVDA na svém stroji, jistě budete chtít zvolit poslouchatelnější hlas, který máte ve svém počítači nainstalován.

Jednodušší situace je u SAPI5. To je plně podporováno a pokud se vyskytnou problémy, nejde o věci zásadní, bránící používání konkrétního hlasu. Trochu jiná je bohužel situace u SAPI4. Pro tento standard jsou v NVDA zabudovány dva různé ovladače a žádný z nich se neprojevuje jako jednoznačně výhodnější. Někteří uživatelé mají lepší zkušenosti s ovladačem sap4serotek, druhým lépe funguje sapi4activevoice. Chcete-li tedy používat hlasy standardu SAPI4, nezbývá než oba ovladače vyzkoušet s vámi žádaným hlasem a zůstat u toho, který bude lépe vyhovovat.

Takže standard, tedy Hlasový výstup, jak je nazván dialog v NVDA, už máte vybraný a chcete vybrat konkrétní hlas. Vyvolejte tedy dialog Nastavení hlasu a můžete prozkoumat jeho možnosti. Obsah rozbalovacího seznamu Hlas zcela závisí na zvoleném hlasovém výstupu. Pokud je hlasovým výstupem zabudovaný eSpeak, najdeme v seznamu Hlas všechny hlasy všech jazyků, které eSpeak podporuje. Je-li vybrán některý z hlasových výstupů SAPI4, najdete v rozbalovacím seznamu Hlas všechny hlasy kompatibilní se SAPI4. Podobně to platí i pro hlasový výstup SAPI5. Znovu upozorňuji, že hlasy eSpeaku nenajdete, máte-li vybrán hlasový výstup SAPI4 a pokud si vyberete hlasový pseudovýstup Silence, tak v seznamu Hlas najdete jen položku Silence.

Po výběru žádaného hlasu nastal čas nastavit jeho základní charakteristiky, tedy tempo, jakým hlas mluví, základní výšku hlasu a jeho hlasitost. Všechny tyto hodnoty se nastavují posuvníky, jejichž vnitřní rozsah je 0 až 100. Zkušenost říká, že stejná číselná hodnota tempa a výšky hlasu znamená pro různé hlasy trochu něco jiného, takže zatímco jeden hlas na tempo 60 mluví dooost pooomaaaluuu, jinému už při stejné hodnotě tempa přestává být pro rychlost mluvení a nezvyk posluchače rozumět.

Zbývající zaškrtávací políčka v okně Nastavení hlasu se již týkají obsahu sdělovaných informací a proto se jimi v tomto článku nezabývám.

Ještě poznámka pro uživatele slovenské jazykové verze. Hlasový výstup je v ní ve verzi 0.5 nazván Syntetizér, tak aby vás to nemátlo.

Příspěvek byl publikován v rubrice novinky. Můžete si uložit jeho odkaz mezi své oblíbené záložky.

1 komentář u O hlasech v NVDA

  1. VH napsal:

    velmi dobry clanek

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *