Diktovanie hlasom v Slovenčine aj offline

Vyšlo v časopise Nový život, vrámci seriálu "Technovinky"

Väčšina z nás, čo používame inteligentné mobilné telefóny isto občas použije diktovanie hlasom. Popri písaní na brailovej klávesnici na displeji telefónu je to ďalšia možnosť zadávania textu, ktorá je použiteľná pokiaľ ide o rýchlosť. Okrem diktovania môžeme pri rôznych asistentoch použiť diktovanie napríklad aj na zadávanie povelov. Používatelia Corvusu napríklad isto vedia o možnosti, keď na hlavnej obrazovke pridržia tlačidlo pre pridávanie hlasitosti a po zaznení známeho zvuku, môžu vyvolať niektoré funkcie. Napríklad vyhľadať spojenie v cestovných poriadkoch, knihu v knižnici či nastaviť budík, alebo časovač.

Všetkým známou nevýhodou diktovania hlasom je fakt, že ak chceme aby fungovalo, musí byť telefón pripojený k internetu. Už menej známou je ale informácia, že existuje iniciatíva, ktorej cieľom je vytvoriť nástroj, ktorý nám umožní používať prevod reči na text (tak sa funkcia pre diktovanie hlasom nazýva) aj offline, teda bez aktívneho pripojenia do internetu. Volá sa to whisper a vyvíja sa to v rámci openAI. Whisper rozumie aj Slovenčine a za nevýhodu popri nižšej kvalite rozpoznávania, ak ho porovnávame s rozpoznávačom od Googlu asi môžeme považovať aj fakt, že mu rozpoznávanie trvá dlhšie, približne 3 sekundy, ak použijeme rýchly no menej kvalitný model, alebo 6 sekúnd, ak použijeme lepší rozpoznávač.

No a nad whisperom sa následne tvorí Tzv. vstupná metóda, ktorú možno po nainštalovaní nastaviť v telefónoch s Androidom ako nástroj, ktorý sa má používať pri prevode reči na text. Github repozitár so zdrojovým kódom projektu nájdete tu: [https://github.com/woheller69/whisperIME]()https://github.com/woheller69/whisperIME

Na tejto stránke sa však nachádza len zdrojový kód. Ak si chcete whisperIME (tak sa volá aplikácia, ktorá nás zaujíma) vyskúšať, tak použite napríklad obchod FSDroid, alebo si zo stránok FS Droidu stiahnite balíček a ručne nainštalujte do telefónu. https://f-droid.org/packages/org.woheller69.whisper/. Hľadajte odkaz s názvom "Download APK"

Po nainštalovaní je potrebné nastaviť WhisperIME ako predvolený nástroj pre diktovanie hlasom. Najprv aplikáciu spustite a dovoľte jej stiahnuť potrebné modely, stiahne si približne 450 MB dát. Následne ju budete môcť nastaviť ako predvolenú, používatelia "čistého" Androidu od Googlu to urobia v nastaveniach>systém>jazyky>reč>hlasový vstup, používatelia Samsungov budú musieť trochu pohľadať. Pri výbere predvoleného rozpoznávača si všimnite aj tlačidlo nastavení. Po jeho aktivovaní budete môcť nastaviť, či chcete použiť rýchly, no menej kvalitný, alebo pomalší a kvalitnejší model a či má rozpoznávač detegovať jazyk automaticky, alebo ho nastavíte ručne, čím rozpoznávanie takisto urýchlite.

Ja osobne som vyššie opísaný softvér skôr skúšal, ako že by som ho naozaj dlhodobo používal. Diktujem veľmi málo, ovládanie hlasom používam asi najviac pri vyhľadávaní spojení, takže offline verziu príliš nepotrebujem. Nedám teda ruku do ohňa za to, že je dobrý, alebo aspoň dostatočne použiteľný. Ak však diktovanie občas používate a nie ste neustále on-line, tak určite stojí za vyskúšanie.