Zrak bez zraku, alebo aspoň zaujímavá hračka?

Vyšlo v časopise Nový život, vrámci seriálu "Technovinky"

Nástroj opísaný v tomto texte sa mi zdá byť zaujímavý, priznávam sa však, že som nikdy nenašiel dosť motivácie venovať sa mu natoľko, aby mal pre mňa reálne využitie. Napriek tomu by som vám ho rád predstavil, pretože sa medzi vami možno nájdu takí, ktorí mu prídu na chuť a možno nás raz, niekedy v budúcnosti motivujú. Tých z vás, ktorých text neinšpiruje k poctivému tréningu možno potešia aspoň zaujímavé poznatky z optiky, ktorých máme hlavne my, čo nevidíme od narodenia zrejme poskromne.

Predstavíme si koncept, ktorý nám umožňuje "vidieť" prostredníctvom zvuku. Autorom myšlienky a tvorcom v počiatočných fázach projektu, ktorý začal vznikať v roku 1996, je Peter Meijer (podrobnosti o ňom možno nájsť na stránke uvedenej na konci tohoto textu), aktuálne sa projektu venuje pomerne veľká komunita venujúca sa výskumu a implementácii. K dispozícii máme aktuálne aplikáciu pre počítač s Windows, pre telefóny s operačným systémom Android a na stránkach projektu sa dá pohrať aj s webovou aplikáciou. K počítaču musí byť pripojená kamera, v telefóne prirodzene využívame zadnú kameru zariadenia.

Základná myšlienka prevodu obrazu na zvuk je jednoduchá. Vyššie spomenuté aplikácie snímajú obraz z kamery a transformujú ho do zvuku, využívajúc 3 nasledujúce parametre:

  1. Stereo zvuk: Každý načítaný snímok sa prehráva zľava doprava, zvuky ktoré počujeme zľava sa nachádzajú v ľavej časti zorného poľa kamery, zvuky ktoré sú v strede sú približne pred nami a tak podobne. Každá snímka sa štandardne prehráva jednu sekundu, rýchlosť prehrávania si však možno v aplikáciách nastaviť.
  2. Výška zvuku: odzrkadľuje "výšku" objektu. Teda napríklad, ak sa pozeráme na stôl, na ktorom sa na ľavej strane nachádza krabička zápaliek a na pravej strane je položený pohár, potom sa pri "prehratí" obrázka najprv ozve nižší zvuk vľavo (zápalková krabička je podstatne nižšia ako pohár) a následne vyšší zvuk vpravo.
  3. Intenzita zvuku: reprezentuje farbu objektu. Biele objekty sú "najhlučnejšie", čierne sú takmer tiché a hlasitosti medzi týmito extrémami odzrkadľujú jasnosť farby objektu.

Parametre 1 a 3 sú jednoduché a zrejmé, výška zvuku je však nositeľom neuveriteľného množstva informácií. Skúsme si predstaviť niekoľko jednoduchých obrázkov:

  • Bodka na ľavej strane zorného poľa: Pri prehratí obrázku počujeme pípnutie v ľavom kanály
  • Niekoľko rovnakých bodiek (majú rovnakú výšku) rozhádzaných na rovnej čiare pred nami: Počujeme sériu pípnutí prechádzajúcich zľava doprava
  • Vodorovná horizontálna čiara zľava doprava: počujeme jeden tón, prechádzajúci v stereu zľava doprava.
  • Čiara zľava doprava, najprv postupne stúpa, v strede začne klesať: Počujeme tón, ktorý začne vľavo, pri prechode doprava stúpa a pred nami začne klesať
  • Hrubší pás, s rovnakým tvarom ako čiara v predchádzajúcom príklade: Počujeme špecifický zvuk začínajúci vľavo (nie je to už tón, ide o "ruch"), ktorý má stúpajúci charakter a pred nami začne klesať.
  • Kruh ležiaci na stole pred nami: Počujeme skoro tón viac vľavo ako v strede, postupne sa "rozširuje" na šum (k tónu sa pridáva množstvo ďalších klesajúcich aj stúpajúcich), po vrchole začnú tóny ubúdať a nakoniec zostane jeden.
  • Vertikálna čiara pred nami: počujeme jedno kliknutie (nie tón, pretože vidíme množstvo "bodiek" nad sebou)
  • Tmavý obdĺžnik, orámovaný bielou čiarou leží pred nami zľava doprava: počujeme klik vľavo, hneď po ňom 2 dlhé mierne zašumené konštantné tóny rôznej výšky prechádzajú popred nás a napokon opäť klik vpravo (šum pod čiarami hovorí, že sa medzi nimi nachádza niečo tmavé homogénne).

Predpokladám, že vyššie opísané príklady nie je úplne jednoduché si predstaviť, všetky si však možno vypočuť v tréningovom materiály, ktorý možno nájsť na stránke projektu. Autor v nich postupne vysvetľuje vyššie opísané parametre kódovania zvuku, každý uvedený príklad si možno rovno vypočuť. Detailne opisuje ako trénovať koordináciu kamery a ruky, teda trénovanie odhadovania, kde pred nami sa nachádza objekt, ktorý počujeme na obrázku. Vysvetľuje ako zo zvukov určovať vzdialenosť a veľkosť objektov ktoré vidíme, text ilustruje zvukovými obrázkami počítačovej klávesnice ležiacej na stole, na ktorú sa pozeráme z diaľky, z blízka, prípadne zľava či sprava. Napríklad na pohľade zľava pekne počuť, ako vyzerajú klávesy, ktoré sú bližšie k nám (tie na ľavej strane klávesnice) väčšie, ako klávesy ktoré sú od nás viac vzdialené. Text obsahuje aj niekoľko praktických príkladov využitia pri orientácii v exteriéroch. Napríklad tipy ako používať veľké objekty v diaľke na udržiavanie smeru, prípadne ako je možné v kombinácii s kamerou na okuliaroch detegovať jamy či nízke prekážky, alebo prekážky v oblasti tváre.

Špeciálne by som chcel upozorniť na tréningový plán, obsahujúci stručné inštrukcie, ktoré by mohli zaujať používateľov ochotných venovať rok alebo viac času poctivému tréningu a následne túto pomôcku používať v každodennom živote. Autor považuje za reálne dosiahnuť úroveň, pri ktorej by ste mali zvládnuť nasledujúce úlohy:

  1. Na stôl pohoďte 2 svetlé predmety a po troch vypočutých obrázkoch ich nájdite systémom položte ruky priamo na ne, bez hmatania po stole
  2. V známom prostredí by ste mali byt schopní sa pohybovať bez kontaktu s predmetmi, obchádzať prekážky, identifikovať vzdialenosť od predmetov, prípadne pristúpiť ku konkrétnej veci a dotknúť sa jej na vopred určenom mieste (napríklad položiť ruku na hranu objektu).
  3. V známej miestnosti dokážete pristúpiť k vopred plánovanému objektu, zastaviť sa pred ním tak, aby bol v dosahu vašej ruky a dotknúť sa konkrétneho bodu. Cieľový objekt môže byť obraz na stene vzdialenej od vás, alebo veraje dverí na druhej strane miestnosti.
  4. Postavte sa doprostred známej miestnosti, niekoľko krát sa zatočte a následne sa zorientujte len pomocou počúvania obrázkov.
  5. Na tmavý koberec pohoďte kľúče a nájdite ich bez nutnosti hmatať po zemi.

Zaujímavé? Ak áno, tak sú linky nižšie určené aj pre vás. Texty sú žiaľ len v Angličtine, verím však, že Google translate, alebo služba www.deepl.com vám postačia na to, aby ste sa v nich zorientovali.