Schopnost vědců zkoumat aktivitu lidského mozku se v posledních desetiletích výrazně zlepšila, a to hlavně díky technologiím brain-computer interface (BCI). Toto rozhraní umožňuje propojení mozku s počítačem, čímž dokáže odhalit naše myšlenky a záměry. Nejpůsobivější výsledky každopádně zatím přinesla invazivní zařízení s elektrodami implantovanými přímo do mozkové kůry. Ty zaznamenávají signály, které následně interpretuje umělá inteligence.
Tato technologie už umožnila dekódovat celé věty z nervové aktivity s přesností 97 procent. Dokáže také přepsat naše myšlenky do textu rychleji, než kdybychom je napsali sami. Ale nutnost implantovat elektrody dovnitř hlavy má zjevné nevýhody, což znamená, že takové rizikové postupy jsou z lékařského hlediska ospravedlnitelné pouze u pacientů, kteří vyžadují záznam mozku pro řešení závažných zdravotních problémů, jako je třeba epilepsie. Neurální sondy navíc časem degradují, kvůli čemuž je nutná jejich pravidelná výměna.
Nejúčinnější je magnetoencefalografie
V Divizi umělé inteligence společnosti Meta vlastněné Markem Zuckerbergem se rozhodli prozkoumat, zda by mohli dosáhnout podobných cílů i bez nebezpečné operace. Vyvinuli proto systém, který dokáže zjistit, jaká slova člověk poslouchá. Zvládne to přitom pouze na základě mozkové aktivity zaznamenané pomocí rozhraní BCI.
„Našim cílem bylo vytvoření umělé inteligence schopné dekódovat reakci mozku na mluvené příběhy, a to bez použití invazivních metod,“ řekl pro Time Jean Remi King, výzkumník z laboratoře Facebook Artificial Intelligence Research (FAIR).
Vědci nejprve testovali čtyři soubory údajů od 169 lidí, které byly shromážděny při poslechu zvukových nahrávek řeči. Zaznamenávali je pomocí magnetoencefalografie (MEG) nebo elektroencefalografie (EEG), což jsou metody používající různé druhy senzorů k zachycení elektrické aktivity mozku z vnějšku lebky. Zvuková data i data z mozku se následně rozdělila do třísekundových úryvků, mezi nimiž neuronové sítě hledaly vzorce, které by je mohly spojit.
Po dlouhém tréninku pak vědci účinnost nové technologie vyzkoušeli. Systém si vedl nejlépe na jednom z datových sad MEG, kde dosáhl přesnosti 72,5 procenta v Top 10. To znamená, že když umělá inteligence sestavila seznam 10 nejpravděpodobnějších slov, správné slovo mezi nimi bylo v 72,5 procenta případů.
Ačkoliv to možná na první pohled nezní až tak impozantně, je důležité si uvědomit, že systém vybíral celkem ze 793 slov. Na druhém datovém souboru MEG byla úspěšnost 67,2 procenta, zatímco u dat z EEG byly výsledky o poznání horší – určit správná slova se podařilo pouze ve 31,4, respektive 19,1 procenta případů.
Konkurence sází na invazivní metody
Je zřejmé, že popsaná technologie je stále ještě daleko od praktického používání, i tak ovšem výsledky ukazují významný pokrok. Nevýhodou neinvazivních BCI každopádně zůstává mnohem horší poměr signálu k šumu, takže dešifrování nervové aktivity tímto způsobem je náročné. Myslí si to ostatně i Thomas Knopfel z Imperial College London, podle něhož se dá snaha zkoumat myšlenky pomocí popsaných neinvazivních přístupů přirovnat k „pokusům streamovat HD film přes staré analogové telefonní modemy“, jak sdělil webu New Scientist.
Podle Knopfela tyto metody dostatečné přesnosti nikdy nedosáhnou, přičemž podobné názory sdílí také někteří další vědci. Například společnost Neuralink Elona Muska proto raději sází na to, že lidé přeci jen překonají odpor k invazivním přístupům a mozkové implantáty si nakonec voperovat nechají.
Ostatně, i výzkumníci z Mety přiznávají, že jejich umělá inteligence je teprve na svém počátku a existuje spousta prostoru pro zlepšení. Věří každopádně, že pokud se problém se šumem, třeba i přes prvotní neúspěchy, odstranit povede, může dané řešení výrazně pomoci například v komunikaci s pacienty, kteří ztratili schopnost mluvit.