Článek v prestižním časopise IEEE Transactions on Signal Processing, který vyšel vloni na jaře pod názvem „Dynamic Independent Component/ /Vector Analysis: Time-Variant Linear Mixtures Separable by Time-Invariant Beamformers“, vzbudil pozornost ve vědeckém světě — především v oblasti zpracování signálů. Vědecký tým Fakulty mechatroniky, informatiky a mezioborových studií Technické univerzity v Liberci (FM TUL) v něm zveřejnil obdivuhodný výsledek svého mnohaletého základního výzkumu: nový algoritmus pro tzv. analýzu nezávislých komponent (ICA — independent component analysis). „Zvládli jsme dva těžké úkoly: Navrhli jsme nové rozšíření metodiky a odvodili pro to i účinný algoritmus. Na rozdíl od zavedených postupů dokáže naše metodika separovat nejen statické, ale i pohyblivé zdroje signálu. Praktické použití bude velmi široké, protože je vše postaveno na obecném matematickém modelu, který má širokou platnost,“ říká vedoucí pětičlenného výzkumného týmu prof. Zbyněk Koldovský z Ústavu informačních technologií a elektroniky FM TUL.
Podstata ICA je v separaci signálů
Výpočetní metoda analýzy nezávislých komponent se používá od 90. let minulého století. Pomocí ní lze teoreticky rozdělit směs signálů na jednotlivé, dílčí. „V prostoru nejčastěji naměříme směsice signálů, spolu s měřenými signály snímáme i nechtěný šum. Měříme-li několika senzory, pak za určitých technických podmínek, kdy směs musí být lineární a takzvaně deterministická, dokážeme dílčí signály oddělit, aniž bychom o nich dopředu měli nějaké doplňující informace,“ vysvětluje podstatu ICA prof. Koldovský.
Separované signály musí být statisticky nezávislé
Snímáme-li skupinu současně mluvících lidí (tato situace je často nazývána jako „koktejlová party“) a je-li přítomen i hluk prostředí, naměříme pouze nesrozumitelnou „změť“ zvuků. Pomocí ICA ji lze rozložit na jednotlivé signály, tedy v praxi například vyseparovat jednotlivé řečníky. Rozklad probíhá na základě matematické hypotézy, která předpokládá, že původní signály jsou statisticky nezávislé. „ICA dokáže tato měření rozložit na dílčí signály čistě na základě matematického modelu, takže k tomu nepotřebuje žádnou další významnou informaci. To je velice důležité, protože my často žádné další informace než měření k dispozici nemáme,“ uvádí člen výzkumného týmu Ing. Jiří Málek, Ph.D. Situace, kdy současně mluví několik řečníků, každý za sebe, dokonale splňuje předpoklad statistické nezávislosti dílčích signálů. Mírně závislé by mohly být, pokud by třeba dva lidé zpívali jednu písničku. I když podle Jiřího Málka by i tady závislost, vzhledem k nezávisle se chvějícím hlasivkám jako zdroji signálu, byla poměrně slabá. „Základním principem je nezávislost procesů, při nichž signály vznikají. Jako příklad mohu uvézt hluk z ulice pronikající do místnosti, kde hučí klimatizace a mluví nějaká osoba. Za určitých podmínek můžeme od sebe tyto tři dílčí signály oddělit,“ konstatuje dr. Málek s tím, že ICA je aplikovatelná kromě zvuku i na jiná data. Například na biologická, jako jsou EKG či EEG, geoseizmická, chemometrická nebo astrofyzikální data.
Analýza mozkové aktivity pomocí magnetické rezonance
Podle dalšího člena týmu Ing. Jaroslava Čmejly je ICA schopná separovat i signály z různých aktivit mozku. Výzkum, kdy se pomocí ICA analyzují data dynamické magnetické rezonance pro sledování aktivity mozku, trvá zhruba 20 let. Třírozměrné video, které se snímáním získá, lze rozložit na oblasti s nezávislou aktivitou. „Mozek řeší mnoho různých úloh a jednotlivé části mozku fungují nezávisle, jako když při koktejlové party hovoří několik lidí. Vlastně jde o elektromagnetické vlny generované různými částmi mozku. Tyto aktivity můžeme detekovat, zobrazit, lokalizovat, vizualizovat a měřit jejich funkční konektivitu. Na vědecké úrovni se již podařilo prokázat, že pomocí této analýzy se dají vypočítat markery, pomocí nichž jde rozlišit zdravý mozek od mozku pacienta trpícího schizofrenií,“ říká Jaroslav Čmejla. U pokročilejších technologií by se podle něj mohlo zjistit, že nějaká část mozku je aktivnější, a odborník by pak mohl diagnostikovat, zda nejde o patologickou změnu.
Známé standardní metody rozšířili v Liberci na pohyblivé zdroje
Standardní metoda ICA při snímání signálů předpokládá, že se zdroje nehýbají, například u koktejlové party všichni sedí u stolu. Liberečtí vědci po mnohaletém bádání stávající metodu ICA významně rozšířili o pohyblivé zdroje signálů, například když se skupina hovořících lidí pohybuje po místnosti. Matematický model zobecnili, přidali parametry a objevili nový algoritmus. „Parametr, který určuje polohu zdroje, jsme rozložili tak, že v krátkých časových úsecích může mít jinou hodnotu. Tím máme jednu sadu parametrů měnících se v čase a druhou pro samotnou separaci, která se ovšem v čase nemění,“ říká Zbyněk Koldovský. Připomíná, že jde o teoretický problém, kde se zatím nehovoří o konkrétních podmínkách, jako je třeba velikost prostoru, ve kterém se zdroje signálů pohybují. „V teoretické rovině to jsou prostě jen parametry, takže s nadsázkou mohu tvrdit, že neexistuje žádné omezení. V praxi by však záleželo na řadě konkrétních aspektů, kterým by se konkrétní aplikace musela přizpůsobit,“ konstatuje.
Rýsují se konkrétní aplikace
Metoda objevená v Liberci je podle prof. Koldovského úlohou, kterou vědci řeší už velmi dlouho a ještě dlouho řešit budou. Na FM TUL se v současné době zaměřují na to, aby extrahovali konkrétního řečníka v pohybu, do budoucna se však rýsuje řada zajímavých aplikací. Metoda může vylepšit hlasovou komunikaci například v call centrech, kde by se díky ní komunikující osoby slyšely čistěji i přes silný okolní hluk a přeslechy jiných hovorů. Je možné si představit také „vyčištění“ okolního hluku při telefonování v hlučném prostředí, třeba ve výrobní hale. Srozumitelnější a čistější budou informace při on-line konferencích a podobně. „Z vědeckého hlediska se rýsuje hodně aplikací, protože tím, že metoda je abstraktní, tak se může uplatnit vlastně kdekoliv, kde se jedná o měření. Tedy třeba i při měření technických vibrací. Například když se ve stroji poškodí ložisko, uslyšíme hluk, ale nevíme, odkud přichází. Touto metodou je možné teoreticky zdroj hluku lokalizovat a tím poměrně rychle zjistit, kde je porucha. Nová metoda může pomoci ‚vyčistit‘ signál při vyšetřování srdečního rytmu na EKG holteru, kdy je signál rušen například displejem generujícím elektromagnetický ruch. Analýza nezávislých komponent dokáže signály rozložit na ty, které vznikají činností srdce, a na ty ostatní. EKG lze díky tomu zrekonstruovat jen ze signálů srdeční aktivity a tím z něj odstranit nechtěná rušení,“ vypočítává další možné aplikace profesor Koldovský s tím, že to, co už funguje v laboratorním prostředí, by se nyní díky novému algoritmu mohlo rozšířit do běžného života. Například pacient, který má nainstalovaný zátěžový přístroj (holter), se pohybuje a podmínky pro snímání signálů jsou tedy dynamické. Zatímco standardní metody jsou schopné analyzovat jen krátký časový úsek dat, ve kterém se zaregistruje jen malá změna, a proto se získají menší počet dat, nová metoda, která dynamiku připouští, dokáže sledovat potřebná data i v delším časovém úseku včetně případných změn.
Nové možnosti i při výzkumu vesmíru
Standardní metody se používají i ke zpracování dat při výzkumu vesmíru, kupř. při mapování intenzity reliktního záření. [Mikrovlnné reliktní záření pozadí vesmíru je pozůstatkem po velkém třesku. Tepelné spektrum reliktního záření, které má vlnovou délku 0,6 mm až 50 cm (frekvence 108 až 1012 Hz), odpovídá záření absolutně černého tělesa o teplotě asi 2,7 K s maximem na vlnové délce asi 2 mm — pozn. red.] Analýza nezávislých komponent byla základem metody, která byla použita k odstínění mikrovlnného záření Mléčné dráhy a jiných galaxií z dat, jež naměřila evropská sonda Planck. „Problém je v tom, že v mikrovlnném pásmu reliktního záření je obsaženo rušení vlivem aktivity hvězd a mezihvězdného prachu z naší vlastní galaxie. Pokud chceme zobrazit pouze reliktní záření, potřebujeme všechnu ostatní aktivitu odstranit. A máme tady podobný problém, jako když chceme extrahovat jednoho konkrétního řečníka ze skupiny hovořících lidí: jeden mluví z galaxie a další hlasy přicházejí z okolního vesmíru,“ uvádí jako názorný příklad pro možné použití nového algoritmu ICA Jaroslav Čmejla.
Zájem o mezinárodní spolupráci
Pro ověřování metody vyvinul tým v Ústavu Informačních technologií a elektroniky FM TUL software v programovacím jazyce Matlab a kód algoritmu zveřejnil na svých stránkách asap.ite.tul.cz/downloads/ice/. V současné době se výzkum na FM TUL zaměřuje na nový způsob zpracování záznamů z dynamické magnetické rezonance. Možné aplikace sice nejsou dotažené až do komerční fáze, ale základ v podobě proof-of-conceptu [realizace myšlenky za účelem demonstrování její proveditelnosti — pozn. red.] již liberečtí vědci mají. I proto se rýsuje společný projekt s americkými kolegy. „Jednali jsme s prof. Tülay Adaliovou z univerzity v Baltimoru a s prof. Vincentem Calhounem, který řídí centrum TRENDS (Translational Research in Neuroimaging and Data Science) na Georgia State University. Věříme, že se spolupráce podaří a pokročíme v našem výzkumu zase dále,“ konstatuje prof. Koldovský
Dočkáme se praktických aplikací?
Zda a jak se začne nový algoritmus používat v praxi i v aplikacích mimo svět základního výzkumu, záleží podle prof. Koldovského na tom, jak ho uchopí další vědecké týmy, případně firmy. „To si ale vyžádá vysoký stupeň interdisciplinarity. Aby někdo pronikl do takto složitého algoritmu a ještě pochopil, jaký má potenciál pro konkrétní oblast, to bez spolupráce různých oborů nepůjde. Snažíme se jít zájemcům o tuto problematiku naproti. Pokud nám pošlou data, tak je zpracujeme a pošleme jim výsledky analýzy. Pak už bude záležet na našich partnerech, zda pro ně najdou vhodnou aplikaci. My nyní vyvíjíme aplikace hlavně v oblasti zpracování řeči, ale vidíme šanci na proniknutí i do jiných oblastí,“ říká profesor Koldovský s tím, že on i jeho kolegové jsou připraveni s aplikačními týmy spolupracovat a dát jim k dispozici svůj algoritmus jako základ, na kterém mohou stavět svůj vlastní výzkum. /Jaroslava Kočárková/