Die Technologie funktioniere auf der Grundlage künstlicher neuronaler Netze. Die künstliche Intelligenz analysiere ein Video, filtere verschieden Tonspuren heraus und könne bedarfsweise die Nebentöne dämpfen, so „Android Authority“.
Das mache es zum Beispiel möglich, eine bestimmte Stimme aus einer Menschenmenge aufzunehmen. Das künstliche neuronale Netz „beobachte“ das Tonobjekt, untersuche die Lippenbewegungen und die Gesichtsmimik (falls es ein Mensch ist) und „schneide“ die Störgeräusche ab, schrieb das Portal.
Um es dem künstlichen neuronalen Netz zu ermöglichen, die Tonquelle zu bestimmen, seien darin rund 100.000 YouTube-Videos von insgesamt 2000 Stunden heruntergeladen worden. So habe das System untersucht, wie die Menschen sprechen, und die Eigenschaften ihrer Mimik für sich vermerkt. Diese Technologie kann laut Google in verschieden Bereichen Anwendung finden, zum Beispiel im Fernsehen oder bei der Entwicklung von Hörgeräten.
sputniknews
Tags: